thai

กำขี้ดีกว่ากำตด

in

สำนวนสุภาษิตคำพังเพยไทยนี่ก็ช่างน่าฉงน สำนวนบางสำนวน(ซึ่งอาจจะเป็น สุภาษิต หรือคำพังเพยก็แล้วแต่) ถึงแม้ว่าเราจะรู้ความหมายดี แต่พอมาคิดความหมายแบบตามตัวแล้ว ความหมายมันก็ออกจะจั๊กกะจี้ซักหน่อยจนพาลให้อดคิดต่อไปถึงสิ่งที่น่าสงสัยอย่างที่มาหรือต้นเหตุของสำนวนเหล่านั้นไม่ได้ อย่างเช่นสำนวนต่อไปนี้ซึ่งอาจจะเหม็นและไม่สุภาพซักเล็กน้อย ขอท่านผู้อ่านโปรดอภัย

กำขี้ ดีกว่า กำตด

สำนวนนี้ยังไม่ทันอ่านก็เหม็นซะแล้ว มีทั้งขี้และมีทั้งตด ถ้านำพจนานุกรมมาเปิดจะได้ความหมายของสำนวนนี้ว่า

กำขี้ดีกว่ากำตด
คำแปล2
(สว.) ได้อะไรๆ บ้างดีกว่าไม่ได้อะไรเลย.

ก็ตรงตัวนะฮะ ว่าการที่เรา”กำขี้” อย่างน้อยก็ได้เห็นอะไรที่เป็นชิ้นเป็นอัน เป็นก้อน หรืออย่างน้อยก็ยังมีคราบหลักฐานให้เราได้พอจะชื่นใจซักเล็กน้อย ซึ่งดีกว่า “กำตด” ซึ่งเวลาผ่านไปแล้วก็จะเหมือนไม่มีอะไรเกิดขึ้น ถ้า้คนทนกลิ่นไม่ไหวไม่ตะโกนถามว่า “ใครตดวะ” ขึ้นมาซะก่อน

แต่ปัญหาคือ ไอ้ที่กำนั่นน่ะ มันของใคร ของคนข้างๆ ของเพื่อน ของไอ้ซูกัสหมาข้างบ้านรึเปล่า หรือว่าหมายถึงของเราเอง แต่จะเป็นของใครก็ช่าง เพราะปัญหามันกลับกลายเป็นว่า กำขี้น่ะดีกว่ากำตดจริงหรือ?

ทีนี้ลองสมมติใหม่ว่า ถ้า้เราต้องเลือกระหว่าง กำขี้กับกำตด เราจะเลือกกำอะไร นี่สิ เราจะเริ่มสงสัยว่า แล้วถ้าให้ไอ้คนคิดมันเืลือกกำ เขาจะกำอะไร แล้วทำไมเขาถึงบอกว่า กำขี้ดีกว่ากำตด ปัญหานี้เป็นสิ่งที่น่านำไปขบคิดต่อยามว่างในห้องน้ำนักเชียว

ปล. เปิดรับความคิดเห็นเรื่องสำนวนนี้ และที่มา แบบไม่จำกัด

ภาษาไทยกับ Silverlight

in

หลังจากที่ Silverlight 1.0 ออกมาแล้ว 11 เดือนก็ยังไม่ได้เคยลองเอามาใช้แบบจริงๆจังๆซักที จะมีลองเล่นๆก็คือตอน BarCamp ครั้งนู้น แต่ว่าช่วงนี้ได้งานมางานหนึ่งซึ่งต้องใช้ Silverlight 1.0 ในการพัฒนาเลยได้ลองใช้ของจริงเลย

ปัญหาอย่างหนึ่งที่พบตั้งแต่เมื่อ 11 เดือนก่อนแล้วไม่คิดว่ามันจะแก้ไขได้ง่ายแบบนี้คือเรื่องการแสดงผลภาษาไทย

Thai sentences segmentation

in

คุณวีร์คิดได้เสนอความคิดว่า หลายๆภาษามีสัญลักษณ์หรือตัวอักษรที่บ่งบอกจุดสิ้นสุดของประโยคอยู่ภายในตัวภาษา เช่นภาษาอังกฤษที่มีเครื่องหมายจุดฟูลสต็อปเป็นเครื่องหมายบอกจุดสิ้นสุดประโยค แต่สำหรับภาษาไทยที่ไม่มีสัญลักษณ์นี้ ถ้าเราให้ผู้อ่านแต่ละคนทดลองทำการตัดประโยคโดยการเพิ่มตัวอักษรพิเศษเช่นฟูลสต็อปเข้าไป ผลลัพธ์ที่ได้จากการตัดประโยคของผู้อ่านแต่ละคนอาจจะได้ผลลัพธ์ที่ต่างกัน

จากความคิดของผม สาเหตุที่เกิดความแตกต่างกันเพราะธรรมชาติของภาษาไทยเป็นภาษาที่ค่อนข้างอิสระ การตัดประโยคเกิดจากความรู้สึกและสัญชาตญาณมากกว่าจะเกิดขึ้นจากกฏเกณฑ์ ผลที่ได้จึงแตกต่างกันตามสภาพแวดล้อม ความเชี่ยวชาญ และความรู้ของผู้ตัดประโยคแต่ละคนว่าทำให้เกิดหลักเกณฑ์ในการตัดประโยคอย่างไร

จากการทดลองอ่านข้อความที่ถูกตัดประโยคแล้วพบว่า ความเร็วในการอ่านโดยรวม และความต่อเนื่องในการอ่านในแต่ละประโยคนั้นลดลงอย่างเห็นได้ชัด เวลาอ่านไม่รู้สึกไหลลื่นเหมือนอ่านข้อความปกติ

ผมถามเพื่อนว่าภาษาเขมรมีตัวแบ่งประโยคหรือเปล่า. เขาก็ว่ามี. ถามมาหลายคนหลายภาษาแล้ว. เขาก็ว่ามีหมด. ลองดูในวิกิพีเดียลาว ก็ปรากฎว่ามีตัวแบ่งประโยคเช่นกัน. จำได้ว่าป๋าเทพเคยกล่าวถึงว่าอาจจะใช้ ๛ (โคมูตร) มาเป็นตัวจบประโยคดูก็ได้ แต่ว่าแหมมันกดยากเหมือนกัน.

นักภาษาศาสตร์บางท่านชี้ว่า, ภาษาไทยอาจจะไม่มีขอบเขตประโยคที่แน่นอน. ให้คนไทยด้วยกันเองลองแบ่งประโยคออกมา, ก็อาจจะไม่ตรงกัน. ผมออกจะเชื่อตามนั้น. แต่ว่ากันยังอยากจะลองเองอยู่ดีว่า, ถ้าลองแบ่งประโยคดูแล้วจะเป็นอย่างไร.

จาก ชิลๆ 

เวลาที่ผมอ่าน ทุกครั้งที่เจอกับเครื่องหมายแบ่งประโยค ซึ่งในที่นี้คือ ลูกน้ำและจุด จะเว้นหายใจอยู่ประมาณ 1 วินาทีก่อนจะอ่านประโยคถัดไป เวลาอ่านเลยรู้สึกว่าเหนื่อยกว่าปกติมากๆ เพราะแบ่งช่วงหายใจถี่ สาเหตุก็คงจะเป็นเพราะไม่เคยชินกับภาษาไทยแบบนี้ แต่เคยชินกับการหยุดหายใจเมื่อใช้เครื่องหมายลูกน้ำซึ่งใช้เพื่อแจกแจงสมาชิกมากกว่า

ตอนนี้ยังไม่ได้ลองเอาไปคิดดูว่าถ้าตัดประโยคได้แล้วจะนำไปใช้อะไรได้บ้าง แต่คิดว่ามันน่าจะมีประโยชน์แน่ๆ อย่างน้อยก็น่าจะเป็นพวก Data Visualization เพื่อวิเคราะห์รูปแบบประโยคในงานประพันธ์ต่างๆ หรือไม่ก็เอาไปช่วยในงาน Natural Language Processing ได้ล่ะมั้ง