
ที่ออกมา ไม่ว่าจะเป็น ChatGPT, Bing, Bard, Claude ตอนนี้ก็ล้วนแต่ใช้ภาษาไทยได้หมดแล้ว และล้วนแต่สนับสนุนภาษาหลักๆ ของโลกทั้งหมดแล้วเช่นกัน แต่ชาติต่างๆ ก็ยังต้องมีการพัฒนา AI ของตัวเองขึ้นมา ไม่ว่าจะเป็นการต่อยอดจาก open-source หรือคิดใหม่ทำใหม่หมดเลย ที่ดูคร่าวๆ แล้วก็น่าจะเพราะเหตุผลง่ายๆ สองข้อหลักๆ คือ ความเร็ว (speed) และความเชี่ยวชาญ (proficiency) ในการใช้ภาษานั้นๆ กับเรื่องของการ bias หรือให้คำตอบที่ไม่เป็นกลาง
เรื่องแรกความเร็วและความเชี่ยวชาญทในภาษานี้ก็คือ ถ้า AI ถูกฝึกฝนหรือ train ด้วยข้อมูลภาษาไหนมาก มันก็จะเข้าใจและสามารถใช้ภาษานั้นๆ ได้อย่างถูกต้องและสละสลวย และที่สำคัญคือ “เร็ว” กว่าอย่างเห็นได้ชัด ตัวอย่างเช่นตอนนี้ OpenThaiGPT 1.0.0 ที่หลายๆ ฝ่ายในเมืองไทยช่วยกันทำ และเพิ่งถูกปล่อยออกมาให้ทดลองใช้กัน สามารถทำงานกับภาษาไทยได้เร็วกว่า ChatGPT ในระดับหลายสิบเท่า ตอนแรกโครงการนี้ใช้ตัว AI หรือ Language Model เป็น GPT-2 ที่ทาง OpenAI เคยปล่อยเป็น open-source เมื่อหลายปีก่อน (2019) มาพัฒนาต่อ แต่ล่าสุดได้เปลี่ยนมาใช้ Llama 2 ของทาง Meta (Facebook) ที่เพิ่งปล่อยออกมาในปีนี้แทน ซึ่งได้ข้อมูลภาษาไทยจากหลายๆ หน่วยงานเข้าไปช่วย โดยเฉพาะอย่างยิ่งจากเว็บพันทิป ทำให้ตอนนี้สามารถทำงานกับข้อมูลภาษาไทยได้เร็วขึ้นกว่าเดิม (ข้อมูลทางเทคนิคเชิงลึกจากทีมงานบอกว่าเพราะเปลี่ยน token ภาษาไทยจากระดับ character เป็นระดับ word ได้) จนสามารถนำไปต่อยอดกับงานต่างๆ เช่น การอ่านข้อมูลภาษาไทยจากภาพ (OCR) และอื่นๆ อีกมาก ดังนั้นอาจคาดการณ์ได้ว่า AI ที่ถูก train ด้วยภาษาอื่นๆ ที่ไม่ใช่ภาษาอังกฤษมากพอก็น่าจะสามารถทำงานกับภาษานั้นๆ ได้เร็วขึ้นมากเช่นเดียวกัน
เรื่องที่สองคือการไบแอส (bias) เนื่องจากข้อมูลส่วนมากที่ใช้เทรน AI เดิมนั้นเป็นภาษาอังกฤษ จึงทำให้ AI รับเอาค่านิยมต่างๆ ในแบบตะวันตกที่ปรากฏอยู่ในข้อมูลเหล่านั้นเข้าไปด้วยอย่างเลี่ยงได้ยาก ไม่ว่าจะเป็นในวรรณกรรมหรือข้อเท็จจริงต่างๆ ก็ตาม ดังนั้นคำตอบที่ได้จาก AI เหล่านี้จึงมีแนวโน้มที่จะให้คำตอบซึ่งเอนเอียงไปตามค่านิยมเหล่านั้น ไม่ว่าจะเป็นเรื่องความเท่าเทียมกันในเรื่องต่างๆ เสรีภาพในการแสดงความคิดเห็น และอื่นๆ หรืออาจจะรวมถึงวัฒนธรรม จริยธรรม และ soft power ต่างๆ ที่ปรากฏหรือแฝงอยู่ในข้อมูลเข้าไปด้วยก็ได้ เรื่องนี้ถ้าเป็นชาติใหญ่ที่ไม่ได้ใช้ภาษาอังกฤษ หรือยึดค่านิยมตามแบบตะวันตก ก็คงจะเป็นเรื่องที่ไม่ค่อยถูกใจรัฐบาลนัก หรืออาจจะถึงขั้นรับไม่ได้เลยด้วยซ้ำ ดังนั้นทางเลือกเดียวก็คือต้องมี AI ของตัวเองขึ้นมาให้ได้ ไม่ว่าจะต้องทุ่มเททรัพยากรมากมายเท่าไหร่ก็ตาม เพื่อให้ได้ AI ที่สามารถตอบสนองต่อบริบททางวัฒนธรรมหรือค่านิยมที่แตกต่างออกไป และที่สำคัญคือต้องไม่ขัดแย้งกับความเห็นของรัฐด้วย
ด้วยเหตุนี้ในอนาคตอันใกล้เราคงได้เห็น AI โดยเฉพาะอย่างยิ่ง Language Model ที่พัฒนาขึ้นมาโดยชาติมหาอำนาจอื่นๆ มากขึ้น ซึ่งน่าจะสนับสนุนการใช้งานหลายๆ ภาษา และอาจรวมทั้งภาษาไทยด้วย ขึ้นกับว่าเรามีข้อมูลภาษาไทยแพร่หลายให้คนอื่นเอาไปเทรนมากน้อยแค่ไหน และชาติผู้พัฒนา AI เหล่านั้นมีผลประโยชน์หรือส่วนได้เสียกับการสนับสนุนภาษาไทยมากน้อยแค่ไหน เพราะค่าใช้จ่ายในการพัฒนา AI นั้นแพงเอาเรื่องทั้งฮาร์ดแวร์ ซอฟต์แวร์ และค่าแรงคนทำ
สุดท้ายแล้วก็อยู่ที่เงินนั่นแหละว่ามีมั้ย
แต่ที่จริงมีของไทยใช้เองเป็นทางเลือกไว้ก่อนก็เป็นวิธีที่น่าจะดีที่สุดในตอนนี้ ว่าแล้วก็ชักชวนให้ติดตามผลงานของคนไทย คือ OpenThaiGPT กันดูนะครับ ซึ่งจะเอามาเล่าให้ฟังเพิ่มในคราวต่อๆ ไปว่าใช้ทำอะไรยังไงได้บ้าง

