แม้ว่าโมเดล AI ส่วนใหญ่มักมีรากฐานจากโลกตะวันตก แต่ SCB 10X กำลังเร่งพลิกเกมด้วยการพัฒนา AI ที่มุ่งเน้นภาษาถิ่นเฉพาะกลุ่มในประเทศไทย โดยชี้ให้เห็นถึงโอกาสทางธุรกิจและสังคมมหาศาลจากประชากรผู้ใช้กว่า 20 ล้านคน
คุณัชญ์ พิพัฒนกุล lead AI Scientist SCB 10x กล่าวว่า โครงการ “TYPHOON เฮ็ดให้ AI ใจอีสาน” ภายใต้โครงการ Typhoon Isan คือความพยายามของ SCB 10X ในการสร้างสรรค์โมเดล AI ที่รองรับภาษาอีสาน เพื่อสืบสานเอกลักษณ์และใช้ประโยชน์จากศักยภาพทางเศรษฐกิจของภูมิภาคนี้
ทั้งนี้ ในปัจจุบันมีผู้ให้ความสนใจโครงการดังกล่าวอย่างแพร่หลาย โดยมียอดดาวน์โหลดโมเดลแล้ว 6.5 ล้านครั้ง มียูสเซอร์มากกว่า 1.9 หมื่นคน
นอกจากนี้ ในระหว่าง 2 ปีที่ผ่านมา Typhoon ยังได้ปล่อยโมเดลออกมามากมาย เช่น โมเดลแปลงเสียงคำพูดให้กลายเป็นตัวอักษร (ASR) โมเดลที่ดึงข้อมูลจากเอกสารที่สแกนไฟล์ภาพ หรือข้อความที่เขียนด้วยลายมือ (OCR)
คุณัชญ์ ย้ำว่า ภาษาถิ่นไม่ใช่เรื่องใหม่ โดยมีงานวิจัยที่สรุปว่า ภาษาถิ่นสามารถเข้าถึงการสื่อสารของคนได้มากกว่าภาษากลางด้วย คนอีสานนับเป็นคนส่วนใหญ่ราว 20 ล้านคน ซึ่งมีประชากรทั้งหมดมากกว่า 1 ใน 3 ของประเทศไทย
อีกทั้งภาคอีสานสามารถสร้างมูลค่า GDP รวมกว่า 1.8 แสนล้านบาท หรือประมาณ 10% ของมูลค่าเศรษฐกิจไทย จึงเป็นเหตุผลว่า ทีม Typhoon ได้เลือกภาษาอีสานเป็นภาษาถิ่นแรกในการผลักดันเทคโนโลยี AI
ด้าน อดิศัย ณ ถลาง senior linguist SCB 10X กล่าวถึงกระบวนการสร้าง AI ภาษาถิ่นว่า ภาษาอีสานแต่ละที่ใช้ไม่เหมือนกัน ทำให้ต้องจัดแจงการทำงานของภาษาไว้ ดังนี้
1.การกำหนดนิยามภาษาอีสาน โดยจำแนกสำเนียงต่างๆ ในถิ่นอีสาน และหาลักษณะสำคัญที่มีร่วมกันอย่างกว้างขวาง เพื่อให้ได้สำเนียงที่มีความครอบคลุม
2.สร้างระบบสะกดคำ จะกำหนดอักขระและวิธีการสะกดคำที่มีหลักเกณฑ์ชัดเจน เป็นระบบ แต่ยังคงเป็นไปตามสัญชาตญาณของเจ้าของภาษา
3.สร้างวิธีเก็บข้อมูลเสียงพูด คือ บันทึกเสียงพูดแบบสนทนาจากเจ้าของภาษา ให้พูดออกมาอย่างเป็นธรรมชาติ ไม่ชี้นำด้วยการอ่าน เช่น การตอบคำถาม บรรยายหรือตอบคำถามจากภาพ
4.สร้างกระบวนการกำกับข้อมูล เพื่อให้ได้ชุดข้อมูลที่มีคุณภาพสูง การกำกับข้อมูลมีความสม่ำเสมอ

ด้าน วริทธิ์ ศิริโชติดำรงค์ Research Scientist SCB 10X กล่าวว่า สำหรับภาษาถิ่นอีสาน Typhoon ปล่อยออกมาทั้งหมด 2 โมเดล ได้แก่ Typhoon Isan ASR Real time เป็นโมเดลโอเพนซอร์สไซส์เล็ก และใช้ทรัพยากรต่ำ แต่สามารถถอดเสียงภาษาอีสานออกมาเป็นข้อความได้อย่างแม่นยำ เหมาะกับงานถอดเสียงสด เช่น ระบบ Voice AI Agent ที่ต้องการตอบโต้ทันที หรือระบบ Live Captions โดยจะรองรับทั้งเสียงอีสานและเสียงไทยกลาง
ส่วน Typhoon Isan ASR Whisper เป็นโมเดลขนาดใหญ่ มีรูปแบบการทำงานที่แม่นยำมากขึ้น เหมาะกับการถอดเสียงสำหรับไฟล์ที่บันทึกเสียงมาก่อนแล้ว และรองรับทั้งเสียงอีสาน ไทยกลาง รวมถึงภาษาอังกฤษ และยังมีความสามารถเดิมของภาษาอื่นๆ
ด้าน สิทธิพงศ์ ศรีไพศาลมงคล Lead AI Engineer SCB 10X ได้อธิบายถึงโมเดลแปลงข้อความเป็นเสียงพูดอย่าง “Typhoon Isan TTS” ที่สามารถพูดภาษาอีสานได้อย่างเป็นธรรมชาติ โดยได้ทำการศึกษาเปรียบเทียบเทคโนโลยี TTS ในตลาดหลายตัว พร้อมปรับและออกแบบให้เหมาะสมกับสภาพแวดล้อมการใช้งานจริง เช่น ประสิทธิภาพดี ต้นทุนต่ำ การประมวลผลที่รวดเร็ว และรองรับการสตรีมแบบเรียลไทม์
นอกจากนี้ ในงานวิจัยที่เขาศึกษามา พบว่า ต้องใช้เสียงพูดที่มีคุณภาพระยะเวลาประมาณ 2 ชั่วโมง ในการให้เสียง TTS ที่เริ่มใช้งานได้จริง รวมถึงปรับปรุงข้อมูลฝึกอบรมให้มีโทนเสียง การพูดที่เหมาะสม และออกเสียงถูกต้อง เพื่อให้ได้เสียงแบบธรรมชาติเสมือนคนอีสานจริงๆ
อย่างไรก็ตาม สิทธิพงศ์ได้กล่าวถึงคลังข้อมูลเสียงและทรัพยากรข้อมูลทางภาษาอีสานแบบเปิดซึ่งถูกจัดเก็บไว้อย่างเป็นระบบ โดยมี 4 องค์ประกอบหลัก ได้แก่
-Isan Speech Transcription Convention แนวทางการถอดเสียงภาษาอีสานเชิงภาษาศาสตร์ เพื่อให้การถอดเสียงเป็นแบบแผนและสอดคล้องกัน
-Isan Spelling Standard มาตรฐานการสะกดคำอีสานฉบับแรกออกแบบโดยอิงหลักภาษาศาสตร์และการออกเสียงจริง
-Isan Speech Corpus ชุดข้อมูลเสียงพูดอีสานพร้อมคำถอดเสียงจากผู้พูดจริงทั่วภูมิภาค ครอบคลุมสำเนียง คำศัพท์ และบริบทเชิงการเงิน ธนาคาร
-Isan Phonetic Dictionary พจนานุกรมสัทอักษรจับคู่คำอีสานกับการอ่าน เพื่อใช้ฝึกโมเดลเสียงและงานประมวลผลเสียงขั้นสูง
ทั้งนี้ ภายในงาน TYPHOON เฮ็ดให้ AI ใจอีสาน ได้เปิดเวทีสำหรับผู้ทรงคุณวุฒิในหลากหลายอาชีพ เพื่อร่วมแบ่งปันเอกลักษณ์และแนวทางการสืบสานภาษาอีสาน
ด้าน สุมิตรา สุรรัตน์เดชา อาจารย์ประจำสาขาวิชาภาษาศาสตร์ สถาบันวิจัยภาษาและวัฒนธรรมเอเชีย มหาวิทยาลัยมหิดล กล่าวว่า ปัจจุบันมีทั้งหมด 7,000 ภาษาที่ถูกใช้ในทั่วโลก ส่วนประเทศไทยใช้ทั้งหมด 85 ภาษา ดังนั้น ภาษาไม่ใช่แค่การสื่อสาร แต่เป็นคลังความรู้ อัตลักษณ์ และวัฒนธรรม
“แน่นอนว่า ภาษาถิ่นย่อมมีความเสี่ยงที่จะสูญหาย เนื่องจากไม่ใช่ภาษาที่ถูกสื่อสารอย่างแพร่หลาย หากพูดถึงในภูมิภาคอาเซียน พบว่า อินโดนีเซียมีภาษาถิ่นมากที่สุด ทำให้ความเสี่ยงในการสูญเสียภาษาสูงถึง 50% นับเป็นอันดับหนึ่งในอาเซียน
“ส่วนประเทศไทยอยู่ในอันดับ 2 โดยมีความเสี่ยงในความสูญเสียภาษาอยู่ที่ 34% และผลกระทบในความสูญเสียดังกล่าวก็ขึ้นอยู่กับหลายปัจจัย ไม่ว่าจะเป็น สังคม วัฒนธรรม และการเมือง” สุมิตราระบุ
วีรินท์ ฉันทโรจน์ Head of innovation Lab SCBX กล่าวถึงความท้าทายในการนำภาษาถิ่นมาพัฒนาในรูปแบบ โมเดล AI ว่า คนอีสานเป็น 1 ใน 3 ของไทย โดยเป็นกลุ่มลูกค้าที่ใหญ่มาก คนในภาคอีสานอาจไม่ได้เหมือนคนในกรุงเทพมหานครที่รับเงินในทุกๆ เดือน แต่จะมีลักษณะอาชีพที่เฉพาะทางมากกว่า ทำให้วอลลุ่มในธุรกรรมทางการเงินมากขึ้น เช่น สินเชื่อ SME หรือบริการชำระเงิน ทาง SCBX จึงมองว่าเป็นโอกาสที่ดี แต่ความท้าทายก็มีมากเช่นกัน
ภาพ SCBX
เรื่องราวอื่นๆ ที่น่าสนใจ : ‘สยามพารากอน’ ทุ่ม 850 ล้าน เนรมิตชั้น 5 และ 5A สู่ ‘NEXTOPIA’ เมืองต้นแบบแห่งโลกอนาคต โชว์นวัตกรรมความยั่งยืนบนพื้นที่ 1.5 หมื่นตร.ม.
ไม่พลาดบทความและเรื่องราวน่าสนใจอื่นๆ ติดตามเราได้ที่เฟซบุ๊ก Forbes Thailand Magazine

