thansettakij
SIAM AI แนะไทยต้องมีอธิปไตย AI เร่งสร้าง ThaiLLM ตอบโจทย์ชาติ

SIAM AI แนะไทยต้องมีอธิปไตย AI เร่งสร้าง ThaiLLM ตอบโจทย์ชาติ

28 มี.ค. 2568 | 04:22 น.
อัปเดตล่าสุด :28 มี.ค. 2568 | 04:33 น.

SIAM AI ตอกย้ำความจำเป็นเร่งพัฒนา ThaiLLM สร้างอธิปไตย AI เพื่อคนไทย รักษาข้อมูลตัวตน หวั่นเด็กเชื่อข้อมูลผิดหากพึ่ง AI ต่างชาติ

นายรัตนพล วงศ์นภาจันทร์ ประธานเจ้าหน้าที่บริหาร บริษัท สยาม เอไอ คอร์เปอเรชั่น จำกัด (SIAM AI) กล่าวในงานสัมมนา AI Revolution 2025: A New Paradigm of New World Economy ซึ่งจัดโดยกรุงเทพธุรกิจ ในหัวข้อ Fireside Chat: The Possibility of ThaiLLM ว่า ประเทศไทยจำเป็นต้องมีโมเดลภาษาไทยของตนเอง หรือ “ThaiLLM” เพื่อรักษาอธิปไตยทางปัญญาประดิษฐ์ (AI) และป้องกันการสูญเสียตัวตนทางวัฒนธรรมจากการพึ่งพาโมเดลจากต่างประเทศที่ไม่เข้าใจรายละเอียดของคนไทยอย่างลึกซึ้ง

SIAM AI แนะไทยต้องมีอธิปไตย AI เร่งสร้าง ThaiLLM ตอบโจทย์ชาติ

โมเดล LLM ที่ใช้งานอยู่ในประเทศไทยในปัจจุบันส่วนใหญ่เป็นของต่างประเทศ โดยเฉพาะจากจีนและโลกตะวันตก แม้จะมีประสิทธิภาพ แต่ไม่สามารถเข้าใจบริบทของวัฒนธรรมไทยได้ลึกซึ้ง เช่น รายละเอียดเล็กน้อยอย่างรสชาติของอาหารไทยที่มีวัตถุดิบเฉพาะถิ่น ซึ่งเป็นตัวตนของชาติ หากไม่ได้รับการถ่ายทอดอย่างถูกต้องผ่านโมเดล AI เหล่านี้ อาจถูกบิดเบือนไปจากความเป็นจริง

ประเด็นที่น่ากังวลคือ หากผู้ใช้งาน AI  โดยเฉพาะเยาวชน รับข้อมูลจากโมเดลที่มีข้อมูลผิดเพี้ยน ย่อมส่งผลต่อความเชื่อและค่านิยมในระยะยาว เพราะ AI อาจกลายเป็นแหล่งความรู้ที่ถูกมองว่าน่าเชื่อถือยิ่งกว่าผู้ปกครองหรือครูบาอาจารย์ ด้วยเหตุนี้ จึงจำเป็นต้องมี AI ที่เป็นเครื่องมือของคนไทย ที่สามารถกลั่นกรองและตรวจสอบข้อมูลได้ภายใต้มาตรฐานที่สอดคล้องกับบริบทของสังคมไทย

SIAM AI แนะไทยต้องมีอธิปไตย AI เร่งสร้าง ThaiLLM ตอบโจทย์ชาติ

ThaiLLM ถือเป็นโมเดลภาษาขนาดใหญ่ที่ได้รับการพัฒนาด้วยข้อมูลภาษาไทยจำนวนมาก เพื่อให้เข้าใจบริบทและความหมายของภาษาไทยอย่างแท้จริง สามารถนำไปประยุกต์ใช้กับงานด้านการประมวลผลภาษาธรรมชาติ เช่น การแปลภาษา การสรุปข้อความ หรือการสร้างแชตบอทสนทนาในรูปแบบภาษาไทยที่ลื่นไหลและตรงประเด็น

SIAM AI แนะไทยต้องมีอธิปไตย AI เร่งสร้าง ThaiLLM ตอบโจทย์ชาติ

แนวทางในการพัฒนา LLM มีอยู่ 3 วิธีหลัก ได้แก่ การพัฒนาเองทั้งหมด ซึ่งต้องใช้ทรัพยากรจำนวนมาก โดยเฉพาะศูนย์ประมวลผลขนาดใหญ่ (AI Factories) ซึ่งในไทยมีผู้ให้บริการเพียง 3 ราย ข้อดีของวิธีนี้คือสามารถควบคุมคุณภาพข้อมูลได้อย่างสมบูรณ์ แต่ต้องอาศัยเงินทุนและบุคลากรจำนวนมาก

อีกวิธีคือการใช้โครงสร้างโมเดลของต่างประเทศ เช่น  AI DeepSeek จากจีน ซึ่งแม้จะใช้ต้นทุนน้อยกว่า ChatGPT แต่ยังมีข้อจำกัดด้านฮาร์ดแวร์ โดยใช้ชิป H800 และ H20 ของ Nvidia ที่ไม่สามารถจำหน่ายในไทยได้แล้ว จึงมีข้อจำกัดในการใช้งานระยะยาว

แน่นอนว่า AI DeepSeek มีข้อได้เปรียบด้านบุคลากรที่เชี่ยวชาญระดับสูงจำนวนมาก และสามารถปรับแต่งโมเดลจากพื้นฐานของ GPU ได้อย่างมีประสิทธิภาพ แต่หากไทยสามารถปรับสถาปัตยกรรมให้เหมาะสมกับเครื่องที่มีอยู่ จะสามารถเพิ่มประสิทธิภาพการทำงานได้ถึง 20 เท่า ซึ่งถือเป็นข้อได้เปรียบที่สำคัญ

อีกทางเลือกหนึ่งคือการใช้โมเดล LLM ของสหรัฐ แต่พบว่าให้ความสำคัญกับภาษาไทยน้อยมาก แม้จะพยายามเทรนโมเดลให้รองรับภาษาไทย แต่กลับพบว่ามีภาษาจีนและภาษาเวียดนามแทรกเข้ามาในผลลัพธ์จำนวนมาก สะท้อนถึงความท้าทายที่ต้องเผชิญหากยังต้องพึ่งพาโมเดลของต่างประเทศ

จากข้อมูลโอเพ่นซอร์สของจีนและสหรัฐพบว่า มีข้อมูลภาษาไทยเพียง 0.5% เมื่อเทียบกับข้อมูลภาษาจีน 3% และภาษาอังกฤษอีกเกือบทั้งหมด ยิ่งตอกย้ำว่าภาษาไทยอาจไม่ใช่สิ่งที่ผู้พัฒนาต่างประเทศให้ความสำคัญมากนัก

เพื่อตอบโจทย์นี้ SIAM AI จึงร่วมมือกับ Nvidia ในการจัดทำชุดข้อมูลภาษาไทยอย่างน้อย 15,000 ชุด เพื่อเทรนโมเดลให้เข้าใจภาษาไทยโดยไม่มีภาษาอื่นปนเปื้อน เป็นก้าวแรกของการวางรากฐานอธิปไตย AI ไทยอย่างแท้จริง

ทิศทางต่อไปของการพัฒนา AI ไม่ได้หยุดแค่ LLM แต่กำลังก้าวไปสู่โมเดลแบบ VLA (Vision-Language-Action) ซึ่งเป็นโมเดลที่รวมการมองเห็น การเข้าใจภาษา และการตอบสนองในรูปแบบของการกระทำ เป็นรูปแบบของ AI ฝังตัว (Embedded AI) ที่จะถูกใช้งานอย่างแพร่หลายมากขึ้นในอนาคต

ด้วยการประมวลผลที่เร็วขึ้นจากชิปรุ่นใหม่ของ Nvidia ได้แก่ Grace Blackwell 200 ที่สามารถทำงานได้เทียบเท่าคอมพิวเตอร์กว่า 400,000 เครื่อง และในปลายปี 2568 จะมี Grace Blackwell 300 ที่เร็วกว่าเดิม 1.5 เท่า รวมถึง Vera Rubin NVL 144 และ Rubin Ultra NVL 576 ที่เร็วกว่าเดิมหลายเท่าตัว

เหตุผลสำคัญที่ต้องพัฒนา VLA คือเพื่อให้โมเดลเรียนรู้การประมวลผลในหลายมิติ และลดความผิดพลาดในการประมวลผล อีกทั้งยังสามารถควบคุมดาต้าเซ็ตที่ใช้ฝึกโมเดลได้อย่างรัดกุม โดยเน้นให้ใช้ข้อมูลในประเทศที่สะท้อนบริบทของไทยให้มากที่สุด

นายรัตนพล กล่าวต่อไปว่า ในการเดินทางไปร่วมงาน GTC 2025 ณ เมืองซานโฮเซ สหรัฐอเมริกา ซึ่งเป็นงานประชุมประจำปีของนักพัฒนา Nvidia ยังได้พบกับสตาร์ตอัปจำนวนมากที่พูดคุยถึงเทรนด์ของ AI โดยเฉพาะการพัฒนา AGI (Artificial General Intelligence) ซึ่งเป็นระบบ AI ที่สามารถคิดและวิเคราะห์ได้เทียบเท่ามนุษย์ในหลายด้าน

SIAM AI แนะไทยต้องมีอธิปไตย AI เร่งสร้าง ThaiLLM ตอบโจทย์ชาติ

เทรนด์ของ AGI ไม่ใช่เรื่องไกลตัวอีกต่อไป และกำลังเกิดขึ้นจริงในเวลาที่ใกล้กว่าที่หลายฝ่ายคาดไว้ การที่ประเทศไทยจะก้าวให้ทันกระแสโลก จำเป็นต้องมีเทคโนโลยี AI ของตนเอง และพัฒนาไปพร้อมกับนวัตกรรมระดับโลก โดยไม่ละทิ้งรากเหง้าทางวัฒนธรรมและความเป็นไทย

ThaiLLM จึงไม่ใช่แค่โมเดลภาษา แต่เป็นกุญแจสำคัญที่จะนำไปสู่การมี “อธิปไตยทางปัญญาประดิษฐ์” เพื่อให้ประเทศไทยไม่ถูกกลืนหายไปในยุคที่ AI ครองโลก