ท่ามกลางกระแสความนิยมของเทคโนโลยี Large Language Model (LLM) หรือโมเดล AI ขนาดใหญ่ที่มีความสามารถด้านการประมวลผลภาษาและการสื่อสารแบบมนุษย์ กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.) โดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) ได้พัฒนา Pathumma LLM หรือปทุมมา แอลแอลเอ็ม โมเดล AI ขนาดใหญ่สัญชาติไทย เพื่อสนับสนุนการขับเคลื่อนระบบบริการ AI ในประเทศ
ดร.ศราวุธ คงยัง นักวิจัยกลุ่มวิจัยปัญญาประดิษฐ์ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สวทช.เปิดเผยว่า ในปัจจุบันโมเดล LLM สามารถแบ่งออกเป็น 2 ประเภท คือ โมเดลแบบปิด (close model) ที่ผู้พัฒนาไม่เปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อ เช่น Chat-GPT, Gemini, Claude และโมเดลแบบเปิด (open model) ที่ผู้พัฒนาเปิดให้สาธารณะดาวน์โหลดไปพัฒนาต่อได้ เช่น Gemma, Sea Lion, Typhoon, THaLLE
โดย Pathumma LLM ถูกพัฒนาขึ้นในรูปแบบโมเดลแบบเปิด เพื่อแก้ไขข้อจำกัดของโมเดลแบบปิดที่อาจขาดความคล่องตัวในการใช้งาน โดยเฉพาะในองค์กรที่ต้องปกปิดข้อมูล เช่น ธนาคาร สถานพยาบาล หรือศาล รวมถึงการใช้งานเฉพาะทางของประเทศไทย เช่น การเรียบเรียงเอกสารราชการไทย หรือการสื่อสารภาษาถิ่นไทย
“ทีมวิจัยได้นำความเชี่ยวชาญด้านการพัฒนาโมเดล AI และความพร้อมด้านโครงสร้างพื้นฐานในระดับสากลของ สวทช. เช่น ซูเปอร์คอมพิวเตอร์ลันตา (LANTA) มาใช้ในการผลิต Pathumma LLM ปัจจุบันได้เปิดให้ทดลองใช้งานเวอร์ชัน 1.0.0 แล้วที่เว็บไซต์ AI For Thai โดยผู้สนใจสามารถเข้าถึงได้ใน 3 รูปแบบ ได้แก่ APP สำหรับบุคคลทั่วไปใช้งานผ่านเว็บแอปพลิเคชัน API สำหรับนักพัฒนาที่ต้องการดึงข้อมูลไปแสดงผลที่หน้าเว็บไซต์ของตัวเอง และ Model สำหรับนักพัฒนาที่ต้องการดาวน์โหลดโมเดลไปพัฒนาต่อ”
สำหรับจุดเด่นของ Pathumma LLM คือการเป็น Multi-Modal Generative AI ที่รองรับการประมวลผลข้อมูลได้ 3 รูปแบบ รูปแบบแรกคือ Text LLM หรือโมเดลสำหรับประมวลผลคำถามหรือคำสั่งที่เป็นข้อความ ซึ่งผ่านการปรับแต่งให้เหมาะกับการสืบค้นข้อมูลและตอบคำถามอย่างเป็นเหตุเป็นผล ทำให้เหมาะแก่การพัฒนาต่อยอดเพื่อใช้ประมวลผลข้อมูลเฉพาะขององค์กรต่างๆ เช่น กรมสรรพากรสามารถใช้พัฒนาแชตบอตตอบข้อซักถามด้านการยื่นภาษีแก่ประชาชน หรือหน่วยงานวิจัยสามารถใช้พัฒนาแชตบอตสำหรับสืบค้นและสรุปภาพรวมข้อมูลงานวิจัยขององค์กร
รูปแบบที่สองคือ Audio LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นเสียง โมเดลนี้ผ่านการปรับแต่งให้สามารถถอดความจากเสียงได้ทั้งภาษาไทยและอังกฤษ สร้างคำบรรยายเสียงบรรยากาศแวดล้อม ระบุอารมณ์และเพศของผู้พูด รวมถึงตอบคำถามหรือให้ข้อมูลเกี่ยวกับเนื้อหาภายในคลิปได้
ส่วนรูปแบบที่สามคือ Vision LLM หรือโมเดลสำหรับประมวลผลข้อมูลที่เป็นภาพ ซึ่งผ่านการปรับแต่งให้สามารถสร้างคำบรรยายภาพ ถอดข้อความที่อยู่ในภาพ และตอบคำถามหรือให้ข้อมูลเกี่ยวกับภาพนั้นๆ ได้
อย่างไรก็ตาม การจะเพิ่มประสิทธิภาพและศักยภาพการทำงานให้แก่ LLM จำเป็นต้องอาศัยปัจจัยหลายด้าน โดยเฉพาะปริมาณ คุณภาพ และความทันสมัยของข้อมูล รวมถึงความพร้อมด้านระบบโครงสร้างพื้นฐาน เช่น ระบบคลาวด์คอมพิวติง (cloud computing) สำหรับใช้ประมวลผล AI ดังนั้น ทีมวิจัยจึงมีแผนที่จะเริ่มดำเนินงานความร่วมมือกับพันธมิตรทั้งภาครัฐและเอกชนไทยในการพัฒนา foundation model หรือโมเดลพื้นฐานสำหรับประเทศไทยที่มีขนาดใหญ่ขึ้น เพื่อเพิ่มศักยภาพในการรองรับปริมาณข้อมูลและพารามิเตอร์ที่ใช้ในการเทรนโมเดล AI โดยคาดว่าจะเริ่มดำเนินงานภายในกุมภาพันธ์ 2568
นอกจากนี้ ทีมวิจัยยังมีแผนจะขอความอนุเคราะห์ข้อมูลที่เปิดเผยได้ของหน่วยงานภาครัฐและเอกชนไทยมาใช้เทรน AI เพื่อให้ Pathumma LLM มีฐานข้อมูลมากพอแก่การเป็นโมเดลแบบเปิดที่เชี่ยวชาญทั้งภาษา ข้อมูล และบริบทไทย และมีส่วนช่วยขับเคลื่อน AI Governance หรือการใช้ AI เพิ่มประสิทธิภาพการทำงานและระบบบริการของภาครัฐในอนาคต
“เป้าหมายต่อไปของการพัฒนาระบบ Pathumma LLM ที่ทีมวิจัยตั้งไว้ นอกจากการเพิ่มจุดแข็งด้านข้อมูลและความสามารถในการเป็น Generative AI แล้ว ทีมวิจัยยังมีแผนจะพัฒนาให้ Pathumma LLM ก้าวสู่การเป็น Agentic AI หรือ AI ที่มีศักยภาพในการคิดวิเคราะห์และตัดสินใจด้วยตัวเองอย่างมีประสิทธิภาพโดยอัตโนมัติ เช่น AI ผู้ช่วยส่วนตัวที่ช่วยวิเคราะห์ข้อมูลตลาดและซื้อขายหุ้นตามเงื่อนไขให้โดยอัตโนมัติ หรือแชตบอตช่วยแนะนำระบบบริการที่สอดคล้องกับความสนใจของผู้ใช้งานพร้อมช่วยตรวจสอบสถานะของงานให้โดยอัตโนมัติ ซึ่งการยกระดับสู่ Agentic AI เป็นเทรนด์เทคโนโลยีที่ผู้พัฒนาทั่วโลกต่างกำลังให้ความสำคัญ ณ ขณะนี้ด้วยเช่นกัน”