สงคราม AI โลก ระหว่างสหรัฐ-จีน ปะทุขึ้นอีกรอบ โดยสหรัฐ ภายใต้นโยบายทรัมป์ ประกาศชัดเจนต้องการเป็นผู้นำ AI โลก ล่าสุดดึงซอฟต์แบงก์กรุ๊ป คอร์ป OpenAI และออราเคิล คอร์ป ตั้งบริษัทสตาร์เกต ลงทุนโครงสร้างพื้นฐานด้าน AI ใหญ่ที่สุดในประวัติศาสตร์สหรัฐฯ มูลค่า 5 แสนล้านดอลลาร์สหรัฐ หรือ ราว 17 ล้านล้านบาท สร้างงานด้าน AI ในสหรัฐฯสูงถึง 1 แสนตำแหน่ง
ขณะที่ AI ของจีน “DeepSeek” กำลังสร้างแรงสั่นสะเทือนให้กับยักษ์ Gen AI ทั้ง Open AI หรือ Germini ล่าสุด DeepSeek ทำให้หุ้น Nvidia ตกไป 17% หลายคนกำลังคาดการณ์ว่า DeepSeek จะเป็น AI ของจีน ที่เป็น Game Changer ช่วยให้จีนก้าวเป็นผู้นำทางในอุตสาหกรรม AI โลก
ดร.กอบกฤตย์ วิริยะยุทธกร ผู้ก่อตั้งและประธานเจ้าหน้าที่บริหาร บริษัท ไอแอพพ์เทคโนโลยี จำกัด (iAPP) หนึ่งในกูรูด้าน AI ของไทย ได้เปรียบเทียบความแตกต่างในเรื่องคุณสมบัติ ความสามารถ และราคา ระหว่าง “OpenAI VS DeepSeek”ได้น่าสนใจ
- DeepSeek-R1 กำหนดค่าบริการ API อยู่ที่ 19 บาทต่อการใช้งาน 1 ล้านโทเคน
- OpenAI-O1-1217 กำหนดค่าบริการ API อยู่ที่ 505 บาทต่อการใช้งาน 1 ล้านโทเคน (สูงกว่าประมาณ 26.5 เท่า)
- DeepSeek-R1 เป็นโมเดลแบบโอเพนซอร์ส (Open Source) ที่เปิดโอกาสให้ผู้ใช้งานดาวน์โหลดและนำไปใช้ได้โดยไม่มีค่าใช้จ่าย (ยกเว้นค่าใช้จ่ายด้านพลังงานไฟฟ้า) อีกทั้งยังสามารถนำไปใช้งานกับข้อมูลลับของผู้ใช้งานได้ โดยไม่จำเป็นต้องส่งข้อมูลไปยังเซิร์ฟเวอร์ของผู้ให้บริการ จึงตอบโจทย์ด้านอธิปไตยทาง AI (Sovereign AI)
- OpenAI-O1-1217 เป็นโมเดลแบบปิด ที่ผู้ใช้งานต้องจ่ายค่าบริการตามปริมาณการใช้งาน และจำเป็นต้องส่งข้อมูลคำถามของผู้ใช้ไปยังเซิร์ฟเวอร์ของผู้ให้บริการ
- DeepSeek-R1 มีความโดดเด่นในการใช้เหตุผล เช่น สามารถทำคะแนนในการทดสอบแก้โจทย์คณิตศาสตร์ AIME 2024 และ MATH-500 ได้ใกล้เคียงกับ OpenAI-O1-1217
- โดยเฉพาะการแก้ปัญหาคณิตศาสตร์ DeepSeek-R1 ใช้การเรียนรู้แบบ Reinforcement Learning โดยไม่ต้องอาศัยข้อมูลตัวอย่าง (สามารถฝึกฝนกับตนเองจนมีความเชี่ยวชาญ) ส่งผลให้เกิดความเข้าใจและพัฒนาชุดกระบวนการคิด (chain-of-thought) ได้อย่างลึกซึ้ง
- OpenAI เองมีความแข็งแกร่งจากการเรียนรู้ด้วยข้อมูลตัวอย่าง (Supervised Finetuning) ซึ่งทำให้ภาษาเป็นไปอย่างมีเสถียรภาพและยังสามารถปรับตัวตามสถานการณ์ได้อย่างมีประสิทธิภาพ
- DeepSeek-R1 แสดงความสามารถด้านการเขียนโค้ดในระดับเชี่ยวชาญ โดยในการแข่งขัน Codeforces มี Elo rating ประมาณ 2,029
- อย่างไรก็ตาม กระบวนการเรียนรู้ผ่าน RL ของ DeepSeek-R1 ยังมุ่งเน้นด้านการใช้เหตุผลมากกว่าการพัฒนาเชิงวิศวกรรมซอฟต์แวร์ ทำให้โดยรวมยังไม่สามารถเหนือกว่าโมเดลขนาดใหญ่ของ OpenAI ได้อย่างชัดเจน
- ในการทดสอบด้านความรู้รอบตัว เช่น MMLU, MMLU-Pro หรือ GPQA Diamond พบว่า DeepSeek-R1 มีคะแนนสูงกว่ารุ่นก่อนหน้าอย่าง DeepSeek-V3 และมีคะแนนใกล้เคียงกับ OpenAI-O1-1217
- OpenAI ยังคงรักษาความแม่นยำในด้านข้อมูลข้อเท็จจริง (factual) รวมถึงความสามารถในการสรุปและจับประเด็นได้อย่างมีประสิทธิผล แต่ DeepSeek-R1 ยังคงพัฒนาอย่างก้าวกระโดดในเวอร์ชันล่าสุด
- DeepSeek-R1 อาศัยการเรียนรู้แบบ Reinforcement Learning ที่มุ่งให้โมเดลค้นพบวิธีการใช้เหตุผลเชิงลึกด้วยตนเอง ส่งผลให้บางครั้งภาษาที่ยังไม่สละสลวย (Readability) และยังมีลักษณะการใช้ภาษาหลายภาษาปะปน
- ด้าน OpenAI-O1-1217 และโมเดลอื่น ๆ ของ OpenAI ผ่านการปรับแต่งด้วย Supervised Finetuning จึงช่วยในการเลือกใช้ภาษาได้อย่างเหมาะสมและปรับตัวตามความต้องการของผู้ใช้ได้อย่างยืดหยุ่น
ดร.กอบกฤตย์ สรุปให้เห็นภาพโดยรวมชัดเจนมากขึ้น โดยด้านราคาและการเป็นโมเดลเปิด: DeepSeek-R1 มีค่าใช้จ่ายถูกกว่า OpenAI O1 อย่างมาก (จ่ายเพียง 4% ของราคา OpenAI) และเป็นโมเดลโอเพนซอร์ส (Open Source) ที่ผู้ใช้งานสามารถดาวน์โหลดไปใช้ได้โดยไม่เสียค่าใช้จ่าย ตอบโจทย์ด้านอธิปไตยทาง AI (Sovereign AI)
ด้านการใช้เหตุผล: DeepSeek-R1 มีจุดเด่นในด้านความสามารถวิเคราะห์เหตุผลด้วยตนเองโดยไม่ต้องใช้ข้อมูลตัวอย่าง และสามารถให้เหตุผลได้อย่างมีประสิทธิภาพสูง ขณะที่ OpenAI ได้เปรียบจากประสบการณ์การปรับแต่งมาอย่างยาวนาน
ด้านภาษา: OpenAI O1 ยังคงรักษาคุณภาพคำตอบได้ในระดับสูง ส่วน DeepSeek-R1 ยังต้องปรับปรุงด้านความลื่นไหลของภาษาต่อไป
สำหรับงาน STEM หรือโจทย์แข่งขัน: DeepSeek-R1 พัฒนาได้อย่างเข้มแข็งและมีศักยภาพเข้าใกล้ OpenAI-O1-1217 แต่ในภาพรวม OpenAI ยังคงเป็นมาตรฐานหลักในงานวิจัยทั่วไป
แนวโน้มอนาคต: DeepSeek-R1 มีแผนขยายขีดความสามารถด้านภาษาที่หลากหลาย และปรับแต่งเพื่อรองรับงานวิศวกรรมซอฟต์แวร์มากขึ้น ส่วน OpenAI ยังคงเดินหน้าพัฒนาโมเดลรุ่นใหม่ ๆ อย่างต่อเนื่อง
DeepSeek-R1 และ OpenAI-O1-1217 มีความสามารถทัดเทียมกันในงานที่ต้องอาศัยเหตุผลขั้นสูง อย่างไรก็ตาม ในการใช้งานทั่วไปที่ต้องรองรับหลากหลายภาษาหรือหมวดการใช้งานจริง OpenAI อาจมีความพร้อมมากกว่าเล็กน้อย ผู้ใช้งานจึงควรพิจารณาเลือกใช้โมเดลให้เหมาะสมกับเป้าหมายและข้อจำกัดของตน อาทิ ทรัพยากร ความยากของงาน และความลับของข้อมูล