OpenAI ปล่อยโมเดล Open Source ครั้งแรกในรอบ 6 ปี
หวังลดช่องว่างการเข้าถึง AI สำหรับนักพัฒนาและองค์กรขนาดเล็ก

OpenAI เปิดตัวโมเดลปัญญาประดิษฐ์แบบ open-weight สองตัวคือ gpt-oss-120b (117 พันล้านพารามิเตอร์) และ gpt-oss-20b (21 พันล้านพารามิเตอร์) ซึ่งสามารถดาวน์โหลดและรันได้บนระบบส่วนตัว โดยถือเป็นการเปิดครั้งแรกของบริษัทนับตั้งแต่เปิดตัว GPT-2 เมื่อปี 2019 โมเดลทั้งสองมาพร้อมลิขสิทธิ์แบบยืดหยุ่น Apache 2.0 ทำให้ผู้ใช้สามารถนำไปพัฒนา ปรับแต่ง และนำไปใช้ในเชิงพาณิชย์ได้โดยเสรี
gpt-oss-120b ต้องการ VRAM อย่างน้อย 80GB จึงจะรันได้อย่างราบรื่น ขณะที่รุ่นเล็กกว่าอย่าง gpt-oss-20b สามารถทำงานบน GPU เดียวที่มี VRAM 16GB ได้ ทำให้เข้าถึงได้ง่ายขึ้นสำหรับนักพัฒนาทั่วไป OpenAI ระบุว่า การเปิดตัวครั้งนี้เป็นก้าวสำคัญในการสนับสนุนระบบ Open Source และสอดคล้องกับพันธกิจของบริษัทในการทำให้ประโยชน์ของ AI เข้าถึงได้อย่างกว้างขวาง โดยเฉพาะสำหรับนักวิจัย นักพัฒนา และองค์กรที่มีทรัพยากรจำกัด

ผลการทดสอบภายในบริษัทแสดงให้เห็นว่า gpt-oss-120b ทำคะแนนได้ 2,622 คะแนนบนการทดสอบเขียนโค้ด Codeforces เมื่อใช้เครื่องมือช่วย และ 2,643 คะแนนเมื่อไม่ใช้เครื่องมือ ซึ่งใกล้เคียงกับโมเดล o3 และ o4-mini และเหนือกว่า o3-mini อย่างชัดเจน ในขณะที่ gpt-oss-20b ทำได้ 2,516 คะแนน (พร้อมเครื่องมือ) และ 2,230 คะแนน (ไม่ใช้เครื่องมือ) ซึ่งทำได้ดีพอ ๆ กับ o3 และ o4-mini และดีกว่า o3-mini เล็กน้อย โดยทั้งสองโมเดลยังแสดงศักยภาพดีในงานด้านสุขภาพและคณิตศาสตร์เมื่อเทียบกับ o4-mini
อย่างไรก็ตาม OpenAI ยอมรับว่า ทั้งสองโมเดลมีแนวโน้ม hallucinate สูงกว่าโมเดลที่เน้นการให้เหตุผล เช่น o3 และ o4-mini โดยผลการทดสอบภายในพบว่า ทั้ง gpt-oss-120b และ gpt-oss-20b เกิดการหลงผิดระหว่าง 49% ถึง 53% เมื่อประเมินจากชุดข้อมูลที่ทดสอบความรู้เกี่ยวกับบุคคล

โมเดลทั้งสองสามารถดาวน์โหลดได้ที่ Hugging Face โดยมาพร้อมการบีบอัด (quantized) ล่วงหน้าในรูปแบบ MXFP4 เพื่อเพิ่มประสิทธิภาพการใช้งาน และรองรับการติดตั้งบนแพลตฟอร์มชั้นนำหลายแห่ง ได้แก่ Microsoft Azure, AWS, Hugging Face, vLLM, Ollama, LM Studio, llama.cpp, Fireworks, Together AI และอื่น ๆ อีกมากมาย
OpenAI คาดหวังว่าการเปิดตัวครั้งนี้จะช่วยลดอุปสรรคสำหรับตลาดเกิดใหม่ ภาคส่วนที่มีทรัพยากรจำกัด และองค์กรขนาดเล็กที่อาจไม่มีงบประมาณหรือความยืดหยุ่นในการใช้โมเดลเชิงพาณิชย์