เทคโนโลยี

DeepMind เปิดตัว AlphaEvolve ระบบ AI ใหม่ แก้ปัญหาด้วยการประเมินผลอัตโนมัติ

ลดปัญหาอาการหลอนของ AI

DeepMind ซึ่งเป็นหน่วยปฏิบัติการวิจัยและพัฒนาด้าน AI ของ Google ประกาศพัฒนาระบบปัญญาประดิษฐ์ (AI) ใหม่ล่าสุดที่เรียกว่า AlphaEvolve โดยระบบนี้ถูกออกแบบมาเพื่อจัดการกับปัญหาที่มี “โซลูชันที่สามารถให้คะแนนได้ด้วยเครื่องจักร”

DeepMind ระบุว่า จากการทดลอง ระบบ AlphaEvolve สามารถช่วยเพิ่มประสิทธิภาพโครงสร้างพื้นฐานบางส่วนที่ Google ใช้ในการฝึกฝนโมเดล AI ของตนเองได้ ขณะนี้บริษัทกำลังพัฒนาระบบส่วนต่อประสานกับผู้ใช้ (user interface) สำหรับการโต้ตอบกับ AlphaEvolve และวางแผนที่จะเปิดโปรแกรมให้สิทธิ์เข้าถึงล่วงหน้าสำหรับนักวิชาการที่ได้รับคัดเลือก ก่อนที่จะพิจารณาเปิดให้ใช้งานในวงกว้างต่อไป

ปัญหาหนึ่งที่พบได้บ่อยในโมเดล AI ส่วนใหญ่คือการ “หลอน” (hallucinate) หรือการสร้างข้อมูลที่ไม่ถูกต้องขึ้นมาอย่างมั่นใจ ซึ่งเป็นผลมาจากสถาปัตยกรรมแบบสุ่มของพวกมัน ในความเป็นจริงแล้ว โมเดล AI รุ่นใหม่อย่าง o3 ของ OpenAI กลับมีแนวโน้มที่จะหลอนมากกว่ารุ่นก่อนหน้า แสดงให้เห็นถึงความท้าทายของปัญหานี้

AlphaEvolve ได้นำเสนอกลไกอันชาญฉลาดเพื่อลดปัญหาการหลอน นั่นคือระบบการประเมินผลอัตโนมัติ ระบบนี้ใช้โมเดล AI ในการสร้างสรรค์ วิพากษ์วิจารณ์ และรวบรวมชุดคำตอบที่เป็นไปได้สำหรับคำถาม ก่อนที่จะประเมินและให้คะแนนความถูกต้องของคำตอบเหล่านั้นโดยอัตโนมัติ

AlphaEvolve ไม่ใช่ระบบแรกที่ใช้วิธีการนี้ นักวิจัย รวมถึงทีมงานของ DeepMind เองเมื่อหลายปีก่อน เคยนำเทคนิคที่คล้ายคลึงกันมาประยุกต์ใช้ในโดเมนคณิตศาสตร์ต่าง ๆ อย่างไรก็ตาม DeepMind อ้างว่าการที่ AlphaEvolve ใช้โมเดลที่ “ทันสมัยที่สุด” โดยเฉพาะโมเดล Gemini ทำให้มีความสามารถสูงกว่าระบบ AI รุ่นก่อน ๆ อย่างเห็นได้ชัด

deepmind-newest-alphaevolve

ในการใช้งาน AlphaEvolve ผู้ใช้จะต้องป้อนปัญหาให้กับระบบ โดยอาจมีรายละเอียดเพิ่มเติม เช่น คำแนะนำ สมการ ข้อมูลโค้ด หรือเอกสารที่เกี่ยวข้อง นอกจากนี้ ผู้ใช้จะต้องจัดเตรียมกลไกสำหรับการประเมินคำตอบของระบบโดยอัตโนมัติในรูปแบบของสูตร

เนื่องจาก AlphaEvolve สามารถแก้ปัญหาที่สามารถประเมินตนเองได้เท่านั้น ระบบนี้จึงเหมาะสำหรับปัญหาบางประเภทโดยเฉพาะ เช่น ปัญหาในสาขาวิทยาการคอมพิวเตอร์และการเพิ่มประสิทธิภาพระบบ ข้อจำกัดที่สำคัญอีกประการหนึ่งคือ AlphaEvolve สามารถอธิบายโซลูชันในรูปแบบของอัลกอริทึมเท่านั้น ทำให้ไม่เหมาะกับปัญหาที่ไม่ใช่เชิงตัวเลข

เพื่อวัดประสิทธิภาพของ AlphaEvolve ทาง DeepMind ได้ทดลองให้ระบบแก้ปัญหาคณิตศาสตร์ที่คัดสรรมาประมาณ 50 ข้อ ซึ่งครอบคลุมสาขาตั้งแต่เรขาคณิตไปจนถึงคณิตศาสตร์เชิงการจัด DeepMind อ้างว่า AlphaEvolve สามารถ “ค้นพบใหม่” ซึ่งคำตอบที่เป็นที่รู้จักดีที่สุดสำหรับปัญหาเหล่านั้นได้ถึง 75% และค้นพบโซลูชันที่ได้รับการปรับปรุงให้ดีขึ้นใน 20% ของกรณีทั้งหมด

DeepMind ยังได้ประเมิน AlphaEvolve ในการแก้ปัญหาเชิงปฏิบัติ เช่น การเพิ่มประสิทธิภาพของศูนย์ข้อมูลของ Google และการเร่งความเร็วในการฝึกฝนโมเดล จากข้อมูลของห้องปฏิบัติการ AlphaEvolve ได้สร้างอัลกอริทึมที่สามารถกู้คืนทรัพยากรคอมพิวเตอร์ทั่วโลกของ Google ได้โดยเฉลี่ย 0.7% อย่างต่อเนื่อง ระบบยังได้เสนอการเพิ่มประสิทธิภาพที่ช่วยลดระยะเวลาโดยรวมที่ Google ใช้ในการฝึกฝนโมเดล Gemini ลง 1%

อย่างไรก็ตาม ต้องชี้แจงให้ชัดเจนว่า AlphaEvolve ไม่ได้ทำการค้นพบที่ก้าวล้ำ ในการทดลองหนึ่ง ระบบสามารถค้นพบการปรับปรุงสำหรับการออกแบบชิปเร่งความเร็ว AI TPU ของ Google ซึ่งเคยถูกตั้งข้อสังเกตโดยเครื่องมืออื่น ๆ มาก่อนหน้านี้แล้ว

แต่ DeepMind กำลังนำเสนอ AlphaEvolve ในมุมมองเดียวกับที่ห้องปฏิบัติการ AI หลายแห่งนำเสนอระบบของตนเอง นั่นคือ AlphaEvolve สามารถช่วยประหยัดเวลา พร้อมทั้งช่วยให้ผู้เชี่ยวชาญมีเวลาไปมุ่งเน้นที่งานอื่น ๆ ที่มีความสำคัญมากกว่า

ที่มา
TechCrunch

Artherlus

แค่คนทั่วไปที่หลงใหลในวงการไอที
Back to top button