Anthropic ใช้ Pokémon Red ทดสอบ AI รุ่นใหม่ Claude 3.7 Sonnet

ให้ผลลัพธ์ที่ดีกว่ารุ่นก่อนชัดเจน

Artherlus25 February 2025

96 น้อยกว่า 1 นาที

Anthropic บริษัทพัฒนา AI ได้ใช้เกมคลาสสิกอย่าง Pokémon Red บนเครื่อง Game Boy เพื่อทดสอบประสิทธิภาพของโมเดล AI รุ่นล่าสุดอย่าง Claude 3.7 Sonnet โดยทางบริษัทได้ให้โมเดลนี้มีความสามารถพื้นฐาน เช่น การจดจำ การรับค่าจากพิกเซลบนหน้าจอ และการกดปุ่มเพื่อควบคุมตัวละครในเกม ทำให้มันสามารถเล่น Pokémon ได้อย่างต่อเนื่อง

จุดเด่นของ Claude 3.7 Sonnet คือความสามารถในการ Extended Thinking คล้ายกับโมเดล o3-mini ของ OpenAI และ R1 ของ DeepSeek ที่สามารถใช้เวลาและทรัพยากรในการประมวลผลมากขึ้นเพื่อแก้ปัญหาที่ยากขึ้น ซึ่งความสามารถนี้มีประโยชน์อย่างมากในการเล่น Pokémon Red

เมื่อเทียบกับ Claude 3.0 Sonnet รุ่นก่อนหน้าที่ไม่สามารถออกจากบ้านในเมือง Pallet Town ซึ่งเป็นจุดเริ่มต้นของเกมได้ Claude 3.7 Sonnet สามารถต่อสู้กับผู้นำยิม Pokémon ได้ถึง 3 คนและชนะเพื่อเก็บเข็มกลัดมาได้ อย่างไรก็ตาม Anthropic ไม่ได้ระบุว่าโมเดลนี้ใช้ทรัพยากรการประมวลผลมากแค่ไหน หรือใช้เวลาเท่าไรในการผ่านด่านต่าง ๆ โดยทางบริษัทเพียงแค่ระบุว่าโมเดลดำเนินการทั้งหมด 35,000 ครั้งเพื่อไปถึงผู้นำยิมคนสุดท้ายอย่าง Lt. Surge

แม้ว่าการใช้ Pokémon Red ในการทดสอบจะดูเหมือนเป็นเพียงการทดลองเล่นเกมมากกว่าการวัดประสิทธิภาพที่จริงจัง แต่ก็มีประวัติศาสตร์ยาวนานในการใช้เกมเพื่อทดสอบความสามารถของ AI ในช่วงไม่กี่เดือนที่ผ่านมา มีแอปและแพลตฟอร์มใหม่ ๆ เกิดขึ้นมากมายเพื่อทดสอบความสามารถของโมเดล AI ในการเล่นเกมต่าง ๆ ตั้งแต่ Street Fighter ไปจนถึง Pictionary

การทดสอบนี้แสดงให้เห็นว่า Claude 3.7 Sonnet มีศักยภาพในการเรียนรู้และแก้ปัญหาที่ซับซ้อนได้ดีขึ้น ซึ่งอาจนำไปสู่การพัฒนาต่อยอดในอนาคตสำหรับงานอื่น ๆ ที่ต้องการการคิดวิเคราะห์และการตัดสินใจที่มากขึ้น

ที่มา