Microsoft เปิดตัว Fara-7B โมเดล AI ขนาดเล็กสำหรับใช้งานคอมพิวเตอร์โดยตรง
เน้นความเป็นส่วนตัวและประสิทธิภาพเหนือ GPT-4o

Microsoft ประกาศเปิดตัว Fara-7B โมเดลภาษาขนาด 7 พันล้านพารามิเตอร์ที่ออกแบบมาเพื่อเป็น Computer Use Agent หรือ CUA โดยเฉพาะ ซึ่งสามารถทำงานบนเครื่องผู้ใช้โดยตรงโดยไม่ต้องพึ่งคลาวด์ ช่วยเพิ่มความเป็นส่วนตัวและลดความล่าช้า เหมาะสำหรับองค์กรที่ต้องการให้ AI จัดการงานสำคัญโดยไม่ให้ข้อมูลหลุดออกนอกระบบ ตามรายงานจาก Microsoft Research เมื่อวันที่ 24 พฤศจิกายน 2025
Fara-7B ทำงานคล้ายผู้ใช้จริง โดยมองหน้าจอผ่านสกรีนช็อต แล้วคลิกหรือพิมพ์ตามพิกเซลที่เห็น โดยไม่ใช้ accessibility tree แบบเบราว์เซอร์สำหรับ screen reader ซึ่งช่วยให้โมเดลรับมือกับเว็บโค้ดซับซ้อนหรือซ่อนรายละเอียดได้ดีขึ้น ด้านความปลอดภัยใช้แนวคิด pixel sovereignty ตามคำของ Yash Lara จาก Microsoft Research โดยประมวลผลภาพหน้าจอและข้อมูล reasoning ทั้งหมดบนอุปกรณ์

ผลทดสอบบน WebVoyager แสดงให้เห็นว่า Fara-7B ทำคะแนนได้ 73.5% แซง GPT-4o ที่ 65.1% และ UI-TARS-1.5-7B ที่ 66.4% โดยใช้ขั้นตอนเฉลี่ยเพียง 16 สเต็ป เทียบกับคู่แข่งที่ต้องใช้เกือบ 41 สเต็ป ถือเป็นข้อได้เปรียบด้านความเร็วและประสิทธิภาพ โดย VentureBeat ชี้ว่ามันให้ cost-accuracy tradeoff ที่ดีที่สุดในกลุ่ม CUA
แม้จะมีประสิทธิภาพสูง แต่ Microsoft เตือนถึงความเสี่ยง เช่น hallucination หรือคลาดเคลื่อนในงานซับซ้อน เพื่อรับมือ ทีมวิจัยฝัง Critical Points ที่ให้โมเดลหยุดขออนุมัติจากผู้ใช้ก่อนทำการส่งอีเมลหรือธุรกรรมที่ย้อนกลับไม่ได้ ช่วยป้องกันข้อผิดพลาดร้ายแรง
การออกแบบให้ปลอดภัยแต่ไม่รบกวนผู้ใช้เป็นความท้าทายหลัก โดย Lara ระบุว่า UI อย่าง Magentic-UI ช่วยให้ผู้ใช้แทรกแซงได้ตรงจุด ลดปัญหา approval fatigue จากการถามยืนยันบ่อยเกินไป ซึ่งเป็นส่วนหนึ่งของแนวโน้มเอเจนต์ AI ที่เน้นความสามารถสูงแม้โมเดลขนาดเล็ก







