Google เผยฟีเจอร์ใหม่ Gemini Live สั่งการด้วยเสียงและภาพผ่านกล้องได้
เตรียมเปิดให้ใช้งานปลายปีนี้สำหรับสมาชิก Gemini Advanced
Google เปิดตัวฟีเจอร์ใหม่ Gemini Live กำหนดปล่อยให้ใช้งานปลายปีนี้สำหรับสมาชิก Gemini Advanced ฟีเจอร์นี้จะมอบประสบการณ์ที่เป็นธรรมชาติและโต้ตอบได้มากขึ้นผ่านความสามารถในการสั่งการด้วยเสียง
Gemini Live จะช่วยทำให้ผู้ใช้งานสามารถที่จะโต้ตอบกับเครื่องมือได้ผ่านเสียง เพิ่มความสะดวกในการใช้งานในกรณีที่ไม่สะดวกในการพิมพ์ข้อความแบบเดิมเพื่อให้ได้ผลลัพธ์ที่ต้องการ ขณะเดียวกันตัวเครื่องมือยังมีเสียงให้เลือกในการตอบกลับกว่า 10 แบบ
อย่างไรก็ตาม Gemini Live ไม่ได้จำกัดอยู่แค่การตอบกลับด้วยเสียงเพียงอย่างเดียว แต่ผู้ใช้งานสามารถเปิดกล้องและถามสิ่งที่อยู่ตรงหน้าได้แบบเรียลไทม์ อย่างเช่นการถามส่วนประกอบของลำโพงว่าส่วนที่เราไม่ทราบคืออะไร หรือแม้กระทั่งถามสิ่งที่ลึกขึ้นไปอย่างการปรับปรุงการทำงานของโค้ดที่ใช้งาน
นอกจากนี้ยังสามารถที่จะเพิ่มกิจกรรมลงใน Google Calendar ของผู้ใช้งานได้ ในกรณีที่กล้องเลื่อนไปพบกับใบกิจกรรมอย่างเช่นงานแสดงดนตรี และมีกำหนดวันที่ชัดเจน ส่งผลให้ผู้ใช้งานไม่ต้องเป็นคนมาเพิ่มรายละเอียดด้วยตัวเอง
การเปิดตัวนี้เกิดขึ้นหลังจาก OpenAI เผย GPT-4o โมเดลใหม่ สิ่งที่น่าทึ่งคือทั้ง Gemini Live และ GPT-4o ต่างมีฟีเจอร์หลักที่คล้ายคลึงกัน