เทคโนโลยี

ลบกำแพงภาษาด้วย Gemini 3.5 Live Translate

ไหลลื่นเหมือนคุยภาษาเดียวกัน

Google เปิดตัว Gemini 3.5 Live Translate นวัตกรรมโมเดลเสียงล่าสุดที่ถูกออกแบบมาเพื่อทำลายกำแพงภาษาให้หายไปอย่างสิ้นเชิง โดยเทคโนโลยีนี้มุ่งเน้นการแปลแบบพูดโต้ตอบกันทันทีหรือ Speech-to-Speech ที่ให้ความเป็นธรรมชาติสูงมาก ไม่ต้องคอยจังหวะหยุดพักเหมือนระบบแปลภาษาแบบเดิมที่เคยใช้งานกันมา

ความพิเศษของ Gemini 3.5 Live Translate คือความสามารถในการทำงานแบบต่อเนื่องโดยไม่ต้องรอให้ผู้พูดจบประโยค ระบบจะคอยฟังและแปลออกมาแทบจะทันทีด้วยความหน่วงที่น้อยมาก ซึ่งช่วยให้บทสนทนาเดินหน้าไปได้อย่างรวดเร็วและเป็นธรรมชาติที่สุด โมเดลนี้รองรับการแปลมากกว่า 70 ภาษาทั่วโลก ทำให้การคุยงานข้ามประเทศหรือการท่องเที่ยวในต่างแดนกลายเป็นเรื่องง่ายเพียงแค่ใช้เสียง

ระบบสามารถรักษาเอกลักษณ์ของผู้พูดเอาไว้ได้อย่างครบถ้วน ทั้งโทนเสียง จังหวะการพูด และระดับเสียงที่สะท้อนถึงอารมณ์ในขณะนั้น เพื่อให้ผู้ฟังได้รับรู้ถึงความหมายและอารมณ์จากเจ้าของภาษาอย่างแท้จริง ไม่ใช่แค่เสียงสังเคราะห์ที่ดูแข็งทื่อเหมือนหุ่นยนต์อีกต่อไป

สำหรับการใช้งานจริง Google ได้นำเทคโนโลยีนี้ไปใส่ไว้ในแอป Google Translate ทั้งบน Android และ iOS โดยผู้ใช้เพียงแค่เชื่อมต่อหูฟังก็สามารถเปิดใช้งานโหมดแปลภาษาแบบเรียลไทม์ได้ทันที ส่วนฝั่ง Android ยังเพิ่มโหมดการฟังผ่านลำโพงแนบหูที่ให้ความรู้สึกเหมือนกำลังคุยโทรศัพท์ทั่วไป ช่วยให้การสื่อสารในสถานการณ์ต่างๆ สะดวกและคล่องตัวยิ่งขึ้น

ในด้านของการทำงานร่วมกัน Google Meet ก็ได้รับอานิสงส์นี้ด้วยเช่นกัน โดยมีการขยายความสามารถให้รองรับการแปลได้มากกว่า 70 ภาษา ช่วยให้การประชุมออนไลน์ระดับโลกที่มีผู้ร่วมงานหลากหลายเชื้อชาติสามารถสื่อสารและเข้าใจตรงกันได้แบบไม่มีสะดุด อีกทั้งยังมีการฝังลายน้ำ SynthID ลงในเสียงที่แปลเพื่อความปลอดภัยและป้องกันการนำไปใช้ในทางที่ผิด

นับเป็นก้าวสำคัญของ Google ในการนำ AI มาประยุกต์ใช้เพื่อแก้ปัญหาที่เกิดขึ้นจริงในชีวิตประจำวัน ใครที่ต้องการทดลองใช้งานสามารถเริ่มได้แล้วตั้งแต่วันนี้ผ่านแอปพลิเคชันหรือแพลตฟอร์มที่รองรับ เพื่อสัมผัสกับประสบการณ์การแปลภาษาที่ชาญฉลาดและไหลลื่นกว่าที่เคยสัมผัสมาบนสมาร์ตโฟนหรือโน้ตบุ๊กคู่ใจ

ที่มา
Google

Artherlus

แค่คนทั่วไปที่หลงใหลในวงการไอที
Back to top button