เทคโนโลยี

Apple เร่งเครื่องอัปเกรด Siri ด้วยพลัง Gemini

เตรียมเปลี่ยน iPhone ให้ฉลาดกว่าที่เคย

โลกของเทคโนโลยีในยุคนี้คงหนีไม่พ้น Generative AI ไปได้ แต่สำหรับ Apple ดูเหมือนจะก้าวตามหลังคนอื่นอยู่สักหน่อย การอัปเกรด Siri ให้ฉลาดขึ้นถูกเลื่อนมาหลายครั้งตั้งแต่ปี 2024 แต่ข่าวดีคือภายในปีนี้จะได้เห็นการรวมร่างกันระหว่างผู้ช่วยอัจฉริยะกับ Gemini ของ Google อย่างแน่นอน ก่อนจะถึงงาน Worldwide Developers Conference ทางค่ายกำลังเร่งมืออย่างหนักเพื่อยัดความฉลาดระดับเทพลงในโน้ตบุ๊กและสมาร์ทโฟน แต่ผลลัพธ์ที่ได้อาจจะไม่เป็นไปตามที่หลายคนคาดหวังไว้

แม้ Apple จะเคยให้ความสำคัญกับความเป็นส่วนตัวด้วยการรัน AI บนเครื่องโดยตรงมาตลอด แต่รายงานล่าสุดชี้ให้เห็นว่า Siri โฉมใหม่ที่รวม Gemini จะต้องพึ่งพาพลังจาก Google และ Nvidia บนคลาวด์อย่างหลีกเลี่ยงไม่ได้ ซึ่งถือเป็นการปรับทิศทางครั้งสำคัญจากการเน้นใช้ AI เฉพาะบนตัวเครื่องเพียงอย่างเดียว ความจริงคือโน้ตบุ๊กและสมาร์ทโฟนยุคนี้ แม้จะมีชิปที่ออกแบบมาเพื่อ AI โดยเฉพาะ แต่ก็ยังขาด RAM และพลังการประมวลผลที่จะรับมือกับโมเดลขนาดใหญ่ได้ด้วยตัวเอง

การนำโมเดล AI ขนาดใหญ่มาใส่ในมือถือถือเป็นโจทย์ที่ยากมาก เพราะโมเดลที่รันบนอุปกรณ์พกพาต้องมีขนาดเล็กและถูกบีบอัดจนความแม่นยำลดลง ต่างจากโมเดลระดับทริลเลียนพารามิเตอร์ที่รันบนคลาวด์ของ Google อย่างสิ้นเชิง ในขณะที่ Google เองบน Android ก็ยังไม่พยายามรันแชทบอทแบบสนทนาบนตัวเครื่อง แต่จะส่งข้อมูลขึ้นคลาวด์โดยตรง ดังนั้น Apple จึงต้องใช้วิธี distillation หรือการกลั่นโมเดลให้เล็กลงเพื่อให้เรียนรู้และเลียนแบบความฉลาดจากโมเดลใหญ่ได้

apple-google-gemini-siri-on-devices

หลังทำข้อตกลงกับ Google ทาง Apple ก็เริ่มงานทันที แต่การยัดโมเดล Gemini ลงในโครงสร้างพื้นฐาน Private Cloud Compute ที่ใช้ชิปตระกูล M ของตัวเองนั้นไม่ง่ายเลย รายงานระบุว่าระบบของ Apple ยังมีปัญหาในการรันโมเดลขนาดใหญ่ของ Google ส่งผลให้การประมวลผลงานที่ซับซ้อนจะต้องถูกส่งต่อไปยังโครงสร้างพื้นฐานคลาวด์ของ Google แทน แต่ Apple ก็เลือกที่จะไม่ใช้ชิป TPU ของ Google โดยตรง

เพื่อรักษาภาพลักษณ์เรื่องความเป็นส่วนตัว Apple ได้ตกลงร่วมมือกับ Nvidia เพื่อใช้แพลตฟอร์ม Confidential Computing ซึ่งช่วยให้ข้อมูลถูกเข้ารหัสไว้ใน GPU ของ Nvidia ในขณะที่ประมวลผลบนคลาวด์ วิธีนี้ทำให้ Apple ยังสามารถรักษาความเป็นส่วนตัวและใช้แบรนด์ Private Cloud Compute ของตัวเองต่อไปได้ แม้จะเบื้องหลังจะใช้เทคโนโลยีของพันธมิตรรายอื่นมาเสริมทัพก็ตาม

ผู้ใช้งานทั่วไปอาจไม่รู้ตัวเลยว่าคำสั่งไหนถูกจัดการโดยเครื่อง หรือคำสั่งไหนถูกส่งขึ้นคลาวด์ เพราะระบบพยายามทำให้ทุกอย่างดูลื่นไหลไร้รอยต่อที่สุด อย่างไรก็ตาม ความล่าช้าในการสร้างคำตอบจากโมเดลขนาดใหญ่บวกกับระบบเข้ารหัสที่ซับซ้อนของ Nvidia อาจทำให้สัมผัสได้ถึงความหน่วงบ้างในบางจังหวะ

ที่มา
Arstechnica

Artherlus

แค่คนทั่วไปที่หลงใหลในวงการไอที
Back to top button