เทคโนโลยี

DeepSeek V3 โมเดล AI เปิดตัวใหม่ที่ทรงพลังที่สุดจากจีน

ทำงานได้เหนือกว่าโมเดลที่ใช้งานในตอนนี้

นักวิจัย AI ของจีนได้สร้างโมเดล AI ที่ดูเหมือนจะเป็นหนึ่งในโมเดลเปิด ที่ทรงพลังที่สุดในปัจจุบัน โดยโมเดลนี้มีชื่อว่า DeepSeek V3 ซึ่งพัฒนาโดยบริษัท DeepSeek ภายใต้ใบอนุญาตที่อนุญาตให้ผู้พัฒนาสามารถดาวน์โหลดและปรับแต่งโมเดลนี้ได้สำหรับการใช้งานที่หลากหลาย รวมถึงการใช้งานเชิงพาณิชย์

DeepSeek V3 มีความสามารถในการจัดการกับงานที่เกี่ยวข้องกับข้อความหลากหลายประเภท เช่น การเขียนโค้ด การแปลภาษา และการเขียนเรียงความหรืออีเมลจากคำบรรยายที่กำหนดไว้ โมเดลนี้ได้รับการทดสอบประสิทธิภาพภายในของ DeepSeek และพบว่ามันมีประสิทธิภาพเหนือกว่าโมเดลที่สามารถดาวน์โหลดได้ทั่วไปและโมเดล AI แบบปิดที่เข้าถึงได้เฉพาะผ่าน API

ในการทดสอบเขียนโค้ดบนแพลตฟอร์ม Codeforces โมเดล DeepSeek V3 ยังสามารถทำคะแนนได้ดีกว่าโมเดลอื่น ๆ เช่น Llama 3.1 ของ Meta, GPT-4o ของ OpenAI และ Qwen 2.5 ของ Alibaba นอกจากนี้ โมเดลนี้ยังแสดงให้เห็นถึงความเหนือกว่าในการทดสอบ Aider Polyglot ซึ่งออกแบบมาเพื่อวัดความสามารถในการเขียนโค้ดใหม่ที่สามารถรวมเข้ากับโค้ดที่มีอยู่แล้ว

DeepSeek V3 มีจำนวนพารามิเตอร์รวมถึง 671 พันล้านพารามิเตอร์ โดยมี 37 พันล้านพารามิเตอร์ที่ถูกเปิดใช้งานในระหว่างการประมวลผล และได้รับการฝึกฝนจากชุดข้อมูลขนาดใหญ่ถึง 14.8 ล้านล้านโทเคน ทำให้มันมีประสิทธิภาพสูงและเป็นโมเดลโอเพ่นซอร์สที่ดีที่สุดในขณะนี้

ที่มา
TechCrunch

Artherlus

แค่คนทั่วไปที่หลงใหลในวงการไอที
Back to top button