Meta ยอมรับใช้ชุดข้อมูล Books3 ที่มีลิขสิทธิ์ในการฝึก AI

แต่อ้างว่าไม่เกี่ยวข้องกับการละเมิดลิขสิทธิ์

Artherlus14 January 2024

73 น้อยกว่า 1 นาที

Meta ยอมรับใช้ชุดข้อมูล Books3 ที่มีลิขสิทธิ์ในการฝึก AI

Meta ยอมรับใช้ชุดข้อมูล Books3 ซึ่งเป็นชุดข้อมูลที่มีลิขสิทธิ์ในการฝึกอบรมโมเดลภาษาขนาดใหญ่ (LLM) Llama 1 และ Llama 2 ของบริษัท อย่างไรก็ตาม Meta ปฏิเสธการละเมิดลิขสิทธิ์ โดยอ้างว่าการใช้งานมีลิขสิทธิ์เพื่อฝึกอบรม LLM ไม่จำเป็นต้องได้รับความยินยอม เครดิต หรือค่าตอบแทน

ชุดข้อมูล Books3 ประกอบด้วยเนื้อหาจากหนังสือกว่า 195,000 เล่ม รวมเกือบ 37GB ไฟล์เก็บนี้สร้างขึ้นโดยนักวิจัย AI Shawn Presser ในปี 2020 เพื่อเป็นช่องทางในการจัดหาแหล่งข้อมูลที่ดีกว่าเพื่อปรับปรุงอัลกอริธึมการเรียนรู้ของเครื่อง นำไปสู่การใช้อย่างมากในการฝึกอบรม AI โดยนักวิจัยหลายคน บริษัทเทคโนโลยีขนาดใหญ่ รวมถึง Meta ได้ใช้ Books3สำหรับพัฒนาเครื่องมือ AI ของตัวเอง

ผู้เขียนกลุ่มหนึ่งยื่นฟ้อง Meta โดยกล่าวหาว่ามีการใช้เนื้อหาที่มีลิขสิทธิ์อย่างผิดกฎหมายในการพัฒนา Llama 1 และ Llama 2 เพื่อเป็นการตอบสนอง Facebook ได้กล่าวถึงนักเขียนและนักแสดงตลก Sarah Silverman ผู้เขียน Richard Kadrey และผู้ถือสิทธิ์อื่น ๆ ที่เป็นหัวหอกในการดำเนินคดีทางกฎหมาย โดยยอมรับว่า LLM ของบริษัทได้รับการฝึกโดยใช้หนังสือที่มีลิขสิทธิ์

คดีนี้อาจส่งผลกระทบที่สำคัญต่อวิธีที่บริษัทเทคโนโลยีใช้ชุดข้อมูลที่มีลิขสิทธิ์เพื่อฝึกอบรม AI หาก Meta แพ้คดี อาจเป็นสัญญาณเตือนถึงบริษัทอื่น ๆ ว่าอาจถูกฟ้องร้องสำหรับการละเมิดลิขสิทธิ์ในลักษณะเดียวกัน

ที่มา