ArXiv ประกาศใครใช้ AI ปั่นงานส่งโดยไม่ตรวจสอบ เจอบทลงโทษแบนยาว 1 ปีเต็ม
ความน่าเชื่อถือทางวิทยาศาสตร์ถูกคุกคามด้วยข้อมูลไม่ถูกต้อง

ArXiv แหล่งรวมผลงานวิจัยก่อนรับการประเมินจากผู้ทรงคุณวุฒิที่ชาวคอมพิวเตอร์และคณิตศาสตร์นิยมใช้แชร์ข้อมูลกัน ล่าสุดได้ออกมาประกาศมาตรการขั้นเด็ดขาดเพื่อจัดการกับเหล่านักวิจัยสายกดก๊อบปี้วางที่ปล่อยให้โมเดลภาษาขนาดใหญ่ทำงานแทนทั้งหมดโดยไม่มีการกลั่นกรอง จนทำให้แพลตฟอร์มเนืองนองไปด้วยงานวิจัยไร้คุณภาพที่ปั่นขึ้นด้วยระบบปัญญาประดิษฐ์
ความเคลื่อนไหวล่าสุดนี้เกิดขึ้นเมื่อ Thomas Dietterich ประธานแผนกวิทยาศาสตร์คอมพิวเตอร์ของ ArXiv ออกมาแถลงผ่านโลกออนไลน์แบบตรงไปตรงมาว่า หากตรวจพบหลักฐานที่ปฏิเสธไม่ได้ว่าผู้เขียนปล่อยปละละเลยผลลัพธ์ที่ได้มาจากโมเดลภาษาขนาดใหญ่ ทางแพลตฟอร์มก็จะไม่สามารถเชื่อถืออะไรในเอกสารฉบับนั้นได้อีกต่อไป และผู้สร้างสรรค์ผลงานชิ้นนั้นจะต้องรับกรรมไปตามระเบียบ
สำหรับหลักฐานมัดตัวที่ว่านี้รวมไปถึงพฤติกรรมสุดโป๊ะอย่างการอ้างอิงเอกสารวิจัยที่ไม่มีอยู่จริงในโลก หรือที่เรียกว่าอาการหลอนของระบบประมวลผล ตลอดจนความสะเพร่าขั้นสุดที่มีข้อความแช็ตโต้ตอบกับปัญญาประดิษฐ์หลุดคาอยู่ในเนื้อหา หากโดนจับได้แบบคาหนังคาเขา ทีมงานจะลงโทษด้วยการสั่งแบนไม่ให้ส่งผลงานเข้าสู่ระบบของ ArXiv เป็นเวลา 1 ปีเต็ม และหลังจากพ้นโทษแล้ว ผลงานชิ้นต่อไปที่จะนำมาลงก็ต้องผ่านการยอมรับจากเวทีประเมินผลงานวิจัยที่น่าเชื่อถือมาก่อนเท่านั้น
อย่างไรก็ตาม กฎเหล็กนี้ไม่ได้ห้ามใช้เครื่องมือช่วยเหลืออัจฉริยะในการทำงานเสียทีเดียว เพียงแต่ตัวผู้เขียนต้องแสดงความรับผิดชอบต่อเนื้อหาทั้งหมด 100% ไม่ว่าข้อความเหล่านั้นจะถูกสร้างขึ้นมาด้วยวิธีใดก็ตาม ดังนั้นหากนักวิจัยเลือกที่จะคัดลอกข้อความที่มีการใช้ภาษาไม่เหมาะสม เนื้อหาละเมิดลิขสิทธิ์ มีความคลาดเคลื่อน หรือข้อมูลบิดเบือนจากระบบส่งต่อเข้ามาโดยตรง ผู้นำเสนอผลงานก็ต้องเป็นผู้รับผิดชอบต่อความเสียหายที่เกิดขึ้นทั้งหมด
กระบวนการตรวจสอบและลงโทษนี้จะเป็นระบบแบบตรวจพบครั้งเดียวลงดาบทันที โดยจะต้องผ่านการบันทึกข้อมูลจากผู้ดูแลระบบและได้รับการยืนยันหลักฐานอย่างแน่นหนาจากประธานแผนกก่อนจะสั่งลงโทษอย่างเป็นทางการ แต่ทางผู้ส่งผลงานก็ยังมีสิทธิ์ยื่นอุทธรณ์เพื่อแก้ต่างได้เช่นกัน ซึ่งนี่ถือเป็นก้าวสำคัญหลังจากที่คลังข้อมูลแห่งนี้เพิ่งประกาศแยกตัวออกจากการบริหารของ Cornell เพื่อดำเนินการในฐานะองค์กรไม่แสวงหากำไรที่เป็นอิสระอย่างเต็มตัวในการระดมทุนมาต่อสู้กับปัญหาข้อมูลขยะเหล่านี้
การเข้มงวดในครั้งนี้มีชนวนเหตุมาจากผลวิจัยที่พบว่า ปัญหาการกุเรื่องเอกสารอ้างอิงปลอมในวงการวิจัยทางการแพทย์และชีวภาพกำลังพุ่งสูงขึ้นอย่างน่าใจหาย ซึ่งปฏิเสธไม่ได้เลยว่าเป็นผลกระทบมาจากการเติบโตของโมเดลภาษาอัจฉริยะที่ผู้คนเข้าถึงง่าย ซึ่งอันที่จริงแล้วก็ไม่ใช่แค่แวดวงนักวิทยาศาสตร์เท่านั้นที่โดนจับโป๊ะเรื่องนี้ แต่หน่วยงานสายวิชาการทั่วโลกต่างก็กำลังปวดหัวกับการแยกแยะความจริงออกจากสิ่งที่สร้างขึ้นโดยระบบอัตโนมัติเช่นเดียวกัน





