เมื่อ ‘คะแนนสอบ’ หลอกเราไม่ได้อีกต่อไป: เบื้องหลังการทลายกำแพง Benchmark ของเหล่า AI Agent
📌 TL;DR ทีมนักวิจัยจาก Berkeley เผยความลับว่าทำไม AI Agent ถึงดูฉลาดเกินจริงในบททดสอบเดิมๆ พร้อมเสนอมาตรฐานใหม่ที่วัดความเก่งได้แบบ ‘ของจริง’ ไม่ใช่แค่การท่องจำคำตอบ 📖 เนื้อหาแบบเข้าใจง่าย ลองนึกภาพดูนะครับ… ถ้าคุณกำลังเตรียมสอบเข้ามหาวิทยาลัย แต่แทนที่จะอ่านตำรา คุณกลับใช้วิธี ‘จำข้อสอบเก่า’ มาตอบเป๊ะๆ ทุกตัวอักษร ผลลัพธ์ที่ได้คือคะแนนเต็มร้อย! แต่ถามว่าคุณมีความรู้จริงๆ ไหม? คำตอบคือ ‘ไม่เลย’ นี่คือสิ่งที่กำลังเกิดขึ้นในโลกของ AI Agent ครับ! ล่าสุดทีมนักวิจัยจาก…