AI ตัวใหม่ของ OpenAI “o3” ไม่เป๊ะอย่างที่คุยไว้! คะแนนเบนช์มาร์กลดฮวบจากที่บริษัทบอก

ช่วงนี้ใครที่ติดตามวงการ AI คงจะได้ยินข่าวเกี่ยวกับโมเดลใหม่จาก OpenAI ที่มีชื่อว่า o3 กันมาบ้าง ซึ่งแรกเริ่มเดิมทีทางบริษัทออกมาบอกว่าเจ้า o3 เนี่ยเจ๋งสุดๆ ฉลาดกว่าโมเดลก่อนๆ แบบก้าวกระโดด และจะเป็นก้าวต่อไปของ GPT-5 หรือมากกว่านั้น แต่ล่าสุดมีข้อมูลหลุดออกมาว่า ผลการทดสอบบนเบนช์มาร์ก (benchmark) จริงๆ แล้วกลับ ไม่สูง อย่างที่ OpenAI โฆษณาไว้

โดยข้อมูลนี้มาจากเอกสารภายในที่หลุดออกมาซึ่งเผยว่า o3 ได้คะแนนเพียง 8.7 จาก 32 บนการประเมินของ MMLU (Massive Multitask Language Understanding) ซึ่งเป็นมาตรฐานการทดสอบความเข้าใจภาษาที่ใช้กันอย่างแพร่หลายในการเปรียบเทียบความเก่งของโมเดล AI ต่างๆ

ขอเทียบให้เห็นภาพง่ายๆ ว่า GPT-4 ที่เปิดตัวไปเมื่อปีก่อน เคยได้คะแนนสูงถึง 86.4% ใน MMLU ซึ่งต่างกับ o3 ที่ได้แค่ประมาณ 27% เท่านั้น! ต่างกันแบบชัดเจนมากๆ ทั้งที่ OpenAI ออกมาบอกว่า o3 คือโมเดลที่ดีที่สุดที่เคยพัฒนา

แล้วทำไมถึงเป็นแบบนั้น?
จากรายงานของ TechCrunch และการวิเคราะห์ของนักวิจัยหลายฝ่าย มีข้อสันนิษฐานว่า OpenAI อาจพยายามลดความคาดหวังของตลาดไว้ก่อน เพื่อควบคุมภาพลักษณ์ของบริษัท หรือไม่ก็อาจกำลังพัฒนาเวอร์ชันที่สมบูรณ์กว่า o3 อยู่แล้ว (ซึ่งอาจเป็น GPT-5 ที่แท้จริง)

อย่างไรก็ตาม สิ่งที่ทำให้เกิดการวิพากษ์วิจารณ์อย่างมากคือการที่บริษัทให้ข้อมูลที่ดูเหมือนจะ “อวยตัวเองเกินจริง” แล้วพอมีข้อมูลจริงหลุดออกมาก็เลยดูไม่น่าเชื่อถือเท่าเดิม

ประเด็นอีกอย่างคือ o3 นี้ยังอยู่ในขั้นทดลอง บางฟีเจอร์อาจยังไม่เสถียร หรือยังไม่เปิดให้ใช้เต็มที่ แต่คนทั่วไปก็เริ่มได้ลองผ่าน API และในบริการต่างๆ อย่าง ChatGPT Plus แล้ว ดังนั้นใครที่เคยลองใช้อาจจะเริ่มรู้สึกได้ว่า “ทำไมดูไม่ฉลาดเท่าที่บอกไว้?” ก็ไม่ต้องแปลกใจ

ในวงการ AI ตอนนี้มีการแข่งขันกันดุเดือด ทั้ง Google, Anthropic, Meta, และอีกหลายบริษัทต่างก็เร่งพัฒนาโมเดลใหม่ๆ ซึ่งแน่นอนว่า OpenAI ไม่สามารถชะลอตัวได้เลย แต่การสื่อสารที่คลุมเครือหรือเกินจริงอาจกลายเป็นดาบสองคม

สิ่งที่คนทั่วไปควรเรียนรู้จากเหตุการณ์นี้ก็คือ

  1. อย่าเชื่อโฆษณา 100%

  2. ควรดูผลเบนช์มาร์กจากหลายแหล่ง

  3. ถ้าเป็นนักพัฒนา ควรทดสอบโมเดลด้วยตัวเองก่อนเอาไปใช้งานจริง

สุดท้ายนี้ โมเดล o3 ของ OpenAI อาจไม่ได้แย่ แต่ก็อาจยังไม่ใช่สุดยอด AI อย่างที่เราคาดหวัง ซึ่งก็เป็นเรื่องธรรมดาในวงการเทคโนโลยีที่มีทั้งช่วงพีคและช่วงแกว่ง

ไว้ถ้ามีข้อมูลอัปเดตหรือเวอร์ชันใหม่ออกมาอีก จะมาเล่าให้ฟังแบบชัดๆ เหมือนเดิมนะ!

อัพเดท! ก่อนใคร

เรื่องราวเจ๋งๆ ล้ำๆ สดใหม่ถึงคุณโดยตรงเพียงแค่กรอก Email ไว้เท่านั้น

This field is required.

รายละเอียดเงื่อนไขที่ privacy policy.

Hot this 48 hr.

จัดเต็ม! Tesla แจกฟรี Supercharging 1 ปี สำหรับ Model 3 Premium & Performance… คุ้มจริงหรือแค่การตลาด?

เอาล่ะครับทุกคน ใครที่กำลังเล็งรถยนต์ไฟฟ้า (EV) ตัวตึงอย่าง Tesla Model 3 อยู่ ตอนนี้บอกเลยว่า...

รีวิวจัดเต็ม Sony FE 100-400mm F4.5 GM OSS x Sony A7R VI คอมโบปีศาจสายส่องนกและกีฬา สเปกโหดจนถ่ายท่ายากให้เป็นเรื่องง่าย!

ถ้าคุณเป็นคนหนึ่งที่รักการถ่ายภาพนก สัตว์ป่า มอเตอร์สปอร์ต หรือกีฬาในสนาม คุณจะรู้ซึ้งเลยว่างานสายนี้มันท้าทายขนาดไหน ตัวแบบไม่เคยอยู่นิ่ง รันเวย์ไกลเป็นกิโล แถมมีจังหวะให้คุณกดชัตเตอร์พัง ๆ...

หมดเวลาสายเทา! Spotify จับมือ Universal Music ปลดล็อกฟีเจอร์ AI Cover และ Remix แบบถูกลิขสิทธิ์ จุดเปลี่ยนครั้งใหญ่ของคนชอบแต่งเพลง

กลายเป็นข่าวทอล์กออฟเดอะทาวน์ที่ทำเอาทั้งวงการเพลงและสายเทคต้องหันมามองพร้อมกัน เมื่อยักษ์ใหญ่แพลตฟอร์มสตรีมมิ่งอย่าง Spotify และค่ายเพลงระดับโลกอย่าง Universal Music Group (UMG) ได้ประกาศปิดดีลลิขสิทธิ์ครั้งประวัติศาสตร์...

SpaceX IPO ใครได้ประโยชน์ที่สุด? ทำไมคำตอบอาจเป็น Elon Musk และคนใกล้ตัวมากกว่านักลงทุนทั่วไป

การ IPO ของ SpaceX กลายเป็นหนึ่งในดีลที่ถูกจับตามองมากที่สุดในโลกเทคโนโลยีและการเงิน เพราะนี่ไม่ใช่แค่บริษัทจรวดที่กำลังจะเข้าตลาดหุ้น แต่เป็นบริษัทที่รวมหลายความฝันใหญ่ของ Elon Musk...

อย่าเพิ่งตกใจ! Google ยังไม่ลดพื้นที่ Gmail เหลือ 5GB ถาวร แค่แอบทดสอบเงื่อนไขใหม่สำหรับไอดีใหม่บางกลุ่ม

ช่วงนี้ใครที่ไถฟีดโซเชียลบ่อย ๆ น่าจะผ่านตากับข่าวลือหนาหูที่ทำเอาเสียวสันหลังวาบว่า "Google กำลังจะปรับลดพื้นที่ Gmail ฟรีจาก 15GB เหลือแค่...

Topics

หมดเวลาสายเทา! Spotify จับมือ Universal Music ปลดล็อกฟีเจอร์ AI Cover และ Remix แบบถูกลิขสิทธิ์ จุดเปลี่ยนครั้งใหญ่ของคนชอบแต่งเพลง

กลายเป็นข่าวทอล์กออฟเดอะทาวน์ที่ทำเอาทั้งวงการเพลงและสายเทคต้องหันมามองพร้อมกัน เมื่อยักษ์ใหญ่แพลตฟอร์มสตรีมมิ่งอย่าง Spotify และค่ายเพลงระดับโลกอย่าง Universal Music Group (UMG) ได้ประกาศปิดดีลลิขสิทธิ์ครั้งประวัติศาสตร์...

SpaceX IPO ใครได้ประโยชน์ที่สุด? ทำไมคำตอบอาจเป็น Elon Musk และคนใกล้ตัวมากกว่านักลงทุนทั่วไป

การ IPO ของ SpaceX กลายเป็นหนึ่งในดีลที่ถูกจับตามองมากที่สุดในโลกเทคโนโลยีและการเงิน เพราะนี่ไม่ใช่แค่บริษัทจรวดที่กำลังจะเข้าตลาดหุ้น แต่เป็นบริษัทที่รวมหลายความฝันใหญ่ของ Elon Musk...

Google โฉมใหม่! เตรียมยัดโฆษณา AI ลง Search ค้นหาอะไรก็เจอสปอนเซอร์แบบคุยรู้เรื่อง (เนียนจนแยกยาก!)

เตรียมตัวรับมือกันให้ดี เพราะ Google Search ที่เราคุ้นเคยกำลังจะเปลี่ยนไปแบบกู่ไม่กลับ! ยุคนี้ช่องค้นหาข้อมูลแบบเดิม ๆ กำลังจะกลายเป็นอดีต เพราะ...

LinkedIn เอาจริง! สั่งทุบ Reach โพสต์ “AI Slop” แฉหมดเปลือกเทคนิคเขียนยังไงให้รอด ไม่โดนปิดกั้น

เคยเป็นไหม? ช่วงหลัง ๆ มานี้เปิด LinkedIn ขึ้นมาทีไร ไถฟีดไปทางไหนก็เจอแต่โพสต์หน้าตาคล้าย ๆ กันไปหมด...

Related Articles

Popular Categories

spot_img