AI ตัวใหม่ของ OpenAI “o3” ไม่เป๊ะอย่างที่คุยไว้! คะแนนเบนช์มาร์กลดฮวบจากที่บริษัทบอก

ช่วงนี้ใครที่ติดตามวงการ AI คงจะได้ยินข่าวเกี่ยวกับโมเดลใหม่จาก OpenAI ที่มีชื่อว่า o3 กันมาบ้าง ซึ่งแรกเริ่มเดิมทีทางบริษัทออกมาบอกว่าเจ้า o3 เนี่ยเจ๋งสุดๆ ฉลาดกว่าโมเดลก่อนๆ แบบก้าวกระโดด และจะเป็นก้าวต่อไปของ GPT-5 หรือมากกว่านั้น แต่ล่าสุดมีข้อมูลหลุดออกมาว่า ผลการทดสอบบนเบนช์มาร์ก (benchmark) จริงๆ แล้วกลับ ไม่สูง อย่างที่ OpenAI โฆษณาไว้

โดยข้อมูลนี้มาจากเอกสารภายในที่หลุดออกมาซึ่งเผยว่า o3 ได้คะแนนเพียง 8.7 จาก 32 บนการประเมินของ MMLU (Massive Multitask Language Understanding) ซึ่งเป็นมาตรฐานการทดสอบความเข้าใจภาษาที่ใช้กันอย่างแพร่หลายในการเปรียบเทียบความเก่งของโมเดล AI ต่างๆ

ขอเทียบให้เห็นภาพง่ายๆ ว่า GPT-4 ที่เปิดตัวไปเมื่อปีก่อน เคยได้คะแนนสูงถึง 86.4% ใน MMLU ซึ่งต่างกับ o3 ที่ได้แค่ประมาณ 27% เท่านั้น! ต่างกันแบบชัดเจนมากๆ ทั้งที่ OpenAI ออกมาบอกว่า o3 คือโมเดลที่ดีที่สุดที่เคยพัฒนา

แล้วทำไมถึงเป็นแบบนั้น?
จากรายงานของ TechCrunch และการวิเคราะห์ของนักวิจัยหลายฝ่าย มีข้อสันนิษฐานว่า OpenAI อาจพยายามลดความคาดหวังของตลาดไว้ก่อน เพื่อควบคุมภาพลักษณ์ของบริษัท หรือไม่ก็อาจกำลังพัฒนาเวอร์ชันที่สมบูรณ์กว่า o3 อยู่แล้ว (ซึ่งอาจเป็น GPT-5 ที่แท้จริง)

อย่างไรก็ตาม สิ่งที่ทำให้เกิดการวิพากษ์วิจารณ์อย่างมากคือการที่บริษัทให้ข้อมูลที่ดูเหมือนจะ “อวยตัวเองเกินจริง” แล้วพอมีข้อมูลจริงหลุดออกมาก็เลยดูไม่น่าเชื่อถือเท่าเดิม

ประเด็นอีกอย่างคือ o3 นี้ยังอยู่ในขั้นทดลอง บางฟีเจอร์อาจยังไม่เสถียร หรือยังไม่เปิดให้ใช้เต็มที่ แต่คนทั่วไปก็เริ่มได้ลองผ่าน API และในบริการต่างๆ อย่าง ChatGPT Plus แล้ว ดังนั้นใครที่เคยลองใช้อาจจะเริ่มรู้สึกได้ว่า “ทำไมดูไม่ฉลาดเท่าที่บอกไว้?” ก็ไม่ต้องแปลกใจ

ในวงการ AI ตอนนี้มีการแข่งขันกันดุเดือด ทั้ง Google, Anthropic, Meta, และอีกหลายบริษัทต่างก็เร่งพัฒนาโมเดลใหม่ๆ ซึ่งแน่นอนว่า OpenAI ไม่สามารถชะลอตัวได้เลย แต่การสื่อสารที่คลุมเครือหรือเกินจริงอาจกลายเป็นดาบสองคม

สิ่งที่คนทั่วไปควรเรียนรู้จากเหตุการณ์นี้ก็คือ

  1. อย่าเชื่อโฆษณา 100%

  2. ควรดูผลเบนช์มาร์กจากหลายแหล่ง

  3. ถ้าเป็นนักพัฒนา ควรทดสอบโมเดลด้วยตัวเองก่อนเอาไปใช้งานจริง

สุดท้ายนี้ โมเดล o3 ของ OpenAI อาจไม่ได้แย่ แต่ก็อาจยังไม่ใช่สุดยอด AI อย่างที่เราคาดหวัง ซึ่งก็เป็นเรื่องธรรมดาในวงการเทคโนโลยีที่มีทั้งช่วงพีคและช่วงแกว่ง

ไว้ถ้ามีข้อมูลอัปเดตหรือเวอร์ชันใหม่ออกมาอีก จะมาเล่าให้ฟังแบบชัดๆ เหมือนเดิมนะ!

อัพเดท! ก่อนใคร

เรื่องราวเจ๋งๆ ล้ำๆ สดใหม่ถึงคุณโดยตรงเพียงแค่กรอก Email ไว้เท่านั้น

This field is required.

รายละเอียดเงื่อนไขที่ privacy policy.

Hot this 48 hr.

เมื่อ OpenAI มอง “ความสัมพันธ์มนุษย์-AI” สูงส่งเกินจริง แต่ผู้คนอินกับแชทบอทไปไกลแล้ว

ความสัมพันธ์ระหว่างคนกับ AI ไม่ได้เป็นเรื่องอนาคตอีกต่อไป—มันเกิดขึ้นตรงหน้า OpenAI เพิ่งโพสต์บล็อกโดย Joanne Jang ชี้แจงว่าบริษัทกำลังออกแบบโมเดลให้ “ดูอบอุ่นแต่ไม่แกล้งทำเป็นมีจิตวิญญาณ”...

เอเชี่ยนพาราเกมส์ ทีมชาติไทยคว้าอันดับที่7 มาครอบครองได้ อย่างสมศักดิ์ศรี

เอเชียนพาราเกมส์ ครั้งที่ 4 จัดการปิดการแข่งขันอย่างเรียบง่าย โดยใช้การแสดงที่สะท้อนถึงวัฒนธรรมเป็นหลักขณะที่ทัพนักกีฬาไทยคว้า 27 เหรียญทอง จบอันดับ 7...

ย้อนอดีตจีน: สำรวจสิ่งที่เก่าแก่กว่าราชวงศ์เซี่ยและตำนานอันน่าตื่นเต้น

สวัสดีเพื่อน ๆ ชาวอ่านทุกคน วันนี้เรามาพูดคุยเรื่องราวประวัติศาสตร์จีนในสมัยก่อนที่หลายคนอาจยังไม่รู้จักกันมากนัก “ราชวงศ์เซี่ย” นั่นเองที่หลายคนมองว่าเป็นราชวงศ์แรกของจีนตามบันทึกในประวัติศาสตร์ แต่จริง ๆ แล้ว...

ทรัมป์เตรียมขึ้นภาษีนำเข้าเหล็ก-อะลูมิเนียม 50% ช่วยดีล Nippon-US Steel กระตุ้นอุตสาหกรรมในประเทศ

ประธานาธิบดี Trump ประกาศแผนเพิ่มภาษีนำเข้าเหล็กและอลูมิเนียมเป็นสองเท่าจาก 25% เป็น 50% ในช่วงที่เขาเดินทางไปเยือนโรงงาน US Steel...

Topics

Trump administration ได้ $10 billion จากดีล TikTok จริงไหม สรุปข่าวร้อนที่คนอเมริกายังถกกันหนัก

ถ้าใครตามข่าววงการเทคโนโลยีและการเมืองสหรัฐฯ ในช่วงต้นปี 2026 นี้ น่าจะไม่มีข่าวไหน "พีค" ไปกว่าเรื่องที่ Trump administration...

Meta เตรียมปลดพนักงานครั้งใหญ่ 20%? เจาะเบื้องลึก “ล้างบ้าน” เคลียร์ทางให้สมรภูมิ AI ปี 2026

ช่วงนี้ใครอยู่ในวงการเทคบอกเลยว่ามีหนาวๆ ร้อนๆ กันแน่นอน เพราะข่าวลือหนาหูจากแหล่งข่าววงในที่ Reuters รายงานออกมาทำเอาสะเทือนทั้ง Silicon Valley เมื่อ...

MacBook Neo ซ่อมง่ายที่สุดในรอบ 14 ปี! หรือ Apple จะเลิกแกงช่างซ่อมแล้ว? สรุปสเปกและข้อเท็จจริงที่ควรรู้

ถ้าพูดถึง MacBook เมื่อก่อน ภาพจำของทุกคนคือ "สวยแต่รูป จูบ (ซ่อม) ยาก" ใช่ไหมครับ?...

TikTok จับมือ Apple Music ฟังเพลงเต็มในแอปได้แล้ว! ไม่ต้องสลับแอปให้เสียฟีล

สายไถฟีด TikTok น่าจะเคยเป็นเหมือนกันใช่ไหมครับ? เวลาเจอเพลงที่มันโดนใจ เพลงที่กำลังไวรัล หรือเพลงที่ศิลปินที่เราชอบเพิ่งปล่อยออกมา แต่อารมณ์มันดันสะดุดเพราะใน TikTok มีให้ฟังแค่ท่อนสั้นๆ...

Related Articles

Popular Categories

spot_img