Sunday, December 14, 2025
27.8 C
Bangkok

AI ตัวใหม่ของ OpenAI “o3” ไม่เป๊ะอย่างที่คุยไว้! คะแนนเบนช์มาร์กลดฮวบจากที่บริษัทบอก

ช่วงนี้ใครที่ติดตามวงการ AI คงจะได้ยินข่าวเกี่ยวกับโมเดลใหม่จาก OpenAI ที่มีชื่อว่า o3 กันมาบ้าง ซึ่งแรกเริ่มเดิมทีทางบริษัทออกมาบอกว่าเจ้า o3 เนี่ยเจ๋งสุดๆ ฉลาดกว่าโมเดลก่อนๆ แบบก้าวกระโดด และจะเป็นก้าวต่อไปของ GPT-5 หรือมากกว่านั้น แต่ล่าสุดมีข้อมูลหลุดออกมาว่า ผลการทดสอบบนเบนช์มาร์ก (benchmark) จริงๆ แล้วกลับ ไม่สูง อย่างที่ OpenAI โฆษณาไว้

โดยข้อมูลนี้มาจากเอกสารภายในที่หลุดออกมาซึ่งเผยว่า o3 ได้คะแนนเพียง 8.7 จาก 32 บนการประเมินของ MMLU (Massive Multitask Language Understanding) ซึ่งเป็นมาตรฐานการทดสอบความเข้าใจภาษาที่ใช้กันอย่างแพร่หลายในการเปรียบเทียบความเก่งของโมเดล AI ต่างๆ

ขอเทียบให้เห็นภาพง่ายๆ ว่า GPT-4 ที่เปิดตัวไปเมื่อปีก่อน เคยได้คะแนนสูงถึง 86.4% ใน MMLU ซึ่งต่างกับ o3 ที่ได้แค่ประมาณ 27% เท่านั้น! ต่างกันแบบชัดเจนมากๆ ทั้งที่ OpenAI ออกมาบอกว่า o3 คือโมเดลที่ดีที่สุดที่เคยพัฒนา

แล้วทำไมถึงเป็นแบบนั้น?
จากรายงานของ TechCrunch และการวิเคราะห์ของนักวิจัยหลายฝ่าย มีข้อสันนิษฐานว่า OpenAI อาจพยายามลดความคาดหวังของตลาดไว้ก่อน เพื่อควบคุมภาพลักษณ์ของบริษัท หรือไม่ก็อาจกำลังพัฒนาเวอร์ชันที่สมบูรณ์กว่า o3 อยู่แล้ว (ซึ่งอาจเป็น GPT-5 ที่แท้จริง)

อย่างไรก็ตาม สิ่งที่ทำให้เกิดการวิพากษ์วิจารณ์อย่างมากคือการที่บริษัทให้ข้อมูลที่ดูเหมือนจะ “อวยตัวเองเกินจริง” แล้วพอมีข้อมูลจริงหลุดออกมาก็เลยดูไม่น่าเชื่อถือเท่าเดิม

ประเด็นอีกอย่างคือ o3 นี้ยังอยู่ในขั้นทดลอง บางฟีเจอร์อาจยังไม่เสถียร หรือยังไม่เปิดให้ใช้เต็มที่ แต่คนทั่วไปก็เริ่มได้ลองผ่าน API และในบริการต่างๆ อย่าง ChatGPT Plus แล้ว ดังนั้นใครที่เคยลองใช้อาจจะเริ่มรู้สึกได้ว่า “ทำไมดูไม่ฉลาดเท่าที่บอกไว้?” ก็ไม่ต้องแปลกใจ

ในวงการ AI ตอนนี้มีการแข่งขันกันดุเดือด ทั้ง Google, Anthropic, Meta, และอีกหลายบริษัทต่างก็เร่งพัฒนาโมเดลใหม่ๆ ซึ่งแน่นอนว่า OpenAI ไม่สามารถชะลอตัวได้เลย แต่การสื่อสารที่คลุมเครือหรือเกินจริงอาจกลายเป็นดาบสองคม

สิ่งที่คนทั่วไปควรเรียนรู้จากเหตุการณ์นี้ก็คือ

  1. อย่าเชื่อโฆษณา 100%

  2. ควรดูผลเบนช์มาร์กจากหลายแหล่ง

  3. ถ้าเป็นนักพัฒนา ควรทดสอบโมเดลด้วยตัวเองก่อนเอาไปใช้งานจริง

สุดท้ายนี้ โมเดล o3 ของ OpenAI อาจไม่ได้แย่ แต่ก็อาจยังไม่ใช่สุดยอด AI อย่างที่เราคาดหวัง ซึ่งก็เป็นเรื่องธรรมดาในวงการเทคโนโลยีที่มีทั้งช่วงพีคและช่วงแกว่ง

ไว้ถ้ามีข้อมูลอัปเดตหรือเวอร์ชันใหม่ออกมาอีก จะมาเล่าให้ฟังแบบชัดๆ เหมือนเดิมนะ!

อัพเดท! ก่อนใคร

เรื่องราวเจ๋งๆ ล้ำๆ สดใหม่ถึงคุณโดยตรงเพียงแค่กรอก Email ไว้เท่านั้น

This field is required.

รายละเอียดเงื่อนไขที่ privacy policy.

Hot this 48 hr.

สรุปครบทุกอย่างจากงานเปิดตัว iPhone 17: iPhone Air, iPhone 17 Pro, AirPods Pro 3 และอีกเพียบ

งานกันยายนปีนี้ Apple เปิดตัวของใหม่แน่นมาก ทั้งตระกูล iPhone 17 รุ่นใหม่หมด, สมาชิกหน้าใหม่ “iPhone...

Red Alert 2 กลับมาแล้ว! เล่นบนเว็บได้เลย ไม่ต้องลงเกม ไม่ต้องวุ่นวาย ย้อนวันวาน Y2K สไตล์รถถังยิงฝน!

ถ้าพูดถึงเกมวางแผนเรียลไทม์ (RTS) ยุค 2000 ที่โคตรจะคลาสสิกและ "เวอร์วังอลังการ" ชื่อแรก ๆ ที่เกมเมอร์ยุคนั้นนึกถึงคือ...

เปรียบเทียบ Sony WH-1000XM6 กับ WH-1000XM5 และ AirPods Max หูฟังตัวไหนเหมาะกับคุณ?

ถ้าคุณกำลังมองหาหูฟังตัดเสียงรบกวนระดับพรีเมียมในปีนี้ ต้องบอกเลยว่าศึกครั้งนี้ดุเดือดมาก เพราะ Sony WH-1000XM6 เพิ่งเปิดตัวมาแบบสด ๆ ร้อน ๆ...

น้อง Surqueen นางแบบสาวไทยวัยทีนน่ารักสุดๆ คิวท์เวอร์มาก มาพร้อมผิวขาวเนียนออร่าน่าสัมผัส

สวัสดีเพื่อนๆชาว ไอทีเมามันส์ ทุกคนกลับมาพบกันอีกครั้งกับการพามาสัมผัสความน่ารักของสาวสวยวัยทีน ในครั้งเราจะพาเพื่อนๆ มารู้จักและสัมผัสความน่ารักของน้อง Surqueen นางแบบสาวไทยวัยทีนน่ารักสุดๆ คิวท์เวอร์มาก มาพร้อมผิวขาวเนียนออร่าน่าสัมผัส...

เมื่อ OpenAI มอง “ความสัมพันธ์มนุษย์-AI” สูงส่งเกินจริง แต่ผู้คนอินกับแชทบอทไปไกลแล้ว

ความสัมพันธ์ระหว่างคนกับ AI ไม่ได้เป็นเรื่องอนาคตอีกต่อไป—มันเกิดขึ้นตรงหน้า OpenAI เพิ่งโพสต์บล็อกโดย Joanne Jang ชี้แจงว่าบริษัทกำลังออกแบบโมเดลให้ “ดูอบอุ่นแต่ไม่แกล้งทำเป็นมีจิตวิญญาณ”...

Topics

Meta ยอมถอย! Facebook/IG ในยุโรป “เลือกแชร์ข้อมูลน้อยลง” ได้แล้ว! เรื่องใหญ่กว่าที่คิด คนไทยต้องรู้เพราะเป็นสัญญาณล่วงหน้า!

ช่วงนี้วงการดิจิทัลเดือดจริงอะไรจริง! โดยเฉพาะเรื่อง "ความเป็นส่วนตัว" (Privacy) ของพวกเราผู้ใช้งานอย่างเรา ๆ รอบนี้ถึงคิวพี่ใหญ่อย่าง Meta (เจ้าของ...

ศึกชิงบัลลังก์สตรีมมิ่ง! Paramount ทุ่มสุดตัว “บุกยึด” Warner Bros. Discovery ตัดหน้า Netflix ในดีล $108,000 ล้าน!

โลกบันเทิงมันส์ไม่แพ้ซีรีส์! เมื่อ Paramount Skydance ตัดสินใจเดินเกมเด็ด กดปุ่ม "บุกเต็มข้อ" ยื่นข้อเสนอซื้ออาณาจักรคอนเทนต์ยักษ์ใหญ่อย่าง Warner...

ช็อกวงการ! Google & Apple จับมือกันจริงจัง ทำให้ “การย้ายค่ายมือถือ” ง่ายขึ้นแบบโคตรเนียน ไม่ต้องปวดหัวอีกต่อไป!

Google กับ Apple สองคู่แข่งตลอดกาลที่ปกติแข่งกันไฟแลบ อยู่คนละฝั่งค่ายมือถือ คราวนี้ดันหันมาจับมือกันแบบจริงจัง ชนิดที่หลายคนถึงกับอึ้ง! เป้าหมายคือ ทำให้การย้ายข้อมูลระหว่าง...

OpenAI กด “Code Red”! เร่งส่ง GPT-5.2 ชน Gemini 3 ศึกเดือดวัดกันที่ “ความเนียน” ไม่ใช่แค่ “ความหวือหวา”

การแข่งขันในโลก AI ตอนนี้มันยิ่งกว่ารถแข่ง Formula 1 ที่เปลี่ยนยางทุกไม่กี่สิบโค้ง! หลังจากที่ Google ปล่อย...

Related Articles

Popular Categories

spot_img