Sunday, May 25, 2025
26 C
Bangkok

AI ตัวใหม่ของ OpenAI “o3” ไม่เป๊ะอย่างที่คุยไว้! คะแนนเบนช์มาร์กลดฮวบจากที่บริษัทบอก

ช่วงนี้ใครที่ติดตามวงการ AI คงจะได้ยินข่าวเกี่ยวกับโมเดลใหม่จาก OpenAI ที่มีชื่อว่า o3 กันมาบ้าง ซึ่งแรกเริ่มเดิมทีทางบริษัทออกมาบอกว่าเจ้า o3 เนี่ยเจ๋งสุดๆ ฉลาดกว่าโมเดลก่อนๆ แบบก้าวกระโดด และจะเป็นก้าวต่อไปของ GPT-5 หรือมากกว่านั้น แต่ล่าสุดมีข้อมูลหลุดออกมาว่า ผลการทดสอบบนเบนช์มาร์ก (benchmark) จริงๆ แล้วกลับ ไม่สูง อย่างที่ OpenAI โฆษณาไว้

โดยข้อมูลนี้มาจากเอกสารภายในที่หลุดออกมาซึ่งเผยว่า o3 ได้คะแนนเพียง 8.7 จาก 32 บนการประเมินของ MMLU (Massive Multitask Language Understanding) ซึ่งเป็นมาตรฐานการทดสอบความเข้าใจภาษาที่ใช้กันอย่างแพร่หลายในการเปรียบเทียบความเก่งของโมเดล AI ต่างๆ

ขอเทียบให้เห็นภาพง่ายๆ ว่า GPT-4 ที่เปิดตัวไปเมื่อปีก่อน เคยได้คะแนนสูงถึง 86.4% ใน MMLU ซึ่งต่างกับ o3 ที่ได้แค่ประมาณ 27% เท่านั้น! ต่างกันแบบชัดเจนมากๆ ทั้งที่ OpenAI ออกมาบอกว่า o3 คือโมเดลที่ดีที่สุดที่เคยพัฒนา

แล้วทำไมถึงเป็นแบบนั้น?
จากรายงานของ TechCrunch และการวิเคราะห์ของนักวิจัยหลายฝ่าย มีข้อสันนิษฐานว่า OpenAI อาจพยายามลดความคาดหวังของตลาดไว้ก่อน เพื่อควบคุมภาพลักษณ์ของบริษัท หรือไม่ก็อาจกำลังพัฒนาเวอร์ชันที่สมบูรณ์กว่า o3 อยู่แล้ว (ซึ่งอาจเป็น GPT-5 ที่แท้จริง)

อย่างไรก็ตาม สิ่งที่ทำให้เกิดการวิพากษ์วิจารณ์อย่างมากคือการที่บริษัทให้ข้อมูลที่ดูเหมือนจะ “อวยตัวเองเกินจริง” แล้วพอมีข้อมูลจริงหลุดออกมาก็เลยดูไม่น่าเชื่อถือเท่าเดิม

ประเด็นอีกอย่างคือ o3 นี้ยังอยู่ในขั้นทดลอง บางฟีเจอร์อาจยังไม่เสถียร หรือยังไม่เปิดให้ใช้เต็มที่ แต่คนทั่วไปก็เริ่มได้ลองผ่าน API และในบริการต่างๆ อย่าง ChatGPT Plus แล้ว ดังนั้นใครที่เคยลองใช้อาจจะเริ่มรู้สึกได้ว่า “ทำไมดูไม่ฉลาดเท่าที่บอกไว้?” ก็ไม่ต้องแปลกใจ

ในวงการ AI ตอนนี้มีการแข่งขันกันดุเดือด ทั้ง Google, Anthropic, Meta, และอีกหลายบริษัทต่างก็เร่งพัฒนาโมเดลใหม่ๆ ซึ่งแน่นอนว่า OpenAI ไม่สามารถชะลอตัวได้เลย แต่การสื่อสารที่คลุมเครือหรือเกินจริงอาจกลายเป็นดาบสองคม

สิ่งที่คนทั่วไปควรเรียนรู้จากเหตุการณ์นี้ก็คือ

  1. อย่าเชื่อโฆษณา 100%

  2. ควรดูผลเบนช์มาร์กจากหลายแหล่ง

  3. ถ้าเป็นนักพัฒนา ควรทดสอบโมเดลด้วยตัวเองก่อนเอาไปใช้งานจริง

สุดท้ายนี้ โมเดล o3 ของ OpenAI อาจไม่ได้แย่ แต่ก็อาจยังไม่ใช่สุดยอด AI อย่างที่เราคาดหวัง ซึ่งก็เป็นเรื่องธรรมดาในวงการเทคโนโลยีที่มีทั้งช่วงพีคและช่วงแกว่ง

ไว้ถ้ามีข้อมูลอัปเดตหรือเวอร์ชันใหม่ออกมาอีก จะมาเล่าให้ฟังแบบชัดๆ เหมือนเดิมนะ!

อัพเดท! ก่อนใคร

เรื่องราวเจ๋งๆ ล้ำๆ สดใหม่ถึงคุณโดยตรงเพียงแค่กรอก Email ไว้เท่านั้น

This field is required.

รายละเอียดเงื่อนไขที่ privacy policy.

Hot this 48 hr.

ความหมายของไพ่ยิปซี ไพ่ทาโรต์ ไพ่ชุดเมเจอร์และไพ่ชุดไมเนอร์ อาร์คานา

ไพ่ทาโรต์ แบ่งออกเป็น 2 ส่วน คือ ไพ่ชุดเมเจอร์ อาร์คานา มี 22...

ครั้งแรกในไทย! แมคโดนัลด์ X Minecraft ส่งชุด Minecraft Movie Meal พร้อมของเล่นกล่องสุ่มสุดคิ้วท์ เอาใจสายเกมเมอร์ GEN Z และน้องๆ GEN A

สายเกมเมอร์เตรียมเฮ! แมคโดนัลด์ เปิดตัวแคมเปญสุดคิวต์ครั้งแรกกับ Minecraft เกมสุดฮิตระดับโลกที่มีแฟนๆ หลายล้านคนทั่วโลก โดยล่าสุด วันที่ 3...

ใครได้ใครเสีย? วิเคราะห์ผลกระทบของนโยบายภาษีนำเข้ารถยนต์ของ Trump ต่อค่ายรถทั่วโลก

นโยบายภาษีนำเข้ารถยนต์ของ Donald Trump ที่เคยเป็นกระแสใหญ่ในช่วงที่เขาดำรงตำแหน่งประธานาธิบดีสหรัฐฯ กลับมาเป็นที่พูดถึงอีกครั้งหลังมีการคาดการณ์ว่าเขาอาจกลับมาชิงตำแหน่งอีกครั้งในปี 2024 และแน่นอนว่าโลกยานยนต์ต่างก็จับตามอง โดยเฉพาะค่ายรถที่มีฐานการผลิตในต่างประเทศ หรือมีแผนขยายตลาดไปยังสหรัฐฯ แล้วใครกันที่จะได้ประโยชน์จากภาษีนี้...

สื่อเดือด! News/Media Alliance สาดคำว่า “ขโมย” ใส่ Google หลังเปิด AI Mode กวาดทราฟฟิกเว็บข่าว

เมื่อ Google โชว์ AI Mode ตัวเต็มในงาน Google I/O 2025 ที่ผ่านมา หลายคนตื่นเต้นกับผลการค้นหาที่กลายเป็นกล่องแชตสรุปคำตอบให้เสร็จสรรพ แต่อีกมุมหนึ่ง—โดยเฉพาะฝั่งสำนักข่าวใหญ่ในสหรัฐ—นี่คือสัญญาณอันตรายระดับ “โดนปล้นกลางแดด” ใครด่าใคร?องค์กร News/Media Alliance ซึ่งเป็นตัวแทนสำนักข่าวยักษ์อย่าง Condé Nast, Vox Media และเพื่อนพ้องอีกเป็นร้อยสำนัก ออกแถลงการณ์เดือดว่า Google “เอาคอนเทนต์ไปใช้ฟรี ๆ ไม่ให้ผลตอบแทน” พร้อมนิยามว่าเป็น “การขโมย” เต็มปากเต็มคำ Danielle Coffey ซีอีโอ NMA...

OpenAI ปล่อย GPT-4.1 ให้ผู้ใช้แบบเสียเงินทุกคน ใช้งานได้แล้ววันนี้!

OpenAI ประกาศเปิดตัว GPT-4.1 อย่างเป็นทางการ พร้อมให้บริการแก่ผู้ใช้ ChatGPT แบบเสียเงินทุกคนแล้ว ไม่ว่าจะเป็นผู้ใช้แบบ Plus...

Topics

เปิดตัว Toyota RAV4 รุ่นใหม่ แรงสุด 300 แรงม้า พร้อมรุ่น GR Sport สุดเท่!

Toyota RAV4 รุ่นใหม่มาแล้วจ้า! รอบนี้บอกเลยว่าไม่ธรรมดา เพราะมาพร้อมพละกำลังสูงสุดถึง 300 แรงม้า แถมยังมีรุ่นพิเศษ GR...

Lexus ES เจน 8 มาแน่ปี 2026! รุ่นใหม่ดีไซน์โฉบเฉี่ยว พร้อมลุยตลาด UK

Lexus ยืนยันแล้ว! รถซีดานหรูระดับพรีเมียมอย่าง Lexus ES รุ่นที่ 8 เตรียมเข้าโชว์รูมในสหราชอาณาจักรภายในปี 2026...

ดราม่าใหม่! ทายาทผู้สร้าง Superman ฟ้องร้อง หวังบล็อกหนัง James Gunn ไม่ให้ฉายในบางประเทศ

เรื่องดราม่าระหว่างค่ายหนังและเจ้าของสิทธิ์ดูจะไม่จบง่าย ๆ เมื่อล่าสุดมีรายงานว่า “ทายาทของผู้สร้าง Superman” ได้ยื่นฟ้องร้องใหม่อีกครั้ง โดยมีเป้าหมายเพื่อ “บล็อกภาพยนตร์ Superman...

Spotify เผยฟีเจอร์จ่ายเงินนอกแอปบน iOS ช่วยเพิ่มยอดสมัครสมาชิกเพียบ!

Spotify ออกมาเผยแล้วว่า การที่ Apple ยอมให้แอปอย่าง Spotify เพิ่มช่องทางการจ่ายเงินภายนอกแอป (External Payments)...

Related Articles

Popular Categories

spot_img