ธุรกิจการตลาด

OpenAI เปิดตัว ‘o1’ แชทบอทที่ให้เหตุผลดีขึ้น แก้โจทย์เลข-วิทย์ได้ดีมาก

13 ก.ย. 67
OpenAI เปิดตัว ‘o1’ แชทบอทที่ให้เหตุผลดีขึ้น แก้โจทย์เลข-วิทย์ได้ดีมาก

ปฏิเสธไม่ได้ว่า บางครั้งแชทบอทออนไลน์อย่าง ‘ChatGPT’ จาก OpenAI และ ‘Gemini’ จาก Google ก็ประสบปัญหาในการแก้ปัญหาทางคณิตศาสตร์ง่ายๆ หรือการเขียนโค้ดที่มักมีข้อบกพร่องและไม่สมบูรณ์ ซึ่งบางครั้ง พวกเขายังสร้างสิ่งต่างๆ ขึ้น มาเองอีกด้วย

OpenAI เปิดตัว ‘o1’ แชทบอทที่ให้เหตุผลดีขึ้น แก้โจทย์คณิตศาสตร์-วิทยาศาสตร์ได้ดีมาก

เมื่อวันพฤหัสบดีที่ผ่านมา OpenAI ได้เปิดตัว ‘OpenAI o1’ ChatGPT เวอร์ชันใหม่ที่สามารถใช้ ‘เหตุผล’ ผ่านงานที่เกี่ยวข้องกับคณิตศาสตร์ การเขียนโค้ด และวิทยาศาสตร์ได้ อย่างเช่น ช่วยให้นักฟิสิกส์สร้างสูตรคณิตศาสตร์ที่ซับซ้อน หรือช่วยเหลือผู้วิจัยด้านการดูแลสุขภาพ 

โดยโมเดลนี้ อาจใช้เวลาในการคิดแก้ปัญหาที่เป็นภาษาอังกฤษ แยกปัญหาออกเป็นประเด็นย่อย และมองหาแง่มุมต่างๆ เพื่อให้ได้คำตอบที่ดีที่สุด ต่างจากโมเดลแบบเดิมที่สามารถพิมพ์คำสั่งหรือคำถามลงไป และได้คำตอบในทันที

สำนักข่าว The New York Times รายงานว่า จากการสาธิตโดย Dr. Jakub Pachocki และ Szymon Sidor นักวิชาการด้านเทคนิคของ OpenAI พบว่า แชทบอทรุ่นใหม่นี้ สามารถตอบคำถามเคมีระดับปริญญาเอก และวินิจฉัยโรคป่วยได้ โดยอาศัยรายงานโดยละเอียดที่เกี่ยวกับอาการ และประวัติของผู้ป่วย

เทคโนโลยีใหม่นี้ เป็นส่วนหนึ่งของความพยายามในการสร้าง AI ที่สามารถวิเคราะห์งานที่ซับซ้อนได้ บริษัทต่างๆ เช่น Google และ Meta กำลังสร้างเทคโนโลยีที่คล้ายคลึงกัน ในขณะที่ Microsoft และบริษัทในเครืออย่าง GitHub กำลังดำเนินการรวมระบบใหม่ของ OpenAI เข้ากับผลิตภัณฑ์ของตน

สาเหตุที่ OpenAI เปิดตัว o1 คือ การสร้างระบบที่สามารถแก้ปัญหาได้อย่างรอบคอบและมีเหตุผล ผ่านการแก้ปัญหาในหลายขั้นตอน เหมือนกับการใช้เหตุผลของมนุษย์ โดยเทคโนโลยีเหล่านี้ อาจเป็นประโยชน์อย่างยิ่งสำหรับโปรแกรมเมอร์คอมพิวเตอร์ที่ใช้ระบบ AI ในการเขียนโค้ด รวมทั้งยังสามารถปรับปรุงการสอนอัตโนมัติ สำหรับวิชาคณิตศาสตร์และวิชาอื่นๆ ได้อีกด้วย

ดังนั้น โมเดลใหม่นี้ มีประสิทธิภาพที่ดีกว่าเทคโนโลยีรุ่นก่อนๆ จากการทดสอบมาตรฐานบางประเภท เช่น การสอบคัดเลือกสำหรับการแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ หรือ IMO ซึ่งเป็นการแข่งขันคณิตศาสตร์ระดับมัธยมศึกษาตอนปลาย ผลการทดสอบพบว่า เทคโนโลยีรุ่นก่อนของ OpenAI ทำคะแนนได้ 13% แต่ OpenAI o1 ทำคะแนนได้สูงถึง 83%

อย่างไรก็ตาม โมเดล o1 ยังไม่สามารถเรียกดูเว็บ หรือวิเคราะห์ไฟล์ได้ ส่วนฟีเจอร์วิเคราะห์ภาพ ก็ยังถูกปิดการใช้งานเพื่อรอการทดสอบเพิ่มเติม รวมทั้งมีอัตราการใช้งานที่จำกัด โดยปัจจุบัน มีขีดจำกัดรายสัปดาห์อยู่ที่ 30 ข้อความสำหรับ o1-preview และ 50 ข้อความสำหรับ o1-mini

นอกจากนี้ TechCrunch รายงานว่า o1 มีราคาแพงมาก โดย o1-preview มีราคา 15 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็นอินพุต และ 60 ดอลลาร์สหรัฐฯ ต่อ 1 ล้านโทเค็นเอาท์พุต สูงกว่า GPT-4o 3 เท่าสำหรับอินพุตและ 4 เท่าสำหรับเอาท์พุต (1 ล้านโทเค็น อยู่ที่ประมาณ 750,000 คำ)

ทั้งนี้ ผู้บริโภค และกลุ่มธุรกิจที่สมัครใช้บริการ ChatGPT Plus และ ChatGPT Teams สามารถเข้าถึง OpenAI o1 ได้ตั้งแต่วันพฤหัสบดีที่ผ่านมา และบริษัทยังจำหน่ายเทคโนโลยีดังกล่าว ให้กับนักพัฒนาซอฟต์แวร์และธุรกิจที่สร้างแอปพลิเคชัน AI ของตนเองอีกด้วย ส่วนผู้ใช้งานทั่วไป OpenAI ระบุว่า บริษัทมีแผนที่จะนำ o1-mini ให้ใช้งานฟรี แต่ยังไม่ได้กำหนดวันเปิดตัว

ข้อบกพร่องการพัฒนาแชทบอท

นับตั้งแต่การเปิดตัว ChatGPT ของ OpenAI ในปลายปี 2022 บริษัทแสดงให้เห็นว่า แชทบอทสามารถทำตามคำสั่งของมนุษย์ได้ดีมากขึ้น ทั้งการตอบคำถาม เขียนรายงานภาคเรียน และแม้แต่สร้างโค้ดคอมพิวเตอร์ด้วยซ้ำ ถึงแม้บางครั้งคำตอบอาจมีข้อบกพร่อง

ChatGPT เรียนรู้ทักษะของตนด้วยการวิเคราะห์ข้อความจำนวนมหาศาลที่รวบรวมมาจากทั่วอินเทอร์เน็ต รวมถึงบทความ Wikipedia หนังสือ และบันทึกการสนทนา โดยข้อมูลที่รวบรวมมา จะถูกนำมาเรียนรู้ทั้งรูปแบบในตัวข้อความเอง และการตอบคำถาม ทำให้ ChatGPT สามารถที่จะสร้างข้อความขึ้นมาเองได้

อย่างไรก็ตาม สำนักข่าว The New York Times ฟ้อง OpenAI และ Microsoft ในเดือนธันวาคม ปี 2023 ฐานละเมิดลิขสิทธิ์เนื้อหาข่าวที่เกี่ยวข้องกับระบบ AI เนื่องจากอินเทอร์เน็ตเต็มไปด้วยข้อมูลที่ไม่เป็นความจริง เทคโนโลยีจึงเรียนรู้ที่จะพูดเรื่องเท็จซ้ำๆ กัน บางครั้งก็แต่งเรื่องขึ้นมาเอง

OpenAI จึงพยายามลดข้อบกพร่องเหล่านี้ และได้สร้างระบบใหม่ของ OpenAI ผ่านการใช้การเรียนรู้แบบเสริมกำลัง หรือ reinforcement learning โดยกระบวนการนี้ อาจกินเวลานานเป็นสัปดาห์หรือเป็นเดือน แต่ระบบจะสามารถเรียนรู้พฤติกรรมผ่านการลองผิดลองถูกอย่างมากมาย

ตัวอย่างเช่น การลองทำโจทย์คณิตศาสตร์หลายๆ แบบ จะทำให้เรียนรู้ได้ว่า วิธีใดให้คำตอบที่ถูกต้อง และวิธีใดไม่ได้ผล หากทำซ้ำขั้นตอนนี้กับโจทย์จำนวนมาก ก็สามารถระบุรูปแบบได้ แต่ระบบอาจไม่สามารถใช้เหตุผลได้เหมือนมนุษย์ และยังคงทำผิดพลาดและเกิดภาพหลอนได้

Angela Fan นักวิจัยจาก Meta กล่าวว่า ‘การแก้ปัญหา’ กับ ‘การช่วยเหลือ’ มีความแตกต่างกัน การทำแบบทดสอบ ไม่ได้ตัดสินว่า เทคโนโลยีต่างๆ จะทำงานได้ดีแค่ไหน ในสถานการณ์โลกแห่งความเป็นจริง และถึงแม้ว่าระบบอาจจะทำได้ดีในคำถามทดสอบคณิตศาสตร์ แต่ก็ยังอาจประสบปัญหาในการสอนคณิตศาสตร์ได้

ที่มา The New York Times, TechCrunch

advertisement

Relate Post

SPOTLIGHT