ข่าว

SPOTLIGHT

รายการ

ไลฟ์สไตล์

ดูดวง

ยานยนต์

สลากกินแบ่งรัฐบาล

ชีพจรลงพุงไกด์

ช่องทางติดตาม AMARINTV

โดย : อมรินทร์ทีวีออนไลน์

สรุปแล้ว ‘strawberry’ มีตัว r ทั้งหมดกี่ตัวอักษร? ทำไม AI บอก มีแค่ 2?

28 ส.ค. 67

14:07 น.

แชร์

ถ้าถามคนทั่วไปว่า “คำว่า ‘strawberry’ มีตัว ‘r’ กี่ตัวอักษร?” หรือ How many R's are in the word strawberry? เชื่อว่าทุกคนคงตอบอย่างรวดเร็วว่า 3 ตัวอักษร แต่โมเดล AI อย่าง GPT-4o และ Claude กลับตอบว่า ‘มี 2 ตัวอักษร’

ข่าวที่เกี่ยวข้อง

อีลอน มัสก์ สนใจซื้อเจ้าของ ChatGPT ในราคา 3 ล้านล้านบาท

นาวิกฯสหรัฐฯแบน DeepSeek อันตรายต่อความมั่นคง? หรือเพียงเพราะมาจากจีน?

ทรัมป์เปิดตัว Stargate เมกะโปรเจกต์ AI ยิ่งใหญ่ ลงทุน 5 แสนล้านเหรียญฯ

โมเดลภาษาขนาดใหญ่ หรือ Large Language Model (LLM) สามารถเขียนเรียงความ แก้สมการโจทย์เลขได้ภายในไม่กี่วินาที สังเคราะห์ข้อมูลหลายเทราไบต์ได้เวลาอันรวดเร็ว แต่ทำไมแค่ให้โมเดล AI ลองนับตัวอักษรง่ายๆ ในศัพท์บางคำ กลับล้มเหลวอย่างน่าตกตะลึง จนกลายเป็นมีมที่ถูกแชร์ไปทั่วโลกออนไลน์ได้ขนาดนี้?

การทำงานของ LLM

Large Language Model (LLM) เป็นอัลกอริทึมการเรียนรู้เชิงลึกที่สามารถจดจำ สรุป แปล คาดการณ์ และสร้างเนื้อหาโดยใช้ชุดข้อมูลขนาดใหญ่มาก โดยมี ‘ตัวแปลง’ หรือ ‘transformer’ เป็นนิวรัลเน็ตเวิร์กที่แปลง หรือเปลี่ยนลำดับอินพุต เป็นลำดับเอาต์พุต จากการเรียนรู้บริบทและความหมาย ด้วยการติดตามความสัมพันธ์ระหว่างองค์ประกอบในข้อมูลเชิงลำดับ

ยกตัวอย่างเช่น หากป้อนอินพุตเข้าไปว่า “สีของต้นไม้ คือ สีอะไร?” สิ่งที่ transformer จะทำ คือ แบ่งข้อความออกเป็น ‘โทเค็น’ ซึ่งอาจเป็นคำ พยางค์ หรือตัวอักษร ขึ้นอยู่กับแบบจำลอง เพื่อหาความสัมพันธ์ระหว่างคำว่า ‘สี-ต้นไม้-สีเขียว’ ทำให้โมเดลสามารสร้างผลลัพธ์ได้ว่า “ต้นไม้เป็นสีเขียว”

Matthew Guzdial นักวิจัยด้าน AI กล่าวกับ TechCrunch ว่า LLM มีพื้นฐานมาจากสถาปัตยกรรมของ transformer ทำให้โมเดลไม่ได้อ่านข้อความจริงเหมือนที่มนุษย์ทำ เมื่อผู้ใช้งานป้อนคำสั่ง ข้อความนั้นจะถูกแปลงเป็นโค้ด ยกตัวอย่างเช่น เมื่อ transformer เห็นคำว่า ‘the’ ก็จะแปลงเป็นโค้ดว่า ‘the’ แต่ไม่ได้แปลงเป็น ‘t-h-e’ แยกตัวอักษรจากกัน

ข้อความที่ถูกป้อนเข้าไปในโมเดล จะถูกแปลงเป็นตัวเลข ซึ่งจะถูกนำไปจัดบริบทเพื่อช่วยให้ AI คิดค้นการตอบสนองเชิงตรรกะ หรือพูดง่ายๆ AI อาจรู้ว่าโทเค็นของ ‘straw’ และ ‘berry’ ประกอบกันเป็นคำว่า ‘strawberry’ แต่ก็อาจไม่เข้าใจว่า "strawberry" ประกอบด้วยตัวอักษร ‘s-t-r-a-w-b-e-r-r-y’ ตามลำดับ

ปัญหาที่พบเจอในตอนนี้

นี่ไม่ใช่ปัญหาที่แก้ไขได้ง่าย เนื่องจากปัญหาฝังอยู่ในสถาปัตยกรรมที่ทำให้ LLM เหล่านี้ทำงานได้

Sheridan Feucht ผู้มีความเชี่ยวชาญในการตีความของ LLM กล่าวกับ TechCrunch ว่า “การจะสรุปว่า 'คำ' ควรจะเป็นอย่างไรสำหรับโมเดลภาษาเป็นเรื่องที่ค่อนข้างยาก และแม้ว่าเราจะได้ผู้เชี่ยวชาญที่เป็นมนุษย์ มาตกลงกันเกี่ยวกับคำศัพท์โทเค็นที่สมบูรณ์แบบ โมเดลก็ยังคงแบ่งคำต่างๆ ออกไปอีก มันคงไม่มีตัวแบ่งโทเค็นที่สมบูรณ์แบบ เนื่องจากความไม่ชัดเจนประเภทนี้”

ปัญหานี้ยิ่งซับซ้อนมากขึ้น เมื่อ LLM เรียนรู้ภาษาอื่นมากขึ้น เพราะการแบ่งโทเค็นสำหรับคำศัพท์บางภาษา ที่ถือช่องว่างในประโยค นับเป็นคำใหม่เสมอ แต่ในภาษาจีน ญี่ปุ่น ไทย ลาว เกาหลี เขมร ไม่ได้ใช้ช่องว่างเพื่อแยกคำ

โดยได้สอดคล้องกับผลการศึกษาวิจัยโดย Oxford ในปี 2023 ที่พบว่า การแปลงภาษาอื่นๆ ออกมาเป็นโทเค็น ใช้เวลามากกว่าการแปลงภาษาอังกฤษมากถึงสองเท่า ในขณะที่อีกงานวิจัยพบว่า ผู้ใช้ภาษาที่มีประสิทธิภาพการใช้โทเค็นน้อยกว่า มีแนวโน้มที่จะเห็นประสิทธิภาพของโมเดลที่แย่ลง แต่ต้องจ่ายเงินมากขึ้นสำหรับการใช้งาน เนื่องจากผู้จำหน่าย AI หลายรายเรียกเก็บเงินต่อโทเค็น

นอกจากนี้ Yennie Jun นักวิจัย AI DeepMind ของ Google ได้ทำการวิเคราะห์เปรียบเทียบการแปลงภาษาเป็นโทเค็น จากการใช้ชุดข้อมูลของข้อความคู่ขนานที่แปลเป็นภาษามากถึง 52 ภาษา พบว่า บางภาษาต้องการโทเค็นมากกว่าถึง 10 เท่าจึงจะสื่อความหมายเดียวกันในภาษาอังกฤษได้ เช่น คำว่า ‘สวัสดี’ เทียบเท่าโทเค็น 6 อัน

พลิกวิกฤต ให้เป็นโอกาส

ความล้มเหลวของ LLM ในการทำความเข้าใจแนวคิดของตัวอักษรและพยางค์ บ่งชี้ถึงความจริงที่คนมักจะลืมไป: สิ่งเหล่านี้ไม่มีสมอง คิดไม่เหมือนมนุษย์ เพราะมันไม่ใช่มนุษย์ หรือแม้แต่จะคล้ายมนุษย์ด้วยซ้ำ

ดังนั้น AI จึงไม่สามารถบอกได้ว่า ‘strawberry’ มีตัวอักษร ‘r’ จำนวนกี่ตัวโดยตรง แต่จากการทดลองโดยผู้ใช้งาน GPT-4o หลายราย พบว่า หากป้อนคำสั่งนี้ และส่งท้ายด้วยประโยค “verify with code” หรือ ยืนยันโดยใช้โค้ด โมเดล AI จะสามารถตอบได้ว่า มี r 3 ตัวอักษร

ถึงแม้มีม (meme) การสะกดคำว่า strawberry ถูกแชร์ในโลกออนไลน์ไปทั่วโลก แต่ OpenAI ถึงโอกาส กำลังพัฒนาผลิตภัณฑ์ AI ใหม่ที่เรียกว่า ‘Strawberry’ คาดว่าจะมีความสามารถด้านการใช้เหตุผลได้ดียิ่งขึ้น

สำหรับการเติบโตของ LLM ถูกจำกัดด้วยข้อเท็จจริงที่ว่า ไม่มีข้อมูลการฝึกอบรมเพียงพอในโลกที่จะทำให้ผลิตภัณฑ์เช่น ChatGPT แม่นยำยิ่งขึ้น แต่ Strawberry สามารถสร้างข้อมูลสังเคราะห์ที่แม่นยำเพื่อให้ LLM ของ OpenAI ดีขึ้นได้ ตามรายงานของ The Information ที่ Strawberry สามารถแก้ปริศนาคำศัพท์ Connections ของ New York Times ที่ต้องใช้ความคิดสร้างสรรค์ และการจดจำรูปแบบในการแก้ และสามารถแก้สมการทางคณิตศาสตร์ที่ไม่เคยเห็นมาก่อนได้ด้วย

ในขณะเดียวกัน Google DeepMind เพิ่งเปิดตัว ‘AlphaProof’ และ ‘AlphaGeometry 2’ ระบบ AI ที่ออกแบบมาสำหรับการใช้เหตุผลทางคณิตศาสตร์อย่างเป็นทางการ โดย Google ระบุว่า ระบบทั้งสองนี้สามารถแก้โจทย์จากการแข่งขันคณิตศาสตร์โอลิมปิกนานาชาติได้ 4 ใน 6 ข้อ ซึ่งถือว่าเป็นผลงานที่ดีพอที่จะคว้าเหรียญเงินจากการแข่งขันอันทรงเกียรตินี้ได้

ที่มา TechCrunch 1, TechCrunch 2, OpenAI Community, NVIDIA, NVIDIA Blog, AWS