โดย : อมรินทร์ทีวีออนไลน์

Google จ่อคลอด AI ใหม่สู้ GPT-4o สั่งงานผ่านเสียง/ภาพได้ คาดเปิดใช้ในแอปฯ Google ปลายปีนี้

15 พ.ค. 67

15:00 น.

แชร์

Google เปิดตัว AI ใหม่ สู้ GPT-4o พัฒนาโดยใช้โมเดล Gemini AI รุ่นล่าสุด รับคำสั่งผ่านเสียงและภาพได้ คาดว่าจะเปิดให้ใช้ในผลิตภัณฑ์ของ Google เช่น Cloud, Gmail, Doc และ Gemini App ในปลายปีนี้

ข่าวที่เกี่ยวข้อง

ตลาดหลักทรัพย์ฯ จับมือ Google Cloud พัฒนา AI เสริมศักยภาพตลาดทุนไทย

ประธาน Alibaba เตือน คนสร้าง Data Center มากไป จนเป็นฟองสบู่

มหกรรมเทคโนโลยีการตลาดที่ใหญ่ที่สุดในเอเชียที่ 1 ปีมีครั้งเดียว! SC ASSET Presents MarTech Expo 2025: Exploring The Power

ในวันนี้ (15 พ.ค. 2024) Google ได้ออกมาพูดถึงการเปิดตัว AI ตัวดังกล่าวในงานประชุมผู้พัฒนา I/O เพียง 1 วันหลังจาก OpenAI เปิดตัว GPT-4o แชทบอทเอไอรุ่นล่าสุดของ ChatGPT โดยแชทบอทตัวดังกล่าวจะใช้ AI โมเดลตัวล่าสุดในไลน์ Gemini

โดยจากวีดีโอสาธิตการใช้งานที่ Google เปิดในงานแถลง ไฮไลต์ฟีเจอร์สำคัญของ AI รุ่นใหม่นี้ คือ ความสามารถในการพูดคุยและรับคำสั่งผ่านเสียงและภาพได้ โดย AI ตัวนี้จะสามารถ ‘มองเห็น’ โลกภายนอกได้ผ่านกล้อง ทำให้นอกจากจะทำงานตามคำสั่งได้แล้ว ยังสามารถช่วยเหลือผู้ใช้ในทางอื่นได้ด้วย เช่น การช่วยหาของที่หายไป เหมือนมีเพื่อนช่วยงานเราจริงๆ ไม่ใช่เป็นเพียงแชทบอทในอุปกรณ์คอมพิวเตอร์ หรือสมาร์ทโฟน

นอกจากฟีเจอร์นี้แล้ว AI ตัวใหม่นี้ ยังจะมีความสามารถในการใช้เหตุผลและตรรกะที่ดีขึ้น และประมวลผลข้อมูลได้มากและเร็วกว่าเดิม โดยจะสามารถสรุปเนื้อหาจากบทความ อีเมล์ และเอกสารอื่นๆ รวมถึงช่วยเขียนและแก้โค้ดได้ ทำให้ AI ตัวนี้จะเป็นผู้ช่วยที่ดีของคนจากหลายสาขาอาชีพ รวมไปถึงพนักงานในอุตสาหกรรมเทคโนโลยี

โดยถ้าหากเทียบกับ GPT-4o ที่เพิ่งเปิดตัวในวันที่ 14 พ.ค. ก็ถือว่ามีความสามารถใกล้เคียงกัน สะท้อนการแข่งขันในด้าน AI ที่เริ่มทวีความเข้มข้นขึ้นเรื่อยๆ ในหมู่บริษัทเทคโนโลยีใหญ่ และน่าจับตามองว่าสุดท้ายใครจะสามารถพัฒนา AI ที่มีสมรรถภาพสูง และตรงใจผู้ใช้ได้มากที่สุด

Google ประกาศว่า AI รุ่นใหม่นี้น่าจะพร้อมเปิดให้ผู้ใช้ทดลองใช้ได้ในปลายปีนี้ในผลิตภัณฑ์และแอปพลิเคชั่นต่างๆ ของ Google เช่น Gemini App ซึ่งจะช่วยให้การใช้งานและทำงานในแอปฯ ของ Google ง่าย สะดวก และมีประสิทธิภาพมากยิ่งขึ้น

เปิดตัว Gemini 1.5 Flash เตรียมใส่ AI ในแอนดรอยด์

นอกจากการพูดถึง AI ตัวใหม่ล่าสุดแล้ว ในงานเดียวกัน Google ยังได้เปิดตัว Gemini 1.5 Flash เอไอโมเดลตัวใหม่ในไลน์ Gemini ที่พัฒนาขึ้นมาอีกขั้นจาก Gemini 1.5 Pro และจะเป็นโมเดลเอไอที่สามารถสรุปเนื้อหาได้จากทั้งข้อความ วีดีโอคลิป ตาราง และเอกสารต่างๆ เป็นจำนวนมากได้อย่างรวดเร็ว

ทั้งนี้ เมื่อไม่นานมานี้ Google เพิ่งเปิดตัว Gemini 1.5 Pro ที่สามารถประมวลผลและสรุปข้อมูลจำนวนมากได้ โดยรุ่นล่าสุดสามารถเข้าใจได้ถึง 35 ภาษา ประมวลผลข้อมูลจากเอกสารได้ทีเดียว 1,500 หน้า และอีเมล์ 100 ฉบับ และในอนาคตจะถูกพัฒนาให้สามารถสรุปเนื้อหาจากวีดีโอ และประมวลผลโค้ดคอมพิวเตอร์ได้สูงสุดถึง 30,000 บรรทัด

ในเบื้องต้น Gemini 1.5 Pro จะเปิดให้ทดลองใช้ได้ใน Workspace Labs ขณะที่ Gemini 1.5 Flash จะเปิดให้มีการทดสอบใน Vertex AI ซึ่งเป็นแพลตฟอร์มแมชชีนเลิร์นนิ่งของ Google ที่เปิดให้ผู้พัฒนาของ Google สามารถทดสอบการทำงานและการนำ AI มาประยุกต์ใช้ในโปรแกรมหรือแอปฯ ต่างๆ ได้

นอกจากนี้ Google ยังมีแผนใส่ Gemini รุ่นล่าสุด รวมถึง Gemini Nano ในอุปกรณ์แอนดรอยด์ต่างๆ เพื่อเสริมฟีเจอร์และสมรรถภาพการทำงานของอุปกรณ์ และทำให้แอนดรอยด์เป็นระบบปฏิบัติการแรกในโลกที่เสริม AI เข้าไปเป็นองค์ประกอบพื้นฐานของระบบ ไม่ใช่เพียงฟีเจอร์เสริม หรือแอปพลิเคชั่น

ทั้งนี้ Google ก็ไม่ใช่บริษัทเดียวที่มีแผนจะใส่ AI เข้าไปในระบบปฏิบัติการ เพราะล่าสุดสื่อต่างประเทศรายงานว่า OpenAI ก็ใกล้ปิดดีลเจรจากับ Apple ในการใส่ GPT เข้าไปเป็นฟีเจอร์หลักของ iOS 18 แล้ว โดยคาดว่าจะเปิดตัวออกมาใน iOS รุ่นล่าสุด และ iPhone 16 ในเดือนกันยายนที่จะถึงนี้

ที่มา: Nikkei Asia, CNBC