เรือธงตัวใหม่จาก Open AI “Chat GPT-4o” – ช่วยให้การเชื่อมต่อระหว่างมนุษย์และ AI จะไร้รอยต่อยิ่งกว่าเคย

June 10, 2024
Yok Thanawan

เรือธงตัวใหม่จาก Open AI “Chat GPT-4o” – ช่วยให้การเชื่อมต่อระหว่างมนุษย์และ AI จะไร้รอยต่อยิ่งกว่าเคย

Open AI ผู้สร้าง Chat GPT ได้เปิดตัวโมเดล GPT เรือธงตัวใหม่ออกมาในชื่อว่า “Chat GPT-4o” ที่สามารถวิเคราะห์และประมวลผลข้อมูลจากหลากหลายแหล่งได้พร้อมกัน ไม่ว่าจะเป็นข้อความ (Text) เสียง (Voice) และภาพรวมไปถึงวิดีโอ (Vision) สมชื่อ 4o ที่ตัว o ย่อมาจาก omni model ที่แปลว่าโมเดลที่รวมทุกอย่างไว้ด้วยกันนั่นเอง

โดยวิดีโอ Live Demo จากทาง Open AI แสดงให้เห็นว่าเจ้า Chat GPT-4o มีความสามารถในการประมวลผลข้อมูลจากหลากหลายแหล่งที่มา จากตัวอักษรไปเสียง หรือจากวิดีโอไปเป็นเสียงได้แบบ Real Time ไม่ต้องรอประมวลผลหรือรอให้จบ 1 รอบบทสนทนาเหมือนบทสนทนากับ Gen AI โดยทั่วไป 

ตัวอย่างการใช้งาน Chat GPT-4o

  1. แปลภาษาได้แบบ Real Time โดยสามารถรองรับภาษาได้ถึง 50 ภาษา
  2. สามารถจับอารมณ์ผ่านเสียงและสีหน้า 
  3. เข้าใจ Code และแก้ Bug ผ่านเสียง (พูดง่าย ๆ คือน้องสามารถสอนเราเขียน Code ผ่านเสียงได้เลย ไม่ต้องมานั่งอ่านเหมือนเดิมอีกต่อไป!)
  4. เสียงที่ออกมาจาก Chat GPT-4o จะมีความเป็นธรรมชาติและใกล้เคียงกับมนุษย์มากขึ้น โดยที่เราสามารถใส่บรีฟให้ GPT แก้ไขเสียงได้ตามต้องการอีกด้วย 
  5. สามารถเข้าใจ วิเคราะห์ และอธิบายข้อมูลต่าง ๆ ผ่านภาพได้ 

โดยสามารถดู Demo ฉบับเต็มจาก Open AI ได้ที่

https://www.youtube.com/watch?v=DQacCB9tDaw

จะเห็นได้ว่า Chat GPT-4o สามารถวิเคราะห์และสื่อสารข้อมูลจากหลายแหล่งได้อย่างมีประสิทธิภาพและไร้รอยต่อ นอกจากนี้แล้วยังสามารถสื่อสารระหว่าง AI ด้วยกันได้อีกด้วย ไม่ได้จำกัดเพียงแค่การสื่อสารระหว่างคนและ AI อีกต่อไป 

สิ่งที่น่าจับตามองหลังจากการมาถึงของ Chat GPT-4o

  1. Apple ปิดดีลกับ Open AI ช่วยยกระดับการใช้งานและปลดล็อกศักยภาพของ Apple 

โดยในการอัปเดต iOS 18 ผู้ใช้งาน Apple จะสามารถใช้ AI บนโทรศัพท์และเครื่องมืออื่นได้ในรูปแบบ On Device และ On Cloud รวมไปถึงตัว Voice Assistant เรียกได้ว่าเป็นการยกระดับความสามารถของ Siri ที่จะเก่งขึ้นและมีเสียงที่เป็นธรรมชาติมากขึ้น 

  1. Accessibility ช่วยให้ผู้พิการใช้ชีวิตได้อย่างเต็มศักดิ์ศรีความเป็นมนุษย์ 

Open AI ร่วมมือกับ Be My Eyes แอปพลิเคชันช่วยผู้พิการทางสายตา โดย Chat GPT-4o สามารถอ่านสภาพแวดล้อมรอบตัว พร้อมกับแปลงเป็นเสียงเพื่อบอกเล่าเหตุการณ์รอบตัวให้กับผู้พิการทางสายตา เพื่อให้สามารถใช้ชีวิตได้อย่างสะดวกสบายและปลอดภัยยิ่งขึ้น โดยสามารถรับชมตัวอย่างได้จากวิดีโอด้านล่าง

  1. ระบบการศึกษาจะเปลี่ยนไป และการเข้าถึงการศึกษาจะง่ายมากยิ่งขึ้น 

เพราะสามารถวิเคราะห์และอธิบายข้อมูลจากแหล่งที่มาหลายหลายแหล่ง ทำให้  Chat GPT-4o สามารถที่จะอธิบายรวมไปถึงสอนสิ่งต่าง ๆ ได้ ไม่ว่าจะเป็นสมการคณิตศาสตร์ โค้ด รวมไปถึงกราฟรูปภาพต่าง ๆ นอกจากนี้แล้วยังสามารถแปลภาษาต่าง ๆ ได้แบบ Real Time ช่วยลดกำแพงภาษาจนอาจจะไม่มีกำแพงนี้อีกต่อไปในอนาคต 

เรียกได้ว่าการเปิดตัวของ Chat GPT-4o เป็นอีกหนึ่งความก้าวหน้าของวงการ AI ความน่าสนใจคือ Chat GPT-4o เปิดตัวให้เราใช้ได้ฟรี (สายฟรีร้องเฮพร้อมกันทั้งแผ่นดิน รวมถึงคนเขียนด้วย) แต่มีความเป็นไปได้ว่า Open AI อาจจะมีเทคโนโลยีที่ล้ำยิ่งกว่านี้สำหรับผู้ใช้แบบเสียเงินก็เป็นได้ 

นอกจากนี้แล้วในคืนนี้ยังมีงาน Google I/O ที่จะมีการอัปเดตนวัตกรรมใหม่ของ Google ก็ต้องมาคอยดูกันว่าการเปิดตัวนวัตกรรมใหม่ของ Google จะสูสีกับบ้าน Open AI ได้หรือไม่ ต้องจับตาดูกันอย่างใกล้ชิดต่อไป 

Update ความรู้จาก Disrupt ได้ที่ช่องทาง