สวัสดีครับ วันนี้ผมจะมาเล่าถึง GPT-4o ที่เพิ่งเปิดตัวไปเมื่อวันที่ 13 พฤษภาคม 2024 นี้เอง ตัว 'o' ที่ต่อท้ายมาจากคำว่า "omni" ที่แปลว่า "ทุกสิ่ง" เพราะมันทำได้จริงๆ ครับ ทั้งดูภาพ ฟังเสียง อ่านข้อความ ดูวิดีโอ แถมตอบกลับได้เร็วมากๆ แค่ 232-320 มิลลิวินาที เทียบเท่ากับความเร็วที่คนเราคุยกันเลยทีเดียว
มันทำอะไรได้บ้าง?
สิ่งที่น่าทึ่งที่สุดคือ GPT-4o เป็นโมเดลแรกที่รวมทุกอย่างไว้ในที่เดียว ไม่ต้องแยกโมเดลเหมือนแต่ก่อน อยากคุย ก็คุย อยากดูรูป ก็ดู อยากฟังเสียง ก็ฟัง ทำได้หมดในตัวเดียว แถมยังฉลาดพอๆ กับ GPT-4 Turbo ในการใช้ภาษาอังกฤษและเขียนโค้ด แต่เก่งกว่าในภาษาอื่นๆ
เรื่องภาษานี่เจ๋งมาก
ลองคิดดูครับ แต่ก่อนถ้าจะแปลภาษาต่างๆ ต้องใช้ token เยอะมาก แต่ GPT-4o ลดลงได้เยอะมากๆ อย่างภาษาคุชราตลดลงตั้ง 4.4 เท่า ภาษาเตลูกูก็ 3.5 เท่า ทำให้ประหยัดทั้งเวลาและทรัพยากรในการประมวลผล
ปลอดภัยแน่นอน
OpenAI ไม่ได้มาเล่นๆ ครับ เขาให้ผู้เชี่ยวชาญกว่า 70 คนมาทดสอบความปลอดภัย ทั้งด้านจิตวิทยา ความเป็นธรรม และการตรวจสอบข้อมูลเท็จ ผลออกมาว่าความเสี่ยงอยู่ในระดับกลางหรือต่ำกว่าทั้งหมด ใช้ได้สบายใจ
แล้วจะใช้ได้เมื่อไหร่?
ตอนนี้เริ่มใช้ได้แล้วใน ChatGPT ทั้งแบบฟรีและแบบ Plus ส่วนนักพัฒนาที่จะใช้ API ก็มีข่าวดี เพราะเร็วขึ้น 2 เท่า ราคาถูกลงครึ่งนึง และใช้งานได้เยอะขึ้น 5 เท่า เมื่อเทียบกับ GPT-4 Turbo เดิม แต่ถ้าอยากใช้ฟีเจอร์เสียงกับวิดีโอ ต้องรออีกนิดนะครับ จะทยอยปล่อยออกมาในอีกไม่กี่สัปดาห์ข้างหน้า
ถือว่าเป็นการอัพเกรดครั้งใหญ่ของ OpenAI เลยทีเดียว ที่จะทำให้การใช้งาน AI ใกล้เคียงกับการคุยกับคนจริงๆ มากขึ้นไปอีก