สรุปเนื้อหางาน Google I/O 2024 งานประชุมนักพัฒนาของ Google ครั้งแรกของปีนี้ ซึ่งเป็นงานใหญ่แห่งปีที่ Google จะมีอัปเดตความเคลื่อนไหว และเปิดตัวผลิตภัณฑ์ใหม่ต่างๆ แน่นอนว่าประเด็นที่ถูกจับจ้องมากที่สุดคงหนีไม่พ้นเรื่อง AI ว่า Google จะงัดไม้เด็ดอะไรออกมาบ้าง
โดยงานครั้งนี้กินเวลารวมเกือบสองชั่วโมง ในระหว่างการนำเสนอ Sundar Pichai ได้กล่าวถึง AI ถึง 121 ครั้งด้วยกัน สะท้อนให้เห็นถึงความสำคัญของ AI ที่ Google ให้มุ่งเน้นในปีนี้
สำหรับ Gemini ปัจจุบันมีผู้ใช้งานแบบทั่วไปกว่า 2 พันล้านคน ขณะที่ Gemini Advanced มีผู้ลงทะเบียนทดลองใช้มากกว่า 1 ล้านคน ภายในเวลา 3 เดือน รวมถึงยังมีนักพัฒนามากกว่า 1.5 ล้านคน ที่นำโมเดล Gemini ไปใช้งานด้วย แล้วในงาน Google I/O 2024 ได้มีการอัปเกรดอย่างไรบ้าง
ถือเป็นอีกหนึ่งความก้าวหน้าล่าสุดที่เรียกเสียงฮือฮาไม่น้อยกับ Project Astra ที่บอกเลยว่าท้าชนกับ GPT-4o ที่ OpenAI เปิดตัวไปก่อนหน้า 1 วัน ได้แบบไม่แพ้กัน ซึ่งมันก็คือ Multimodal AI Assistant ที่สามารถรับข้อมูลทั้งในรูปแบบภาพ เสียง วิดีโอ แบบเรียลไทม์
การอัปเกรดของ Gemini AI คือ Gemini 1.5 Pro ซึ่งสามารถวิเคราะห์เอกสาร วิดีโอ และบันทึกเสียงที่ยาวขึ้นได้ดีขึ้น โดยสามารถรับข้อมูลได้ถึง 2 ล้านโทเคน ซึ่งเป็นสองเท่าของจำนวนสูงสุดก่อนหน้านี้ ทำให้ Gemini 1.5 Pro เป็นโมเดลที่มีความสามารถในการรับข้อมูลที่ใหญ่ที่สุดในท้องตลาดปัจจุบัน
ในงานครั้งนี้ได้มีการแนะนำ Gemini Live ที่ช่วยให้ผู้ใช้สามารถสนทนาด้วยเสียงกับ Gemini บนสมาร์ทโฟน โดยผู้ใช้สามารถขัดจังหวะเพื่อถามคำถามเพิ่มเติมและ Gemini จะปรับตัวตามรูปแบบการพูดของคู่สนทนาแบบเรียลไทม์ นอกจากนี้ Gemini ยังสามารถมองเห็นและตอบสนองต่อสภาพแวดล้อมของผู้ใช้ผ่านภาพถ่ายหรือวิดีโอจากกล้องได้ด้วย
Google ประกาศสร้าง Gemini Nano ซึ่งเป็นโมเดล AI ที่เล็กที่สุด โดยจะฝังเข้าไปใน Chrome ซึ่งจะช่วยให้นักพัฒนาสามารถใช้โมเดลในอุปกรณ์เพื่อขับเคลื่อนคุณสมบัติ AI ของตนเองได้
Google เตรียมนำ Gemini AI มาใช้บน Android แทน Google Assistant ที่มีอยู่เดิม โดยผู้ใช้จะสามารถลากและวางภาพที่สร้างขึ้นโดย AI ได้โดยตรงใน Gmail, Google Messages และแอปอื่นๆ
Gemini AI จะมาเพิ่มความสามารถให้กับ Gmail โดยผู้ใช้งาน Gmail จะสามารถค้นหา สรุป และร่างอีเมลของตนโดยใช้ Gemini AI ได้อย่างมีประสิทธิภาพ และสามารถทำงานที่ซับซ้อนได้มากขึ้นด้วย
Google ยังนำความสามารถของโมเดล Gemini มาสู่แพลตฟอร์ม Google Maps สำหรับนักพัฒนา เริ่มต้นด้วย Places API ที่นักพัฒนาจะสามารถแสดงสรุป AI ของสถานที่และพื้นที่ในแอปฯ และเว็บไซต์ของตนได้อย่างง่ายดายโดยไม่ต้องเขียนคำอธิบายสถานที่ด้วยตนเอง
เพื่อจะลบล้างข้อครหาว่า Google กำลังสูญเสียส่วนแบ่งการตลาดให้กับคู่แข่ง อย่าง ChatGPT และ Perplexity นั้น Google มีแผนที่จะใช้ Generative AI จัดระเบียบหน้าผลการค้นหาทั้งหมดใหม่ โดยเป็นการเพิ่มเติมจากคุณสมบัติ AI Overview ที่มีอยู่แล้ว ที่สามารถสร้างสรุปสั้นๆ พร้อมข้อมูลรวมเกี่ยวกับหัวข้อที่ผู้ใช้กำลังค้นหา
นอกจากนี้ Google เปิดตัว Imagen 3 ซึ่งเป็นสมาชิกล่าสุดของตระกูลโมเดล Generative AI ของบริษัท โดย Imagen 3 เข้าใจคำสั่งข้อความที่แปลเป็นภาพได้แม่นยำกว่ารุ่นก่อน และสร้างภาพที่มีความคิดสร้างสรรค์และมีรายละเอียดมากขึ้น รวมการเกิดข้อผิดพลาดที่น้อยลง
สำหรับ Veo เป็นโมเดล AI ที่สามารถสร้างคลิปวิดีโอ 1080p ความยาวประมาณหนึ่งนาทีจากคำสั่งข้อความ อีกทั้งยังสามารถแก้ไขและปรับเปลี่ยนวิดีโอที่สร้างขึ้นแล้วได้อย่างมีประสิทธิภาพ
Google เปิดตัวแบบทดสอบที่สร้างโดย AI บน YouTube ซึ่งเป็นเครื่องมือ AI ใหม่ที่ช่วยให้ผู้ใช้สามารถถามคำถามที่ต้องการคำชี้แจงเพิ่มเติม หรือทำแบบทดสอบเกี่ยวกับเนื้อหาที่กำลังดูอยู่ โดยฟีเจอร์ใหม่นี้ช่วยลดภาระของผู้ที่ต้องดูวิดีโอเพื่อการศึกษาแบบยาวๆ เช่น คลาสเรียน หรืองานสัมมนา ผ่านการใช้ความสามารถในการเข้าใจบริบทยาวๆ ของโมเดล Gemini
Google ได้แสดงฟีเจอร์ใหม่ที่จะเตือนผู้ใช้ถึงการหลอกลวงในระหว่างการโทร ฟีเจอร์นี้จะถูกรวมเข้าใน Android รุ่นถัดไป โดยใช้ Gemini Nano ซึ่งเป็นเวอร์ชันที่เล็กที่สุดของ Google Generative AI ที่สามารถทำงานได้ทั้งหมดในอุปกรณ์ ฟีเจอร์นี้จะฟังรูปแบบการสนทนาที่มักเกี่ยวข้องกับการหลอกลวงแบบเรียลไทม์ เมื่อพบรูปแบบที่น่าสงสัย จะมีการแจ้งเตือนให้ผู้ใช้ทราบถึงความเสี่ยงทันที
อ้างอิง Google I/O
ติดตามเพจ Facebook : Thairath Money ได้ที่ลิงก์นี้ - https://www.facebook.com/ThairathMoney