ทีมวิจัย Microsoft พัฒนาโมเดล AI ที่ชื่อว่า “VASA-1” ซึ่งสามารถสร้างวิดีโอแบบเรียลไทม์ได้จากคลิปเสียงและภาพนิ่งเพียงรูปเดียว
ทาง Microsoft ระบุว่าตัวโมเดล VASA-1 ไม่เพียงแค่สร้างวิดีโอที่ปากซิงก์กับเสียงอย่างแนบเนียนเท่านั้นแต่ยังเก็บรายละเอียดใบหน้าและการเคลื่อนไหวอย่างเป็นธรรมชาติที่ทำให้เกิดรู้สึกสมจริงและมีชีวิตชีวา
พร้อมรองรับการสร้างวิดีโอออนไลน์คุณภาพสูงความละเอียด 512x512 ที่ Frame Rate สูงถึง 40 FPS และนอกจากสร้างวิดีโอจากภาพคนแล้วก็ยังสามารถสร้างวิดีโอได้จากภาพวาด เสียงร้องเพลง หรือแม้แต่เสียงจากภาษาอื่นที่ไม่ใช่ภาษาอังกฤษ ทั้งยังปรับแต่งท่าทางและการแสดงสีหน้าอารมณ์ได้อีกด้วย
อย่างไรก็ตาม ทางทีมวิจัย Microsoft ระบุว่า ภาพตัวอย่างที่นำมาทำเป็นคลิปวิดีโอนั้นเป็นภาพที่สร้างโดย AI (DALL·E-3) ไม่ใช่ภาพบุคคลที่มีอยู่จริงและเป็นเพียงการแสดงงานวิจัย ซึ่งยังไม่ได้มีแผนที่จะเปิดให้ใช้โปรดักต์หรือ API หรือเปิดเผยรายละเอียดเพิ่มเติมใดๆ จนกว่าจะแน่ใจได้ว่าเทคโนโลยีนี้จะถูกนำไปใช้อย่างมีความรับผิดชอบและสอดคล้องกับกฎเกณฑ์
ขณะที่จุดประสงค์หลักของการวิจัยจะเน้นไปที่การพัฒนาอวตาร AI ที่ใช้ในเชิงบวกเท่านั้นและไม่ได้ต้องการให้ใช้สร้างคอนเทนต์หลอกลวงหรือก่อให้เกิดความเข้าใจผิด ซึ่ง Microsoft เห็นถึงประโยชน์ที่จะใช้ประโยชน์ โมเดล VASA-1 ในด้านการศึกษาหรือช่วยเหลือผู้ที่มีปัญหาด้านการสื่อสารและอีกมากมายด้วยเป้าหมายการพัฒนา AI เพื่อยกระดับความเป็นอยู่ที่ดีของมนุษย์
อ้างอิง
ติดตามเพจ Facebook : Thairath Money ได้ที่ลิงก์นี้ - https://www.facebook.com/ThairathMoney