ศูนย์ธรรมาภิบาลปัญญาประดิษฐ์ (AI Governance Clinic หรือ AIGC) เปิดข้อมูลเมื่อปัญญาประดิษฐ์หรือ AI ถูกพัฒนาจาก Generative AI ไปสู่การเป็น AI Deepfake ที่ฉลาดล้ำ จนสามารถสร้างเนื้อหาภาพและเสียงเสมือนจริงจนแยกไม่ออก ว่านี่คือชุดข้อมูลที่มนุษย์หรือเทคโนโลยี AI เป็นผู้สร้างขึ้น คนในยุค AI ครองโลก จึงแทบไม่สามารถล่วงรู้ได้เลยว่า ภาพวิดีโอหรือเสียง ที่แชร์ส่งต่อกันบนโลกออนไลน์นั้น คือความจริงหรือภาพลวง
ศูนย์ธรรมาภิบาลปัญญาประดิษฐ์ ภายใต้สำนักงานพัฒนาธุรกรรมทางอิเล็กทรอนิกส์หรือ เอ็ตด้า (ETDA) ให้ข้อมูลว่า AI Deepfake คือ Generative AI รูปแบบหนึ่ง ที่สามารถสร้างสื่อสังเคราะห์ ทั้งภาพนิ่ง เสียง ภาพเคลื่อนไหวพร้อมเสียง ได้เหมือนคนพูดจริงๆ จนแทบแยกไม่ออก ด้วยระบบการเรียนรู้หรือ Deep Learning จากลักษณะภายนอกของบุคคล เช่น สีผิว ตา ปาก จมูก รูปลักษณ์ต่างๆ ความฉลาดล้ำจากการเรียนรู้ข้อมูลมหาศาลของ Generative AI ทำให้สร้างภาพและเสียงได้ราวกับว่าคนคนนั้นเป็นคนพูดอยู่จริง
...
AI Deepfake จึงมีทั้งข้อดีและข้อเสีย เปรียบได้กับเหรียญ 2 ด้าน ในแง่มุมที่ดี ยกตัวอย่างเช่น การจำลอง “อัลเบิร์ต ไอน์สไตน์” ขึ้นมา เพื่อให้รับบทเป็นครูสอนวิชาวิทยาศาสตร์ เป็นการเพิ่มอรรถรสในการเรียน แต่หากถูกใช้ในทางไม่ดี ย่อมสร้างความเสียหายได้มหาศาล ยกตัวอย่างกรณีพระอาจารย์เกจิชื่อดัง ถูกนำภาพเคลื่อนไหวไปสร้างคลิปที่มีเนื้อหาสื่อความหมายใหม่ โดยใช้ AI Deepfake ทำให้คนหลงเชื่อและสร้างความเข้าใจผิด
ทั้งนี้ การสร้างคลิปภาพและเสียงจาก AI Deepfake หลักๆ มี 2 แบบ คือ การปลอมแค่บางส่วน หรือ Face Wrap เช่น เอาหน้าที่อยากปลอมไปแปะใส่หน้าคนจริง แล้วให้พยายามเลียนแบบเสียงและพฤติกรรมให้เหมือนคนนั้นๆ ส่วนอีกวิธีคือการปลอมทั้งหมดหรือ Face Reenactment โดยใช้ AI เรียนรู้ข้อมูลต่างๆ ทั้งการให้แสงเงา การกะพริบตา การยิ้ม เลียนแบบทุกอย่าง ก่อนสร้างภาพเสียงสังเคราะห์เป็นคนคนนั้นขึ้นมา หากฟังแบบเผินๆ จะเหมือนจนยากจะแยกออก ยกตัวอย่าง รายการ America’s Got Talent รายการโชว์ความสามารถจากสหรัฐอเมริกา ที่ได้ใช้เทคโนโลยี AI Deepfake มาสร้างภาพและเสียงเลียนแบบนักร้องชื่อดังในตำนาน อย่าง Elvis Presley เพื่อทำให้การแสดงกลับมามีชีวิตอีกครั้ง จนทำให้ผู้ชมตกใจและเกือบเชื่อว่า คลิป Elvis Presley ที่เห็นเป็นเรื่องที่เกิดขึ้นจริง
อย่างไรก็ตาม แม้ AI จะสามารถสร้างภาพเคลื่อนไหว-เสียง ปลอมจนตาเปล่าแทบแยกไม่ออก แต่มันไม่สามารถเลียนแบบอัตลักษณ์ หรือ Identity ได้ ไม่ว่าจะเป็นม่านตา เลือด DNA ฟัน หรือลายนิ้วมือ ซึ่งอัตลักษณ์เหล่านี้ถูกนำมาใช้ในกระบวนการพิสูจน์และยืนยันตัวตนทางดิจิทัล หรือ Digital ID
ส่วนการจะพิจารณาว่าคลิปที่เราเห็น ถูกสร้างจาก AI Deepfake หรือไม่นั้น อาจเป็นเรื่องยาก ต้องใช้วิจารณญาณ เตือนตัวเองว่าอย่าเชื่อแค่ภาพที่เห็น เสียงที่ได้ยิน แล้วกดไลค์ กดแชร์ต่อ หรือแสดงความคิดเห็นทันที ต้องมององค์ประกอบหรือปัจจัยอื่นๆ ตลอดจนบริบทที่เกิดขึ้น ว่ามีโอกาสที่คนคนนี้จะพูดแบบนี้จริงหรือไม่.