เทคโนโลยีปัญญาประดิษฐ์ (AI) กำลังพัฒนาไปอย่างรวดเร็ว แทบจะวันต่อวัน มีศักยภาพที่จะเติบโตในอนาคตไปได้อีกไกล และกำลังเข้ามามีบทบาทสำคัญของมนุษย์เราในหลายๆด้าน

โดยเฉพาะ Generative AI หรือ Gen AI กับความฉลาดที่สามารถสร้างคอนเทนต์หรือเนื้อหาใหม่ๆอัตโนมัติได้หลากหลายแบบไม่จำกัดผ่านอุปกรณ์คอมพิวเตอร์และอุปกรณ์พกพาต่างๆสะดวกรวดเร็ว การใช้คำสั่งตัวหนังสือหรือข้อความให้เป็นรูปภาพที่สร้างความฮือฮาสามารถสร้างได้ภายในพริบตาเดียว กลายเป็นเรื่องปกติ ธรรมดาไปแล้ว

เมื่อ OpenAI หนึ่งในผู้บุกเบิกแล็บการวิจัย AI ที่ได้พัฒนาโมเดลและเครื่องมือหลายๆ ตัวที่นิยมใช้กันแพร่หลายในขณะนี้ เช่น GPT เพื่อสร้างข้อความ รวมถึงคอนเทนต์ต่างๆ และ DALL-3 ที่สร้างภาพจากข้อความ กลายเป็นเรื่องธรรมดาไปแล้ว

สัปดาห์ที่ผ่านมา OpenAI เปิดตัวโมเดลตัวล่าสุด Sora AI สามารถสร้างวิดีโอเหมือนจริงคุณภาพสูงด้วยคำสั่งจากข้อความจากจินตนาการของผู้ป้อน เริ่มแรกสามารถสร้างได้กับความยาว 1 นาที ซึ่งสามารถสร้างตัวละครหลายๆตัว มีการ เคลื่อนไหวเฉพาะเจาะจง สามารถรวบรวมรายละเอียดของวัตถุและฉากหลังได้อย่างแม่นยำ ขณะนี้อยู่ระหว่างการทดสอบภายใน แต่เมื่อดูตัวอย่างการสร้างนับว่าน่าประทับใจไม่น้อย

...

สร้างวิดีโอไม่พอ ล้ำไปอีกด้วยความสามารถสร้างเสียงประกอบแบบซาวด์เอฟเฟกต์สมจริงได้อีกจาก ElevenLabs สตาร์ตอัพการโคลนเสียง ช่วยเสริมให้วิดีโอที่ Sora สร้างขึ้นเช่น คลื่นกระแทก, เสียงดังกึกก้อง, เสียงนกร้อง และ เครื่องยนต์รถแข่ง เพื่อสร้างเสียงที่เราซ้อนทับบนคลิปที่เราชื่นชอบ ซึ่งคงต้องรอดูการทำงานเต็มๆต่อไป

ทางด้านกูเกิล (Google) หลังจากเปิดตัว Gemini (เจมิไน) โมเดล AI คู่แข่งสำคัญ GPT ล่าสุดได้ออกมาหยุดให้บริการสร้างภาพบุคคล เนื่องจากพบข้อบกพร่องว่าการสร้างภาพประวัติศาสตร์ยังไม่ถูกต้อง เช่น ภาพบุคคลของผู้ก่อตั้งประเทศสหรัฐอเมริกากลายเป็นรูปชาวอเมริกันอินเดียน, คนผิวดำหรือคนเอเชีย ซึ่งทำให้เกิดการวิพากษ์วิจารณ์ หรือการสร้างภาพทหารเยอรมันในยุคนาซี เป็นภาพสาวหน้าหมวย คนผิวดำ เป็นต้น ต้องรอการปรับปรุงก่อน

ขณะเดียวกันกูเกิลยังได้เปิดตัว Gemma (เจมม่า) เป็นโมเดลใหม่สำหรับนักพัฒนาที่นำไปต่อยอดใช้บนแอปพลิเคชันของตนเอง เป็นโมเดลภาษาขนาดใหญ่สองตัวคือ Gemma 2B และ 7B มีประสิทธิภาพที่ดีที่สุดในระดับเดียวกัน และโมเดล Gemma สามารถทำงานได้โดยตรงบนแล็ปท็อปสำหรับนักพัฒนาหรือคอมพิวเตอร์เดสก์ท็อป โดยเฉพาะอย่างยิ่ง Gemma เหนือกว่าโมเดลที่ใหญ่กว่าอย่างเห็นได้ชัดในการวัดประสิทธิภาพที่สำคัญ

กูเกิลยังได้โชว์ผลการทดสอบ Gemma 7B มีคะแนนเหนือกว่า Llama-2 7B และ 13B ของ Meta ในทุกๆด้าน ปัจจุบันอยู่ระหว่างการพัฒนาอยู่ โดยกูเกิลคาดหวังว่า Gemma จะเป็นเครื่องมือที่มีประโยชน์สำหรับผู้ใช้ทั่วไป นักเรียน นักเขียน นักพัฒนาซอฟต์แวร์ และอื่นๆอีกมากมาย

...

สำหรับความแตกต่างระหว่าง Gemini และ Gemma ซึ่ง Gemini มีขนาดใหญ่กว่า เหมาะสำหรับงานที่ต้องการความซับซ้อนสูง Gemma เป็นโอเพ่นซอร์สเหมาะสำหรับงานทั่วไป จุดดีของโมเดลหลายๆตัวสามารถเปรียบเทียบและเลือกโมเดลที่เหมาะสมกับงาน

ขณะเดียวกันหลังจากกูเกิลปล่อย Gemini Ultra 1.0 โมเดลรุ่นใหญ่สุด ในรูปแบบพรีเมียมมีค่าใช้จ่ายได้ไม่กี่วัน ล่าสุดได้เปิดตัว Gemini 1.5 Pro เป็นโมเดลขนาดกลางที่ถูกปรับให้เหมาะกับการขยายขนาดในหลากหลายงานรองรับอินพุชขนาดใหญ่ถึง 1 ล้านโทเคนมีคุณสมบัติใหม่ๆ เช่นสามารถอัปโหลดไฟล์ PDF ขนาดใหญ่ 7 แสนคำ, คลังโค้ด 3 หมื่นบรรทัด, วิดีโอยาว 1 ชั่วโมง เป็นคำสั่งได้โดยตรงจาก Google AI Studio

เทคโนโลยี AI กำลังพัฒนาอย่างรวดเร็ว มีการค้นพบและพัฒนาโมเดล AI ใหม่ๆอยู่เสมอแทบทุกวัน ซึ่งทำให้ความสามารถพัฒนาไปอย่างก้าวกระโดด สิ่งที่เกิดขึ้นจะส่งผลต่อการเปลี่ยนแปลงการทำงานจะมีบทบาทสำคัญในการใช้ชีวิตประจำวันที่เราต้องเตรียมพร้อมรับการเปลี่ยนแปลงที่จะเกิดขึ้น.

คลิกอ่านคอลัมน์ “บทความไซเบอร์เน็ต” เพิ่มเติม

...