SCB10X เปิดตัว "Typhoon" โมเดลGenAI ภาษาไทยโดยเฉพาะ คนไทยใช้งานได้ไม่ติดขัดเรื่องภาษาอีกต่อไป

Tech & Innovation

Tech Companies

กองบรรณาธิการ

กองบรรณาธิการ

Tag

SCB10X เปิดตัว "Typhoon" โมเดลGenAI ภาษาไทยโดยเฉพาะ คนไทยใช้งานได้ไม่ติดขัดเรื่องภาษาอีกต่อไป

Date Time: 30 ม.ค. 2567 11:58 น.

Video

ดร.พิพัฒน์ KKP กระเทาะโจทย์เศรษฐกิจไทย บุญเก่าเจอความเสี่ยง บุญใหม่มาไม่ทัน

Summary

  • SCB 10X พัฒนา "ไต้ฝุ่น" (Typhoon) โมเดลภาษาไทยขนาดใหญ่ มีประสิทธิภาพเทียบเท่าได้กับ GPT-3.5 ในเวอร์ชันภาษาไทย

Latest


SCB 10X บริษัทภายใต้กลุ่มเอสซีบี เอกซ์ (SCBX Group) เปิดตัว "ไต้ฝุ่น” (Typhoon) โมเดลประมวลภาษาขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดล GenAI ในปัจจุบันถูกเทรนด์ด้วยภาษาอังกฤษ ทำให้การใช้งานให้ได้ประสิทธิภาพมากที่สุดจำเป็นต้องใช้เพียงภาษาอังกฤษเท่านั้น 

ทั้งนี้ "Typhoon" ถูกออกแบบมาเป็นโมเดลโอเพนซอร์ส และเปิดให้ได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model และเวอร์ชัน Instruction-tuned model ผ่าน API service อย่างไม่มีค่าใช้จ่าย 

  1. Pretrained Model ซึ่งเปรียบเสมือนการสอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก
  2. Instruction-tuned Model ซึ่งเปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากขั้นตอนการ Pretraining ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม เป็นต้น ซึ่งผลการทดลองในชุดข้อสอบภาษาไทยแสดงให้เห็นว่า Typhoon มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยที่เผยแพร่สาธารณะอยู่ทั้งหมด 

SCB 10X เปิดเผยว่า โมเดล "Typhoon" ใช้ข้อมูลในการเทรนด์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย และมีประสิทธิภาพเทียบเท่าได้กับ GPT-3.5 ในเวอร์ชันภาษาไทย โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย

นอกจากนี้ "Typhoon" โมเดลภาษาไทยขนาดใหญ่ ถือเป็นก้าวสำคัญในการพัฒนาโมเดลภาษา AI สำหรับภาษาไทยที่จะลดข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language) ซึ่งจะเป็นส่วนสำคัญในการเพิ่มขีดความสามารถด้านการแข่งขันให้แก่อุตสาหกรรม AI ของไทย และเปิดโอกาสใหม่ๆ สำหรับการใช้งานทางภาษาที่หลากหลาย 

โดย SCB 10X เปิดให้ผู้สนใจและนักพัฒนาได้ทดลองใช้ Typhoon-7B ในเวอร์ชัน Pretrained model ภายใต้ใบอนุญาต Apache 2.0 อย่างไม่มีค่าใช้จ่าย โดยสามารถดาวน์โหลดได้ที่  https://huggingface.co/scb10x/typhoon-7b 

ซึ่งมีรายงานเชิงเทคนิคประกอบ สามารถอ่านเพิ่มเติมได้ที่ https://arxiv.org/abs/2312.13951   


Author

กองบรรณาธิการ

กองบรรณาธิการ