Lumiere AI จาก Google สุดล้ำ! สร้างวิดีโอจากข้อความ
Sora โมเดลสร้างวิดีโอรายละเอียดสูงจาก OpenAI
Share
20 ก.พ. 2567

หลังจากที่ทาง Google ได้เปิดตัว Lumiere AI สุดล้ำ! สร้างวิดีโอจากข้อความ ไปเมื่อช่วงปลายเดือนมกราที่ผ่านมา เรียกได้ว่าก็ถึงเวลาที่ทาง OpenAI ได้เปิดตัวโมเดล AI Text-to-Video ของตัวเองกันบ้าง กับ Sora โมเดลสร้างวิดีโอรายละเอียดสูง จุดเด่นของโมเดลนี้คือการสร้างวิดีโอความยาวถึง 1 นาทีตามคำสั่งหรือ Prompt ที่เราระบุเข้าไป ที่แยกรายละเอียดของวัตถุกับพื้นหลังได้อย่างชัดเจน ซึ่งบอกเลยว่าถ้าเปิดให้ใช้งานจริง จะต้องสร้างคลื่นลูกใหญ่ให้กับวงการแอนิเมชันแน่นอนครับ โดยประสิทธิภาพของ Sora จะมีอะไรบ้าง พวกเรา Mercular จะมาสรุปให้ฟังกันในบทความนี้ครับ

สำหรับเจ้า Sora นั้นเป็นโมเดล AI ที่ได้รับการพัฒนาต่อยอดมาจากโมเดล DALL-E (โมเดลสร้างภาพจากข้อความ Text-to-Picture) และ GPT โดยการให้เรียนรู้จากฐานข้อมูลรูปภาพขนาดใหญ่ ที่จะไม่ใช่แค่เข้าใจคำสั่งจาก Prompt เท่านั้นแต่จะต้องเข้าใจฟิสิกส์ของสิ่งเหล่าต่าง ๆ ในโลกจริงด้วย ทำให้ Sora นั้นสามารถสร้างวิดีโอที่ซับซ้อน มีตัวละครจำนวนมาก ๆ ทำท่าทางที่แตกต่างกันได้ในรายละเอียดที่สูงลิบ สมจริง นอกจากนี้ยังสามารถแสดงอารมณ์ทางสีหน้า ท่าทาง รวมถึงจัดมุมกล้องต่าง ๆ ตาม Prompt ที่ป้อนเข้ามาได้ด้วย

จากวิดีโอความยาวกว่า 10 นาทีที่ทาง OpenAI ได้ปล่อยออกมาเราจะได้เห็นถึงประสิทธิภาพของวิดีโอที่โมเดล Sora สามารถสร้างขึ้นมาได้ ซึ่งไม่ได้จำกัดแค่ภาพแอนิเมชันหรือภาพที่สมจริงเท่านั้น แต่สามารถสร้างได้ถึงฉากตามวิชชวลสไตล์ต่าง ๆ ที่ต้องการได้ ซึ่งสามารถกำหนดเป็นมุมมองของฉากได้เลย ไม่ว่าจะเป็นมุมสูงจากโดรนที่บินอยู่ มุมจากกล้องที่กำลังวิ่งตามรถ หรือฉากที่ถ่ายจากกล้องฟิล์ม 3.5 mm นอกจากนี้ยังสามารถสร้างฉากตามสถานที่จริงที่ระบุลงใน Prompt ได้อีกด้วย โดยเขาได้อธิบายเพิ่มเติมว่า ไม่ได้ทำได้แค่สร้างวิดีโอ Text-to-Video เท่านั้น แต่การทำให้ภาพนิ่งขยับได้หรือยืดให้วิดีโอยาวขึ้น เจ้าโมเดลตัวนี้ก็สามารถทำได้ ซึ่งฟีเจอร์เหล่านี้ถือเป็นหนึ่งในฟีเจอร์ชูโรงของเจ้า Lumiere จากทาง Google เลยครับ เรียกได้ว่าประกาศตัวพร้อมเป็นคู่แข่งให้กับ Lumiere แบบตรง ๆ

ตอนนี้เจ้า Sora ยังอยู่ในขั้นตอนวิจัยและมีจุดบกพร่องจำนวนมาก โดยตอนนี้มันยังไม่สามารถสร้างฉากจำลองฟิสิกส์ที่ซับซ้อนได้ เช่น การกัดคุ้กกี้ ที่สามารถสร้างภาพคนกัดคุ้กกี้ได้ แต่ที่ตัวคุ้กกี้จะไม่มีรอยกัด เป็นต้น นอกจากนี้ยังมีเรื่องการรับรู้ทิศทางจาก Prompt ที่ป้อนเข้าไป จนทำให้ฉากที่ออกมาไม่สมเหตุสมผล แต่บอกเลยว่าทำออกมาได้ดีมาก ๆ โดยตอนนี้ทาง OpenAI กำลังประเมินความเสี่ยงของการนำไปใช้ในทางที่ผิด และกำลังรับฟังฟีดแบ็คจากศิลปินและคนทำหนังนอกเหนือจากคนในอยู่ จึงไม่น่าจะปล่อยออกมาให้ใช้สาธารณะเร็ว ๆ นี้ครับ และนี่คือทั้งหมดที่พวกเรา Mercular ได้นำมาบอกเล่ากันในวันนี้ เทคโนโลยีในยุคนี้ก้าวไปข้างหน้ารวดเร็วจริง ๆ เหมือนกับ Mercular ที่จัดส่งสินค้าได้รวดเร็วไม่แพ้กัน พวกเรามีสินค้าคุณภาพตั้งแต่ โน๊ตบุ๊ค เกมมิ่งเกียร์ หูฟังและลำโพง ที่ล้วนคัดสรรมาจากแบรนด์คุณภาพเพื่อคุณโดยเฉพาะ คราวหน้าจะเป็นบทความที่น่าสนใจแบบไหนอีก ก็อย่าลืมติดตามกันไว้ สำหรับวันนี้สวัสดีครับ



คีย์บอร์ด Ajazz AK820 Max Plus Wireless Mechanical Keyboard (EN/TH)


จอคอม Acer RS242Y G0bpamix 23.8" IPS FHD Monitor 120Hz


จอคอม Acer EK251QGbmix 24.5" IPS FHD Monitor 120Hz


จอคอม Acer VG240Y X1bmiipx 23.8" IPS FHD Monitor 200Hz


จอคอม Dell U3223QZ 31.5" IPS 4K FHD Monitor 60Hz