ลอง OpenAI Sora ดูสิ
สร้างวิดีโอจากข้อความ/รูปภาพ, สร้างวิดีโอวงวน, ขยายวิดีโอไปข้างหน้าและข้างหลัง
เป็นคนแรกที่ทราบเมื่อ Sora ออนไลน์!
เกี่ยวกับ OpenAI Sora
สอระคืออะไร
โมเดลข้อความเป็นวิดีโอของ OpenAI โซระสามารถสร้างวิดีโอที่ยาวสูงสุดถึงหนึ่งนาที พร้อมรักษาคุณภาพทางสายตาและความเชื่อถือตามคำสั่งข้อความของผู้ใช้
เป้าหมายของ Sora
Sora ทำหน้าที่เป็นพื้นฐานสำหรับโมเดลที่สามารถเข้าใจและจำลองโลกของจริง ช่วยให้คนสามารถแก้ปัญหาที่ต้องการการจริงในโลกที่แท้จริงได้
ความก้าวหน้า
เฉพาะทีมสีแดงและศิลปินทางการสื่อสิ่งที่เชิญเข้าร่วมเท่านั้น
คุณสมบัติ
สนับสนุนตัวละครหลายตัว, ประเภทการเคลื่อนไหวที่เฉพาะ, เรื่องราว, และรายละเอียดของพื้นหลังอย่างแม่นยำ; นักแสดงเข้าใจว่าสิ่งเหล่านี้มีอยู่ในโลกทางกายภาพ, การถ่ายทอดหลายฉากในวิดีโอเดียว
ข้อ จำกัด
ความยากลำบากในการจำลองฟิสิกส์ที่ซับซ้อนอย่างแม่นยำ, ความสับสนในรายละเอียดของพื้นที่, การปรากฏขึ้นโดยไม่คาดคิดของวัตถุและตัวละคร, การจำลองฟิสิกส์ที่ไม่แม่นยำและการเปลี่ยนรูปร่างของวัตถุอย่างไมธรรมชาติ.
ความปลอดภัย
ร่วมมือกับทีมสีแดงในการดำเนินการทดสอบการต่อต้านเพื่อระบุและแก้ไขปัญหาด้านความปลอดภัยในโมเดล, สร้างเครื่องมือเพื่อช่วยตรวจจับเนื้อหาที่สร้างความสับสนโดยใช้ตัวจำแนกการตรวจจับและเมตาดาต้า C2PA.
แสดงความสำเร็จ - อัปเดตประจำวัน
Prompt
-
Prompt
Bubble Dragon
Prompt
Sora generates an imaginary video of the interview.
Prompt
an extreme close up shot of a woman's eye, with her iris appearing as earth
Prompt
fly through tour of a museum with many paintings and sculptures and beautiful works of art in all styles
Prompt
a red panda and a toucan are best friends taking a stroll through santorini during the blue hour
Prompt
a man BASE jumping over tropical hawaii waters. His pet macaw flies alongside him.
Prompt
a dark neon rainforest aglow with fantastical fauna and animals.
Prompt
Close-up of a majestic white dragon with pearlescent, silver-edged scales, icy blue eyes, elegant ivory horns, and misty breath. Focus on detailed facial features and textured scales, set against a softly blurred background.
Prompt
a scuba diver discovers a hidden futuristic shipwreck, with cybernetic marine life and advanced alien technology
Prompt
in a beautifully rendered papercraft world, a steamboat travels across a vast ocean with wispy clouds in the sky. vast grassy hills lie in the distant background, and some sealife is visible near the papercraft ocean's surface
Prompt
cinematic trailer for a group of samoyed puppies learning to become chefs.
Other AI video products
Company | Generation Type | Max Length | Extend? | Camera Controls? (zoom, pan) | Motion Control? (amount) | Other Features | Format |
---|---|---|---|---|---|---|---|
Runway | Text-to-video, image-to-video, video-to-video | 4 sec | Yes | Yes | Yes | Motion brush, upscale | Website |
Pika | Text-to-video, image-to-video | 3 sec | Yes | Yes | Yes | Modify region, expand canvas, upscale | Website |
Genmo | Text-to-video, image-to-video | 6 sec | No | Yes | Yes | FX presets | Website |
Kaiber | Text-to-video, image-to-video, video-to-video | 16 sec | No | No | No | Sync to music | Website |
Stability | Image-to-video | 4 sec | No | No | Yes | WebsiteLocal model, SDK | |
Zeroscope | Text-to-video | 3 sec | No | No | No | Local model | |
ModelScope | Text-to-video | 3 sec | No | No | No | Local model | |
Animate Diff | Text-to-video, image-to-video, video-to-video | 3 sec | No | No | No | Local model | |
Morph | Text-to-video | 3 sec | No | No | No | Discord bot | |
Hotshot | Text-to-video | 2 sec | No | No | No | Website | |
Moonvalley | Text-to-video, image-to-video | 3 sec | No | Yes | No | Discord bot | |
Deforum | Text-to-video | 14 sec | No | Yes | No | FX presets | Discord bot |
Leonardo | Image-to-video | 4 sec | No | No | Yes | Website | |
Assistive | Text-to-video, Image-to-video | 4 sec | No | No | Yes | Website | |
Neural Frames | Text-to-video, image-to-video, video-to-video | Unlimited | No | No | No | Sync to music | Website |
MagicHour | Text-to-video, image-to-video, video-to-video | Unlimited | No | No | No | Face swap, sync to music | Website |
Vispunk | Text-to-video | 3 sec | No | Yes | No | Website | |
Decohere | Text-to-video, Image-to-video | 4 sec | No | No | Yes | Website | |
Domo Al | Image-to-video, video-to-video | 3 sec | No | No | Yes | Discord bot |
คนพูดถึง Sora ใน x
SoraAI by OpenAI is wild.
— Alamin (@iam_chonchol) February 18, 2024
These are 100% generated only from text and take just 1 minute 🤯
10 wild examples ( 2nd is WOW ) pic.twitter.com/NLetbJVa2v
If you think OpenAI Sora is a creative toy like DALLE, ... think again. Sora is a data-driven physics engine. It is a simulation of many worlds, real or fantastical. The simulator learns intricate rendering, "intuitive" physics, long-horizon reasoning, and semantic grounding, all… pic.twitter.com/pRuiXhUqYR
— Jim Fan (@DrJimFan) February 15, 2024
"this close-up shot of a futuristic cybernetic german shepherd showcases its striking brown and black fur..."
— Bill Peebles (@billpeeb) February 18, 2024
Video generated by Sora. pic.twitter.com/Bopbl0yv0Y
Sora and Stable Video, text to video compare. pic.twitter.com/pZzSeSXPtN
— Retropunk (@RetropunkAI) February 17, 2024
OpenAI's Sora is the most advanced text-to-video tool yet. 💡
— Escher (@Escher_AI) February 16, 2024
It can generate compellingly realistic characters, create multiple dynamic shots in a single video, with accurate details of both subjects and background.
Here's the 10 best generations so far
🧵👇 pic.twitter.com/FHp0cxt0Ll
OpenAI's Sora is going to change marketing forever, enabling anyone to unleash his inner creativity.
— William Briot (@WilliamBriot) February 15, 2024
Check this 100% AI-generated video of Mammoth generated with the new "text-to-video" OpenAI model: pic.twitter.com/DcDGPjpBXC
"a photorealistic video of a butterfly that can swim navigating underwater through a beautiful coral reef"
— Tim Brooks (@_tim_brooks) February 17, 2024
Video generated by Sora pic.twitter.com/nebCKLa09U
Another Sora video, Sora can generate multiple videos side-by-side simultaneously.
— 🅱️WhiteAfricanSpaceJesus (@zespacejesus) February 18, 2024
This is a single video sample from Sora. It is not stitched together; Sora decided it wanted to have five different viewpoints all at once! pic.twitter.com/q2rfxh61CQ
Sora can also generate stories involving a sequence of events, although it's far from perfect.
— Bill Peebles (@billpeeb) February 17, 2024
For this video, I asked that a golden retriever and samoyed should walk through NYC, then a taxi should stop to let the dogs pass a crosswalk, then they should walk past a pretzel and… pic.twitter.com/OhqVFqR5vA
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
https://t.co/P26vJHlw06 pic.twitter.com/AW9TfYBu3b
— Sam Altman (@sama) February 15, 2024
https://t.co/rPqToLo6J3 pic.twitter.com/nPPH2bP6IZ
— Sam Altman (@sama) February 15, 2024
https://t.co/WJQCMEH9QG pic.twitter.com/Qa51e18Vph
— Sam Altman (@sama) February 15, 2024
a wizard wearing a pointed hat and a blue robe with white stars casting a spell that shoots lightning from his hand and holding an old tome in his other hand
— biden or buster (@willofdoug) February 15, 2024
คำถามที่พบบ่อย
Sora เป็นโมเดล AI ที่ถูกพัฒนาโดย OpenAI ซึ่งสามารถสร้างฉากวิดีโอที่สมจริงและสร้างสรรค์จากคำสั่งข้อความ มันถูกออกแบบให้จำลองโลกทางกายภาพในการเคลื่อนไหว สร้างวิดีโอที่ยาวถึงหนึ่งนาทีโดยรักษาคุณภาพภาพและปฏิบัติตามคำสั่งของผู้ใช้
Sora เป็นโมเดลการกระจายที่เริ่มต้นด้วยวิดีโอที่คล้ายกับเสียงรบกวนสถิตและเปลี่ยนแปลงไปเรื่อย ๆ โดยการลบเสียงรบกวนในหลายขั้นตอน มันใช้โครงสร้างของตัวแปรทรานส์ฟอร์เมอร์ที่คล้ายกับโมเดล GPT และแทนวิดีโอและภาพเป็นชุดข้อมูลที่เล็กลงที่เรียกว่า patches ได้
Sora สามารถสร้างวิดีโอในขอบเขตที่กว้าง รวมถึงฉากที่ซับซ้อนที่มีตัวละครหลายคน ประเภทของการเคลื่อนไหวที่เฉพาะเจาะจง และรายละเอียดที่แม่นยำของเรื่องราวและพื้นหลัง นอกจากนี้ มันยังสามารถใช้ภาพนิ่งที่มีอยู่และทำให้มันเคลื่อนไหว หรือขยายวิดีโอที่มีอยู่โดยเติมเต็มเฟรมที่ขาดหายไป
Sora อาจจะต่อสู้กับการจำลองฟิสิกส์ของฉากที่ซับซ้อนอย่างถูกต้อง, เข้าใจเหตุการณ์ที่เฉพาะเจาะจงของสาเหตุและผล, และรักษารายละเอียดทางพื้นที่ตลอดเวลา มันสามารถสร้างการเคลื่อนไหวที่ไม่น่าเชื่อถือได้หรือสับสนรายละเอียดทางพื้นที่บางครั้งได้
OpenAI กำลังร่วมมือกับ red teamers เพื่อทดสอบโดยการต่อต้านรุนแรงโมเดลและกำลังสร้างเครื่องมือเพื่อตรวจจับเนื้อหาที่สร้างความสับสน พวกเขาวางแผนที่จะรวม C2PA metadata ในอนาคตและกำลังใช้เครื่องมือความปลอดภัยที่มีอยู่จากผลิตภัณฑ์อื่น ๆ ของพวกเขา เช่น text classifiers และ image classifiers
Sora ณ ปัจจุบันมีให้บริการแก่ทีมแดงเพื่อการประเมินพื้นที่สำคัญเพื่อความเสี่ยงหรือความเสี่ยง และแก่ศิลปินที่มีความสามารถทางสายตา นักออกแบบ และผู้กำกับภาพยนตร์เพื่อข้อเสนอเกี่ยวกับวิธีการเสริมสร้างโมเดลสำหรับผู้มีความสามารถทางสร้างสรรค์
หากคุณเป็นนักออกแบบที่มีความคิดสร้างสรรค์ คุณสามารถสมัครเข้าถึง Sora ผ่าน OpenAI ได้ หลังจากได้รับการอนุญาต คุณสามารถใช้โมเดลเพื่อสร้างวิดีโอขึ้นมาจากข้อความของคุณ เพิ่มความสวยงามให้กับโปรเจกต์ที่มีความคิดสร้างสรรค์ของคุณด้วยฉากที่เป็นเอกลักษณ์และแสดงความคิดสร้างสรรค์
Sora ทำหน้าที่เป็นพื้นฐานสำหรับโมเดลที่สามารถเข้าใจและจำลองโลกจริง ซึ่ง OpenAI เชื่อว่าเป็นเหตุการณ์สำคัญสู่การบรรลุปัจจุบันของปัญญาประดิษฐ์ทั่วไป (AGI)
Sora มีความเข้าใจภาษาอย่างลึกซึ้ง ทำให้มันสามารถตีความข้อความได้อย่างแม่นยำ และสร้างตัวละครและฉากที่น่าสนใจที่แสดงออกมาเป็นอารมณ์สดใส มันสามารถสร้างฉากหลายๆ ฉากในวิดีโอเดียว โดยยังคงรักษาตัวละครและสไตล์ทางสายตาไว้เสมอไปด้วยค่ะ
Sora ใช้โครงสร้างของตัวแปรทรานส์ฟอร์เมอร์ ที่คล้ายกับโมเดล GPT และแทนภาพยนต์และภาพเป็นชุดข้อมูลขนาดเล็กที่เรียกว่า patches การรวมข้อมูลเหล่านี้ช่วยให้โมเดลสามารถฝึกอบรมบนช่วงข้อมูลทางสายตาที่กว้างกว่าได้
โดยการให้โมเดลมีความคาดเดาของเฟรมหลายๆ เฟรมในเวลาเดียวกัน, Sora สามารถให้ความมั่นใจได้ว่าเรื่องของเขายังคงสม่ำเสมอ แม้ว่าพวกเขาจะออกจากมุมมองชั่วขณะ.
Sora ใช้เทคนิค recaptioning จาก DALL·E 3 ซึ่งเกี่ยวข้องกับการสร้างคำอธิบายที่มีคำอธิบายอย่างละเอียดสำหรับข้อมูลการฝึกฝนทางสายตา นี้ช่วยให้โมเดลสามารถทำตามคำสั่งข้อความของผู้ใช้ได้อย่างเชื่อถือได้มากขึ้นในวิดีโอที่สร้างขึ้น.
OpenAI กำลังวางแผนดำเนินการดำเนินการความปลอดภัยหลายขั้นตอนก่อนที่จะรวม Sora เข้ากับผลิตภัณฑ์ของตน ซึ่งรวมถึงการทดสอบท้าทาย, การพัฒนาตัวจำแนกการตรวจจับ, และการใช้เครื่องมือความปลอดภัยที่มีอยู่จากผลิตภัณฑ์อื่น เช่น DALL·E 3
Sora สามารถใช้โดยผู้กำกับภาพยนต์ นักสร้างภาพเคลื่อนไหว เกมดีเวลลอปเปอร์ และผู้มีความคิดสร้างสรรค์อื่น ๆ เพื่อสร้างเนื้อหาวิดีโอ ภาพบอร์ด หรือแม้กระทั้งสร้างโปรโตไทป์ไอเดียอย่างรวดเร็วและมีประสิทธิภาพ
OpenAI กำลังมีส่วนร่วมอย่างเต็มที่กับนักการเมือง ผู้สอน และศิลปินเพื่อเข้าใจความกังวลและระบุกรณีการใช้ที่เชิดชูเทคโนโลยี พวกเขายอมรับว่า ในขณะที่พวกเขาไม่สามารถทำนายการใช้ประโยชน์หรือการละเมิดทั้งหมด การเรียนรู้จากการใช้ในโลกจริงเป็นสิ่งสำคัญสำหรับการสร้างระบบ AI ที่ปลอดภัยขึ้นตามเวลา
OpenAI มีตัวจัดประเภทข้อความที่ตรวจสอบและปฏิเสธข้อความที่ละเมิดนโยบายการใช้งาน เช่น ข้อความที่ขอการใช้กำลังรุนแรงมากเกินไป เนื้อหาทางเพศ ภาพที่เกลียดชัง หรือการใช้ทรัพย์สินประสิทธิภาพโดยไม่ได้รับอนุญาต
โมเดลโลกใน AI หมายถึงโมเดลคำนวณที่จำลองโลกทางกายภาพและความเคลื่อนไหวของมัน ทำให้ AI เข้าใจและทำนายว่าวัตถุและสิ่งของจะมีปฏิสัมพันธ์กันอย่างไรภายในโลกนั้น ในบริบทของ Sora นี้หมายถึงว่าโมเดลได้รับการฝึกสอนให้สร้างวิดีโอที่ไม่เพียงแต่ตามคำสั่งข้อความ แต่ยังเชื่อถือถึงกฎฟิสิกส์และพฤติกรรมของโลกจริง เช่น แรงโน้มถ่วง เคลื่อนที่ และปฏิสัมพันธ์ของวัตถุ ความสามารถนี้เป็นสิ่งสำคัญสำหรับการสร้างเนื้อหาวิดีโอที่สมจริงและสอดคล้องจากคำอธิบายข้อความ