尝试OpenAI Sora
从文本/图像创建视频,生成循环视频,向前和向后延长视频
Sora 上线时第一个知道!
关于OpenAI Sora
什么是Sora
OpenAI的文本到视频模型。Sora可以生成长达一分钟的视频,同时保持视觉质量并遵循用户的文本指令。
是帮助用户更好地利用数字货币和区块链技术。
Sora作为可以理解和模拟现实世界的模型的基础,帮助人们解决需要现实世界互动的问题。
进展
仅限红队成员和受邀的视觉艺术家、设计师和电影制作人。
特点
支持多个角色、特定动作类型、主题和背景细节的准确呈现;模型了解这些事物在现实世界中的存在方式,在单个视频中进行多次拍摄。
限制
在准确模拟复杂物理过程方面存在困难,空间细节混乱,物体和角色的突然出现,物理建模不准确和物体变形不自然。
安全
与红队合作进行对抗性测试,以识别和解决模型中的安全问题,构建工具来帮助检测使用检测分类器和C2PA元数据的误导内容。
展示 - 每日更新
Prompt
-
Prompt
Bubble Dragon
Prompt
Sora generates an imaginary video of the interview.
Prompt
an extreme close up shot of a woman's eye, with her iris appearing as earth
Prompt
fly through tour of a museum with many paintings and sculptures and beautiful works of art in all styles
Prompt
a red panda and a toucan are best friends taking a stroll through santorini during the blue hour
Prompt
a man BASE jumping over tropical hawaii waters. His pet macaw flies alongside him.
Prompt
a dark neon rainforest aglow with fantastical fauna and animals.
Prompt
Close-up of a majestic white dragon with pearlescent, silver-edged scales, icy blue eyes, elegant ivory horns, and misty breath. Focus on detailed facial features and textured scales, set against a softly blurred background.
Prompt
a scuba diver discovers a hidden futuristic shipwreck, with cybernetic marine life and advanced alien technology
Prompt
in a beautifully rendered papercraft world, a steamboat travels across a vast ocean with wispy clouds in the sky. vast grassy hills lie in the distant background, and some sealife is visible near the papercraft ocean's surface
Prompt
cinematic trailer for a group of samoyed puppies learning to become chefs.
Other AI video products
Company | Generation Type | Max Length | Extend? | Camera Controls? (zoom, pan) | Motion Control? (amount) | Other Features | Format |
---|---|---|---|---|---|---|---|
Runway | Text-to-video, image-to-video, video-to-video | 4 sec | Yes | Yes | Yes | Motion brush, upscale | Website |
Pika | Text-to-video, image-to-video | 3 sec | Yes | Yes | Yes | Modify region, expand canvas, upscale | Website |
Genmo | Text-to-video, image-to-video | 6 sec | No | Yes | Yes | FX presets | Website |
Kaiber | Text-to-video, image-to-video, video-to-video | 16 sec | No | No | No | Sync to music | Website |
Stability | Image-to-video | 4 sec | No | No | Yes | WebsiteLocal model, SDK | |
Zeroscope | Text-to-video | 3 sec | No | No | No | Local model | |
ModelScope | Text-to-video | 3 sec | No | No | No | Local model | |
Animate Diff | Text-to-video, image-to-video, video-to-video | 3 sec | No | No | No | Local model | |
Morph | Text-to-video | 3 sec | No | No | No | Discord bot | |
Hotshot | Text-to-video | 2 sec | No | No | No | Website | |
Moonvalley | Text-to-video, image-to-video | 3 sec | No | Yes | No | Discord bot | |
Deforum | Text-to-video | 14 sec | No | Yes | No | FX presets | Discord bot |
Leonardo | Image-to-video | 4 sec | No | No | Yes | Website | |
Assistive | Text-to-video, Image-to-video | 4 sec | No | No | Yes | Website | |
Neural Frames | Text-to-video, image-to-video, video-to-video | Unlimited | No | No | No | Sync to music | Website |
MagicHour | Text-to-video, image-to-video, video-to-video | Unlimited | No | No | No | Face swap, sync to music | Website |
Vispunk | Text-to-video | 3 sec | No | Yes | No | Website | |
Decohere | Text-to-video, Image-to-video | 4 sec | No | No | Yes | Website | |
Domo Al | Image-to-video, video-to-video | 3 sec | No | No | Yes | Discord bot |
博客
AI改变了视频制作的永恒命运
AI驱动视频内容简介 随着人工智能(AI)的出现,视频制作领域正在经历一场巨大的变革。曾经是技术专家领域的内容现在正在被AI驱动的技术所增强,甚至有时被替代。威尔·史密斯品尝意面的病毒视频只是这个蓬勃发展世界的一个缩影,引发了内容创作者的惊叹和存在恐慌。欢迎来到未来,在这里,AI生成的视频不仅仅是一种新奇,而且正在迅速发展成为现实。 AI视频创作的神奇之处 这场革命的核心是对AI在视频制作中的作
Author:Marques BrownleeOpenAI发布文本转视频工具Sora
这是一个美丽的无人机拍摄,就像你在旅行视频中可能看到的那种视频一样,但实际上并不存在真实的无人机和摄影机,因为这段视频是由OpenAI刚刚宣布的一款新工具"Sora"生成的。只需要输入一个简短的文本提示,几分钟内它就会生成一个60秒的视频片段,几乎可以想象出任何东西。 Brian Chung在这里为我们详细解释这一切,这确实很酷。这可能意味着数百万人可能会失业,因为谁来制作所有这些视频,这可能对
Author:NBC News你能分辨出什么是真实的吗?- 人工智能生成的视频
欢迎来到最新的人工智能视频生成领域,这是一个令人震惊、滑稽和令人印象深刻的现象,往往同时具备这三个特点。它似乎突然出现在我们面前,直到今天之前,人工智能生成的视频往往有一些明显的痕迹表明它们并非真实。例如,像这个AI生成的威尔·史密斯吃意面的视频,以及一场啤酒聚会中突然爆发的火灾,可能因为这些原因而走红。而由Sora生成的这些新视频可能也会因为不同且更加险恶的原因而走红,因为它变得如此出色,以至于
Author:2kliksphilip人们在x上谈论Sora
SoraAI by OpenAI is wild.
— Alamin (@iam_chonchol) February 18, 2024
These are 100% generated only from text and take just 1 minute 🤯
10 wild examples ( 2nd is WOW ) pic.twitter.com/NLetbJVa2v
If you think OpenAI Sora is a creative toy like DALLE, ... think again. Sora is a data-driven physics engine. It is a simulation of many worlds, real or fantastical. The simulator learns intricate rendering, "intuitive" physics, long-horizon reasoning, and semantic grounding, all… pic.twitter.com/pRuiXhUqYR
— Jim Fan (@DrJimFan) February 15, 2024
"this close-up shot of a futuristic cybernetic german shepherd showcases its striking brown and black fur..."
— Bill Peebles (@billpeeb) February 18, 2024
Video generated by Sora. pic.twitter.com/Bopbl0yv0Y
Sora and Stable Video, text to video compare. pic.twitter.com/pZzSeSXPtN
— Retropunk (@RetropunkAI) February 17, 2024
OpenAI's Sora is the most advanced text-to-video tool yet. 💡
— Escher (@Escher_AI) February 16, 2024
It can generate compellingly realistic characters, create multiple dynamic shots in a single video, with accurate details of both subjects and background.
Here's the 10 best generations so far
🧵👇 pic.twitter.com/FHp0cxt0Ll
OpenAI's Sora is going to change marketing forever, enabling anyone to unleash his inner creativity.
— William Briot (@WilliamBriot) February 15, 2024
Check this 100% AI-generated video of Mammoth generated with the new "text-to-video" OpenAI model: pic.twitter.com/DcDGPjpBXC
"a photorealistic video of a butterfly that can swim navigating underwater through a beautiful coral reef"
— Tim Brooks (@_tim_brooks) February 17, 2024
Video generated by Sora pic.twitter.com/nebCKLa09U
Another Sora video, Sora can generate multiple videos side-by-side simultaneously.
— 🅱️WhiteAfricanSpaceJesus (@zespacejesus) February 18, 2024
This is a single video sample from Sora. It is not stitched together; Sora decided it wanted to have five different viewpoints all at once! pic.twitter.com/q2rfxh61CQ
Sora can also generate stories involving a sequence of events, although it's far from perfect.
— Bill Peebles (@billpeeb) February 17, 2024
For this video, I asked that a golden retriever and samoyed should walk through NYC, then a taxi should stop to let the dogs pass a crosswalk, then they should walk past a pretzel and… pic.twitter.com/OhqVFqR5vA
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
https://t.co/P26vJHlw06 pic.twitter.com/AW9TfYBu3b
— Sam Altman (@sama) February 15, 2024
https://t.co/rPqToLo6J3 pic.twitter.com/nPPH2bP6IZ
— Sam Altman (@sama) February 15, 2024
https://t.co/WJQCMEH9QG pic.twitter.com/Qa51e18Vph
— Sam Altman (@sama) February 15, 2024
a wizard wearing a pointed hat and a blue robe with white stars casting a spell that shoots lightning from his hand and holding an old tome in his other hand
— biden or buster (@willofdoug) February 15, 2024
常见问题解答
Sora是由OpenAI开发的AI模型,可以根据文本指令创建逼真且富有想象力的视频场景。它旨在模拟运动中的物理世界,生成长达一分钟的视频,同时保持视觉质量并遵循用户的提示。
Sora是一个扩散模型,它从类似静态噪音的视频开始,并逐步通过多个步骤去除噪音来转换它。它使用了类似于GPT模型的变压器架构,并将视频和图像表示为称为补丁的较小数据单元的集合。
Sora可以生成各种视频,包括具有多个角色的复杂场景、特定类型的动作以及主题和背景的精确细节。它还可以将现有静止图像动画化,或通过填补缺失的帧来延长现有视频。
Sora可能会在准确模拟复杂场景的物理、理解特定的因果关系实例以及在时间上保持空间细节方面遇到困难。有时会产生物理上不合理的运动或混淆空间细节。
OpenAI正在与红队合作对模型进行对抗性测试,并正在构建工具来检测误导性内容。他们计划在未来将C2PA元数据纳入其中,并利用其其他产品中现有的安全方法,如文本分类器和图像分类器。
Sora目前可供红队人员评估危害或风险的关键领域,并为视觉艺术家、设计师和电影制作人提供反馈,以推动创意专业人士的模型发展。
如果您是一名创意专业人士,您可以通过OpenAI申请访问Sora。一旦获得访问权限,您可以使用该模型根据您的文本提示生成视频,为您的创意项目增添独特而富有想象力的场景。
Sora作为能够理解和模拟现实世界的模型的基础,OpenAI认为这是实现人工通用智能(AGI)的重要里程碑。
Sora对语言有着深刻的理解,能够准确解释文本提示,并生成生动的角色和场景,表达丰富的情感。它可以在单个视频中创建多个镜头,同时保持一致的角色和视觉风格。
Sora使用了类似于GPT模型的变压器架构,并将视频和图像表示为称为补丁的较小数据单元的集合。这种数据表示的统一使得模型可以在更广泛范围的视觉数据上进行训练。
通过一次性给模型多帧的预见,Sora可以确保主体即使暂时离开视野,也能保持一致。
Sora使用了来自DALL·E 3的重新字幕技术,这涉及为视觉训练数据生成高度描述性的字幕。这有助于模型更忠实地遵循用户的文本指令在生成的视频中。
OpenAI计划在将Sora整合到其产品之前采取几项安全措施,包括对抗性测试、开发检测分类器,并利用来自其他产品(如DALL·E 3)的现有安全方法。
Sora可以被电影制作人、动画师、游戏开发者和其他创意专业人士使用,以快速高效地生成视频内容、分镜头,甚至用于快速有效地原型设计想法。
OpenAI正在积极与政策制定者、教育工作者和艺术家合作,以了解关注点并确定技术的积极应用案例。他们承认虽然他们无法预测所有有益的用途或滥用,但从现实世界的使用中学习对于随着时间推移创建更安全的人工智能系统至关重要。
OpenAI拥有文本分类器,用于检查和拒绝违反使用政策的文本输入提示,例如请求极端暴力、性内容、仇恨图像或未经授权使用知识产权的内容。
在AI中,“世界模型”指的是一个计算模型,模拟物理世界及其动态,使AI能够理解和预测其中的物体和实体如何相互作用。在Sora的背景下,这意味着该模型已经经过训练,能够生成视频,不仅遵循文本提示,还遵守真实世界的物理定律和行为,如重力、运动和物体相互作用。这种能力对于从文本描述中创建逼真和连贯的视频内容至关重要。