OpenAI首个视频生成模型Sora发布

《OpenAI首个视频生成模型Sora发布》

来源专题：数智化图书情报
编译者： 程冰
发布时间：2024-02-18
2024年2月16日，OpenAI宣布推出全新的生成式人工智能模型“Sora”。Sora模型是一种先进的文本转视频生成模型，它代表了人工智能在视频内容创作领域的一次重大突破。Sora模型的核心能力在于，它能够根据用户输入的文本描述，生成长达一分钟的高质量视频，这些视频不仅视觉质量高，而且与用户的文本提示高度一致。这一技术的出现，预示着视频制作和内容创作方式的革命性变化。

Sora模型的工作原理：

Sora模型基于扩散型变换器（diffusion transformer）架构，这是一种深度学习模型，能够将随机噪声逐渐转化为有意义的图像或视频内容。Sora通过训练，学会了理解和处理文本提示，将用户的描述转化为视频内容。它不仅能够生成具有连贯性的场景和运动的镜头，还能够模拟复杂的场景和角色表情，为视频增添更多细节和想象力。

Sora模型的应用场景：

Sora模型的应用领域非常广泛，包括但不限于：视频制作：制片人和视频创作者可以利用Sora快速生成视频，节省拍摄和后期制作的时间和成本。广告营销：广告商可以快速创建多样化的广告视频，提高品牌形象和市场竞争力。教育培训：教师和培训师可以制作生动有趣的教学视频，提高学生的学习兴趣和参与度。虚拟现实：结合虚拟现实技术，Sora可以用于创造更加真实和沉浸式的虚拟体验。Sora模型的挑战与展望：

尽管Sora模型在视频生成方面展现出了巨大潜力，但它也存在一些挑战。例如，模型可能难以准确模拟复杂场景的物理原理，或者在理解因果关系方面存在局限。OpenAI正在积极解决这些问题，并计划将Sora模型作为理解和模拟现实世界的模型基础，作为实现通用人工智能（AGI）的重要里程碑。

随着技术的不断进步，Sora模型有望在未来实现更广泛的应用，为内容创作者、教育工作者、娱乐产业以及普通用户提供更多的可能性。

本文参考公众号Sora软件

展开更多
原文来源：https//www.openai.com/sora

624浏览量

0点赞

原文链接

相关报告

《阿里巴巴发布开源视频生成新模型Wan2.2》
- 来源专题：新一代信息技术
- 编译者：张嘉璐
- 发布时间：2025-08-07
- 阿里巴巴发布全球首个基于MoE（混合专家）架构的开源大视频生成模型Wan2.2系列。该系列将显著提升开发者利用AI制作电影级视频的能力，包含文生视频模型Wan2.2-T2V-A14B、图生视频模型Wan2.2-I2V-A14B，以及支持文图生视频统一框架的混合模型Wan2.2-TI2V-5B。基于MoE架构与美学数据训练，Wan2.2-T2V-A14B与Wan2.2-I2V-A14B可生成具有电影级质感的视频，支持对光影、昼夜、色调、镜头角度、画幅、构图及焦距的精准控制。这两个MoE模型在复杂动作生成上实现显著突破，包括生动面部表情、动态手势及复杂运动场景，同时能遵循物理规律实现真实效果呈现。针对长序列令牌导致的高计算消耗问题，模型在去噪阶段采用双专家设计：高噪专家负责整体场景布局，低噪专家优化细节纹理。尽管总参数量达270亿，但单步仅激活140亿参数，计算消耗降低达50%。 Wan2.2通过电影级提示词系统实现美学微调，对光影、照明、构图、色调等维度进行分类标注，确保精准传达用户艺术意图。其训练数据量较Wan2.1大幅提升，其中图像数据增加65.6%，视频数据增加83.2%，在复杂场景与动作生成方面表现更优。混合模型Wan2.2-TI2V-5B采用高压缩3D VAE架构，时空压缩比达4x16x16，整体信息压缩率提升至64倍。仅需单个消费级GPU即可在数分钟内生成5秒720P视频，为开发者和内容创作者提供高效可扩展的解决方案。目前Wan2.2系列模型已在Hugging Face、GitHub及阿里云开源社区ModelScope开放下载。
  
  展开更多
2985浏览量

0点赞

收藏

原文链接
《行业首个燃机大模型，发布！》
- 来源专题：能源情报网监测服务平台
- 编译者：郭楷模
- 发布时间：2025-10-16
- 2025新型电力系统发展(崇礼)论坛分论坛——2025华为电力行业峰会举行。在本次峰会上，行业内首个燃机大模型——京能“擎睿”，以及《ICT赋能发电企业数智化转型白皮书》正式发布。据悉，京能“擎睿”是华为与京能联合创新的重磅成果。该大模型依托华为全栈自研算力底座，实现自主创新与训推一体，从软硬件开发到落地应用完成全链路突破。同时，该模型率先集成燃机垂类时序大模型与燃机专业模型，首创多智能体协同与逻辑自动编排机制，重塑燃气发电生产运维核心业务流程，促进燃气发电效率与安全裕度实现跨越式提升，推动“人工智能+燃机行业”从技术探索走向深度场景应用。《ICT赋能发电企业数智化转型白皮书》由华为与华北电力大学等单位联合发布，为全行业规模化复制成功经验提供了清晰的“导航图”。华北电力大学技术转移转化中心主任王宏盛在解读白皮书时指出，该白皮书直面发电企业在数智化转型中面临的数据孤岛、多能协同困难、技术标准不一等深层挑战，系统性地为发电集团规划了从顶层设计、云基座、数据治理到AI范式创新的转型关键路径。白皮书旨在将领先的转型经验转化为行业可复用的标准与方法论，避免“重复造轮子”，为全行业的高质量发展提供了行动指南。
  
  展开更多
10浏览量

0点赞

收藏

原文链接

《OpenAI首个视频生成模型Sora发布》

《阿里巴巴发布开源视频生成新模型Wan2.2》

《行业首个燃机大模型，发布！》