时间:2024-03-01 09:54:41
作者:景联文科技
浏览: 次
2024年2月15日,OpenAI发布人工智能文生视频大模型Sora。
Sora是基于OpenAI的DALL-E模型开发的视频生成技术,能根据文本描述创建最长60秒的逼真视频。包括多个角色、特定类型动作和主题背景;在单个生成的视频中创建多个镜头,可以模拟复杂的摄像机运镜,同时准确地保持角色和视觉风格;可以深度模拟真实物理世界,继承DALL-E 3的高画质和指令遵循能力,理解用户需求。
Sora的技术原理
Sora的技术原理主要基于深度学习和分布式训练技术。Sora采用了扩散型变换器(diffusion transformer)架构,这是一种深度学习模型,能够将随机噪声逐渐转化为有意义的图像或视频内容。
Sora采用了分布式训练的方式,将AI模型的训练任务拆分成多个子任务,并在多个节点上并行执行。采用数据并行和模型并行的策略,以及自定义的通信协议,以实现节点之间的高效通信。
这些技术原理使得Sora能够生成高质量的视频内容,并在模拟数字世界、长期连续性和物体持久性等方面展现出强大的能力。
高质量、大规模、描述精细的视频描述数据已成为Sora模型学习重要的一环。
景联文科技是大语言模型数据供应商,可为文生视频大模型提供大量高质量数据,提高大模型的准确性和性能。自有大规模、高质量视频描述成品数据集近百万段,内容涵盖广泛。
视频描述数据集
数据规模为百万段视频及文本描述,涵盖多种通常场景。针对视频内容,采取简述和复杂描述两种标注方式,首先对视频整体内容进行简要概括。随后,确定视频中内容发生变化的具体时间点,并对每个时间段的子视频进行详细的内容描述。
为确保业务操作的安全性和合规性,满足不同业务场景下的数据保护需求,景联文科技有一套全面的数据安全与合规管理方案,涵盖版权数据产品、数据定制服务的私有化部署。
景联文科技还提供大语言模型训练数据的标注服务,建立了一系列数据分发、清洗、标注、质检、交付的标准化操作流程。
为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的AI大语言模型训练数据。
景联文科技|数据采集|数据标注|多模态数据集
助力人工智能技术,赋能传统产业智能化转型升级
文章图文著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处。