首页 > 新闻动态 > 行业资讯 > 景联文科技：提供通用多模态数据，助力AI多模态领域实现飞跃式发展

景联文科技：提供通用多模态数据，助力AI多模态领域实现飞跃式发展

时间：2024-03-15 11:33:08

作者：景联文科技

浏览：次

回顾2023年，以ChatGPT为代表的通用人工智能大模型在全球范围内掀起了新一轮人工智能产业发展浪潮，我国人工智能大模型市场呈现百“模”争鸣、日新月异的迅猛发展态势。

根据大模型之家、钛媒体数据，2023年中国大模型市场规模达到147亿人民币，同比增长110.0%，预计到2028年中国大模型市场规模将达到1179亿人民币。

其中，多模态大模型市场规模有望快速增长。第一财经数据显示，预计至2025年，中国多模态内容市场规模将达到832.7亿美元，2018-2025年复合增长率达65.02%。多模态大模型将主要应用于教育、医疗、游戏、商业定制和影视等领域。

不久前，OpenAI发布首个文生视频模型Sora，极大地推动了AI多模态领域飞速发展，AI创作等相关领域将迎来深度变革，AI赋能范围日益扩大。

高质量的多模态数据是构建和训练多模态大模型的基础，它决定了模型能否有效捕获和利用不同模态间复杂的语义关系，进而影响到模型的整体性能和应用价值。随着多模态技术的发展，多模态数据的需求和重要性日益增加，对于推动人工智能向着更深层次的通用智能方向迈进具有重要作用。

景联文科技是大模型数据供应商，致力于为不同阶段的模型算法匹配高质量多模态数据资源。

通用多模态数据集

音频数据：

l 普通话(人数 200 万以上，采样率 44.1Khz 及以上，16bit) 100万小时

l 方言 2.7千小时

图片生成及隐式/显示推理多模态数据：

l 图文复杂描述 50万本

l 图文推理问答对 400万本

l 4K 高清图片 5000万张

视频生成及隐式/显示推理多模态数据：

l 视频简单描述

l 视频复杂描述

l 视频推理问答对

同时景联文科技提供大模型训练数据的标注服务，建立了数据分发、清洗、标注、质检、交付的标准化操作流程，为全球数千家人工智能从业公司和高校科研机构交付海量、高质量的多模态大模型训练数据。

景联文科技｜数据采集｜数据标注｜多模态大模型训练数据

助力人工智能技术，赋能传统产业智能转型升级

文章图文著作权归景联文科技所有，商业转载请联系景联文科技获得授权，非商业转载请注明出处。

上一篇：热烈庆祝景联文科技北京分公司正式成立！下一篇：别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元

返回列表

首页

民用数据服务

数据采集

数据标注

AI数据集

智能标注平台

假指纹制作

大模型数据集

智能标注平台

新闻动态

关于我们

景联文科技：提供通用多模态数据，助力AI多模态领域实现飞跃式发展

相关推荐

景联文科技：提供卓越数据标注服务，助力人工智能发展

景联文科技出席全国两化融合标委会工业数据标准工作组2024年全体成员大会，与各单位共同建设工业高质量数据集

再获认可，景联文科技成为全国数标委的四个标准工作组成员单位

景联文科技：精准语音标注，驱动语音技术新发展

景联文科技入选中国信通院发布的“人工智能数据标注产业图谱”

景联文科技提供高质量文本标注服务，驱动AI技术发展

热门文章

最新文章

19157628936

AI数据集

大模型数据集

智能标注平台

新闻动态

关于我们