首页 > 新闻动态 > 行业资讯 > 景联文科技可为多模态语音翻译模型提供数据采集支持

景联文科技可为多模态语音翻译模型提供数据采集支持

时间：2023-09-13 13:45:22

作者：景联文科技

浏览：次

8月22日Facebook的母公司Meta Platforms发布了一种能够翻译和转录数十种语言的人工智能模型——SeamlessM4T，可以在日常生活中或者商务交流中为用户提供更便捷的翻译和转录服务。

相较于传统的文本翻译，这项技术的最大区别在于它可以实现端到端的语音翻译，即将一种语言的语音直接翻译成另一种语言，使得人们可以直接交流，而无需经过复杂的中间转换过程。

SeamlessM4T支持：

1、近100种语言的语音识别。

2、近100种输入和输出语言的语音到文本翻译。

3、支持近100种输入语言和36种输出语言的语音到语音翻译。

4、支持近100种语言的文本到文本翻译。

5、支持近100种输入语言和35种输出语言的文本到语音翻译。

SeamlessM4T支持的语音到语音翻译模型需要大量高质量的端到端数据。满足近100种语言语音翻译的需求，仅依靠人工转录和翻译语音是困难的，因为构建语音翻译数据集的流程既复杂又成本高昂。在获得授权音频的前提下，需要进行对应的转录和翻译，然后将音频、转录和翻译进行切分，最后进行对齐和过滤以获得有效数据。

景联文科技拥有丰富的语音数据采集标注项目经验，自建专业语音采集录音室，有高度还原真实场景能力，在全国30多个省市有近一万人的被采集人员储备，全球范围内也有采集渠道，支持多语种、多方言语音采集。自有的数据管理平台，打通数据闭环，可有序进行数据分发、清洗、标注、质检、等环节，交付高质量的训练数据，提高企业AI数据训练效率，加速人工智能相关应用的落地迭代周期。

景联文科技｜数据采集｜数据标注

助力人工智能技术，赋能传统产业智能化转型升级

文章图文著作权归景联文科技所有，商业转载请联系景联文科技获得授权，非商业转载请注明出处。

上一篇：景联文数据标注：AI大模型在教育和医疗领域的应用下一篇：700亿参数Llama 2训练加速195%！数据成为其提升效果的关键要素

返回列表

首页

民用数据服务

数据采集

数据标注

AI数据集

智能标注平台

假指纹制作

大模型数据集

智能标注平台

新闻动态

关于我们

景联文科技可为多模态语音翻译模型提供数据采集支持

相关推荐

景联文科技：提供卓越数据标注服务，助力人工智能发展

景联文科技出席全国两化融合标委会工业数据标准工作组2024年全体成员大会，与各单位共同建设工业高质量数据集

再获认可，景联文科技成为全国数标委的四个标准工作组成员单位

景联文科技：精准语音标注，驱动语音技术新发展

景联文科技入选中国信通院发布的“人工智能数据标注产业图谱”

景联文科技提供高质量文本标注服务，驱动AI技术发展

热门文章

最新文章

19157628936

AI数据集

大模型数据集

智能标注平台

新闻动态

关于我们