时间:2022-09-19 13:41:22
作者:阿明
浏览: 次
一、需求:筛选剪辑视频、文本、图像、语音等多模态数据素材,进行情感标注。
二、项目难点:1)需要独立快速完成所有视频素材资源的选取剪辑。2)需要3-4人对4种不同类型的单模态数据进行同步标注,以此保证数据的真实性、稳定性。3)总标注量48万条,要求交付时间紧迫。
三、解决方案:
1)通过员工推荐从各大视频网站快速检索下载符合项目要求的素材。2)设置标注-质检-校验三层流程,分别安排三人进行情感标注,未达成一致引入第四人标注或判定为无效数据,直至出现一致标注结果判定为有效数据。3)利用景联文标注平台快速分发任务,自动化多重循环质检机制确保标注效率。
四、交付结果:工期内足额完成交付,一次合格率 98%。