数据简介
该数据集可用于多模态识别模型训练,由专业标注团队对特定的视频内容切分和筛选,对视频中在说话的人物的情感7类型、对话文本内容、人物性别、人物ID信息、人物年龄段信息、对话场景、视频段在原始视频中的开始与结束时间戳信息、情感类型及强度标注进行标注,对视频、图像、 文本、语音4项分别进行标注。数据集样例见下方展示,采购全部数据集请联系在线客服。
数据规模
27088段视频+27088张图像+27088条文本+27088段语音
数据构成
27088段视频,每段视频3-10秒,共2213.84分钟;27088张图像;27088条文本;27088段语音
数据来源
此数据集由景联文科技及合作供应商共同采集制作
样例展示