时间:2022-11-17 11:01:26
作者:景联文科技
浏览: 次
数据标注作为人工智能发展道路上的基石,是人工智能发展的重要环节。以任何格式录制的音频或语音都可以通过机器学习为机器所理解。基于 NLP 的语音识别模型需要带标注的音频,这样聊天机器人或智能设备等应用程序更容易理解这些声音。
语音标注是数据标注行业中一种比较常见的标注类型。音频文件中的语音包含针对听众的不同单词和句子。在语音标注时使用特殊的数据标记技术,可以使音频文件中的此类短语被机器识别。在NLP或NLU中,用于语音识别的机器算法需要语音标注来识别此类音频。相当于给机器装上了“耳朵”,使其具备了“能听”的功能,使机器可以实现精准的语音识别能力。
1、语音识别
语音实时识别文字,可以适用于语音聊天、语音输入、语音搜索、语音下单、语音指令、语音问答等多种场景,在日常生活中,例如客服通话的语音转写、会议转写、通讯产品语音输入和转写、语音医疗记录、电影字幕自动生成、电视机等智能家居的命令,这些都运用到了这一技术。在医疗领域中,也常用声音来生成和编辑专业的医疗报告。
2、语音合成
语音合成能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工的嘴巴。例如app中的实时播报、合成特定人的声音、验证码内容语音合成、客服、导航软件,大厅,售货机等各场景的语音提示、语音早教机的语言发音学习、便携等场景。
3、 声纹识别
声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认。声纹识别就是把声信号转换成电信号,再用计算机进行识别。例如利用声纹密码进行身份认证,登陆,授权,打卡、公安身份特征存储、语音唤醒等。