时间:2022-10-27 09:48:02
作者:景联文科技
浏览: 次
语音识别是一项融合了多项学科知识的前沿技术,是人机交互技术中的关键环节。随着科技的不断发展,语音识别技术已广泛运用于我们工作和生活中的方方面面。比如我们手机中的语言输入法,语音助手;家中的天猫精灵,声控感应灯;智能可穿戴设备、智能车载设备等,这些的核心技术就是语音识别。
2019年8月17日,北京互联网法院颁布了《互联网技术司法应用白皮书》,其中就阐述了有关语音识别技术相关内容。语音识别技术利用超大规模语言模式识别以及自主学习技术,来预测对话语境,实现多业务应用、多角色区分、智能断句和热词自动生成,有效提高了人们的办事效率。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科学发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等, 是一项极具发展的科学技术。
以智慧驾驶车载智能语音为例,语音识别就是其核心技术。语音识别其实是由四部分组成:一是声学模型,二是语言模型,三个解码器,最后就是特征提取的一个过程。在用户的行车过程中,单纯的“主动控制”只是第一步,面向下一代的车载语音助手,势必要向更加富有个性化和情感化的语音交互方向转变。用户使用智慧语言助手的原因,很长一段时间里是被“解放双手”这一特性所吸引。设想在你行驶过程中,你想给谁打个电话,或者需要导航到某处,无论是处于安全还是便携性考虑,语音识别都是最佳选择。依托于语音识别技术,可以让用户在行驶过程中享受更直接、更有个性化的体验。随着传统汽车性能不断智能化升级,车内人机交互的更好体验,逐渐成为各大汽车厂商竞争的焦点。从目前车机智慧互联系统各项功能的开发来看,传统的智慧语音控制向AI智慧语音交互发展已是大走向。随着科技不断发展,智慧语音识别将会为我们带来更多的便利,也必将会成为我们的智能生活助手。
景联文科技作为专业的人工智能基础数据服务商为其提供大量精准数据采集标注,为企业核心算法训练提供标准数据集。景联文科技已和某汽车智慧品牌就车辆标注项目合作多次,不仅为客户提供了海量准确率极高的标注数据,自身也积攒了大量项目经验,双方合作互利共赢,得到客户的高度评价。
在医疗运用方面,由于我国医疗信息建设的不断发展,医护人员每天都需要完成大量的文字输入工作。据不完全统计,文字输入工作时间占医生工作时间的20%-30%,文字输入的及时性、便携性和准确性,一定程度上影响着医院整体的工作效率、医疗成本和医疗质量。语言识别技术是目前临床中较为理想的人机相互方式,电子病历的出现,可以一定程度上提高医生工作效率,降低其工作强度,以降低医院的运作成本,更利于医院更好的发展。目前,北京协议医院、北京大学口腔医院、青岛大学附属医院等多家医院已经将语言识别技术运用到了临床工作中,为其工作带来了便捷。
在电信领域中,语言识别不仅从多维度提高了客户使用体验,还可通过关键词的检索来防止电信诈骗,它通过采集通话录音并分析其内容,来判定通话内容是否涉及电信诈骗,可较好预防。此外,多家银行还开始运用语言识别技术,以降低冒用他人身份证贷款的事件发生。
但从目前的技术进展和产业发展来看,语音识别技术由于非人性化的风险、远程控制和低准确度,它并不完全可靠。以最简单的手机语言输入为例,它有时并不能完全准确无误的翻译出输入者的语言,很容易受外界因素的干扰。
景联文科技作为专业的数据采集公司在数据采集标注领域耕耘多年,已在全球范围内建设了多个信息采集标注基地,有大量精准的数据。如1000小时成人中文语言手机采集数据,1000小时中国儿童普通话手机采集数据,多国语言各1000小时的语言数据集,多地方言各800小时的语言数据集等,为语音识别技术提供数据支持。
从技术发展和行业进展来看,语音识别技术虽然还无法解决无限制场景、无限制人群的一些识别问题,但是在多个真实场景中已得到运用,也基本满足了行业需求,解决了许多基本问题,有较大的发展前景。