日常生活中,我们接触到最多的语音交互应用大概就是各种语音助手,比如siri,比如小爱助手。 此类语音交互工具不仅可以“听懂”我们说的话,而且还可以按照我们的要求完成各种任务。
一些语音助手只能够识别简单的普通话,对于复杂的带有口音的内容识别的准确率很低,
然而某些语音助手在这方面要表现的很好。
经常使用语音助手的用户可能会注意到,不同语音助手之间是有着很大差距的,一个明显的表现就是语音识别的准确率上。
未来的语音交互形式将会高效率、更加自然、更加接近于人本能的方向。
这背后一个很重要的原因是机器学习的数据量不足。
随着人工智能的发展,
语音交互技术逐渐成熟,并在人工智能时代有了先发优势。
语音交互属于人机交互的范畴,是人机交互发展到目前的一种最前沿的交互方式,
简单来说就是用人类的自然语言给机器下指令,达成自己目的的过程。
目前,语音交互已经加速在智能家居、手机、车载、智能穿戴、机器人等行业渗透和落地。
我们知道目前人工智能的实现主要依赖于机器学习,机器学习最终效果取决于投喂数据的质量与数量。 语音交互领域常用的几种数据标注类型主要有: 一.语音转录 对不同说话人的说话内容进行转写: 二.语音合成 对说话内容进行合成转写: 理论上而言,标注数据数量越多,质量越高,
那么最终的模型效果就会越好,表现在语音助手上的效果就是识别率的提高。
当然,语音交互的应用场景远不至此。
上一篇:说明:中国人民解放军海军职工大学 下一篇:【总结】深圳疾控提醒市民不采食野生蘑菇