语音识别系统是人们几十年来一直梦想和研究的东西。在过去的几年里,它已经成为一个流行的概念。从个人到组织,该技术因其提供的各种优势而被广泛使用。在这篇文章中,我们将讨论什么是语音识别系统,它是如何工作的,它的类型,架构,应用,优点和缺点。
什么是语音识别系统
语音识别技术的基本任务是识别说话人以文本形式说出的内容。话语可以是一个孤立的单词或句子,甚至可以是一个段落。作为计算机程序实现的算法将语音信号转换为单词序列。
图1 -语音识别系统简介
亚马逊的Alexa、谷歌的Google Assistant、苹果的Siri和微软的Cortana等数字助理正在通过改变人们与设备、家庭、汽车和工作的互动方式,给日常生活带来巨大的变化。这些技术使我们能够与计算机或设备进行交互,它们可以解释我们所说的话,并对我们的问题或命令做出回应。
图2是典型的语音识别系统框图,输入语音经过声学建模,将语音转换为从语音信号计算得到的矢量的统计表示。然后对语音(单词或句子)进行搜索,并与系统中的数据进行匹配,输出识别的话语。
图2 -语音识别系统的典型框图
语音识别系统的类型
它们有两种类型:
- 文本依赖语音识别系统
- 文本独立语音识别系统
文本依赖语音识别系统
这些系统要求说话者说出预定的单词或短语(称为“Pass phrase”)。然后将此Pass Phrase与已捕获的样本进行比较。
文本独立的语音识别系统
这些系统经过训练,可以在没有密码短语的情况下识别一个人。但是为了识别声音特征,它们需要说话者更长的语音输入。
语音识别系统的体系结构
系统架构由以下几个模块组成:
- 语音捕获装置
- 数字信号处理模块
- 预处理信号存储器
- 参考语音模式
- 模式匹配算法
图3 -语音识别系统架构
语音捕获装置
语音捕获设备是将声波转换为电信号的麦克风和将模拟信号数字化以获得计算机能够理解的数据的模数转换器(ADC)。188bet登入官网
数字信号模块
该模块对原始语音信号进行处理,如频域转换,仅恢复所需信息等。
预处理信号存储器
这个存储存储预处理的声音。
参考语音模式
系统由预定义的语音样本组成,作为匹配的参考。
模式匹配算法
将未知语音信号与参考语音模式进行比较,找出实际的单词或单词的模式。
语音识别系统是如何工作的
该系统的工作原理是通过麦克风等语音捕捉设备记录一个人的语音样本。声音只不过是模拟信号,通过嘈杂的通信信道传递。模数转换器(ADC)通过采样和数字化处理,将模拟信号转换成数字数据。
然后,系统过滤掉不需要的噪音,并将其分成不同的频带,使声音正常化。这样做是因为用户并不总是以相同的速度和音量说话。因此,声音必须进行调整,以匹配预先存储在系统数据库中的模板。
图4 -语音(语音)识别系统工作原理
对于像长句子这样的大词汇量语音识别,将其分解为子词序列。这个过程称为分段。该过程对信号进行处理,信号处理模块提取特征向量,对信号进行分段处理。这些提取的向量构成了解码器的输入。
解码器使用声学模型、发音模型和语言模型来生成与输入特征向量匹配的单词序列。语音识别系统使用统计建模系统,利用概率和数学函数来确定最可能的结果。
语音解码器将声信号X解码成与原单词序列W相近的单词序列W*,用统计语音识别方程表示:
在那里;
语音识别系统的应用
语音识别技术的应用包括:
工作场所
语音识别系统在工作场所的应用包括:
- 在计算机上搜索文档或报告
- 使用数据创建表或图形
- 应要求打印文件
- 开始视频会议
- 安排会议
- 安排旅行
银行
语音识别系统在银行中的应用包括:
- 获取有关您的交易信息,余额,而不必打开你的手机
- 支付
- 接收有关您的交易历史的信息
市场营销
语音系统有可能为营销人员提供一种接触消费者的新方式。有了语音识别,就会有一种新的数据可供营销人员分析。
医疗保健
语音识别系统在医疗保健中的应用包括:
- 从医疗记录中快速查找信息
- 可以提醒工人注意指示或流程
- 人们可以在家里询问与疾病相关的问题
- 减少输入数据的时间
- 改进工作流程
物联网(IoT)
语音识别系统在物联网中最重要的应用之一是在汽车上。汽车数字助理应用的例子有:
- 免提收听留言
- 控制你的收音机
- 协助引导和导航
- 响应语音命令
的优点语音识别系统
语音识别技术的优点包括:
- 语音识别技术通过让残疾人打字和操作电脑来帮助人们。
- 它既简单又快速。
- 该系统易于通过电话或其他语音设备使用,因此它是有用的。
- 语音识别系统是相当合理的。
- 开车时发短信导致的交通事故很常见。有了语音识别技术,人们就可以在不转移视线的情况下书写文本和创建电子邮件。因此,汽车安全得到了保证。
缺点的语音识别系统
语音识别技术的缺点包括:
- 缺乏准确性和误解虽然语音识别技术可以识别英语中的大多数单词,但它仍然难以识别人名和俚语。它也不能区分同音异义词,如“their”和“there”。
- 时间成本和生产力毫无疑问,技术可以加快流程,但在语音识别系统的情况下,用户可能不得不投入比预期更多的时间。用户必须检查和编辑以纠正错误。随着时间的推移,一些程序会适应你的声音和说话模式;这可能会减慢您的工作流程,直到程序达到速度。你还必须学会如何使用这个系统。
还读:面部识别系统-它是如何工作的,架构和应用模数转换器(ADC) -如何工作,类型,应用测试设备。重要性,工作原理,类型,应用,预防