语音识别技术,也被称为自动语音识别(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别是计算技术中的一种技术,通过该技术创建专用软件和系统以识别,区分和认证单个说话者的语音,评估个人的语音生物特征,例如语音频率及自然口音。
语音识别芯片也叫语音识别IC,与传统的语音芯片相比,语音识别芯片最大的特点就是能够语音识别,它能让机器听懂人类的语音,并且可以根据命令执行各种动作,如眨眼睛、动嘴巴(智能娃娃)。嵌入式语音识别系统都采用了模式匹配的原理。
语音识别也称为自动语音识别 (ASR)、计算机语音识别或语音到文本,是计算机识别口语并将其翻译成文本的能力。但语音识别软件使用语音识别算法将口语转换为文本。企业使用此软件进行听写或将音频和视频文件转换为文本。
语音理解(speech understanding) 利用知识表达和组织等人工智能技术进行语句自动识别和语意理解。同语音识别的主要不同点是对语法和语义知识的充分利用程度。
语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。
智能音箱主要是通过用户的语音指令实现交互操作,提供内容与服务。其主要的核心技术在于芯片,麦克风阵列技术、语音识别技术、语义识别技术,以及内容推荐算法等。
人工智能技术亦称机器智能,通常人工智能是指通过普通计算机程序的手段实现的人类智能技术,人工智能技术包含机器学习、机器视觉、机器人技术、自然语言处理以及自动化。
声纹识别是生物识别技术的一种,也称为说话人识别,包括说话人辨认和说话人确认,声纹识别就是把声信号转换成电信号,再用计算机进行识别,不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
黑客已经开始寻找复制人脸以欺骗面部识别系统,但事实证明,该技术比指纹或语音识别技术更难破解。尽管身份验证技术提供了独特的好处,但人们的担忧也很重要,包括企业自身持有的敏感生物识别数据的安全性。
模式识别是通过计算机用数学技术方法来研究模式的自动处理和判读。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类特别重要的是对光学信息和声学信息的识别。这是模式识别的两个重要方面。市场可见的代表性产品有光学字符识别、语音识别系统。