语音识别和图像识别的区别是什么?
度学习属于机器学习中人工神经网络发展的高级版。 语音识别、图像识别也都是属于模式识别的范畴。 不管是机器学习还是模式识别也都属于人工智能的分支。 几乎人工智能的所有方面都用深度学习,但是深度学习有个前提需要建立深层的神经网络和足够的数据集才能实现。 在语音和图像两个领域在2006年之前都建立了大量的数据测试集,深度学习一出现就应用于这两个方面也就不足为奇了。图象识别比较容易,因为图象可以在一个时间点成像。而语音没有可能在一个时间点的采样有用,语音多出来一个时间轴。而这个时间轴引入的难题就是:换个时间,换个人,换个背景噪音,都变得没法子识别了。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。