AI展现唇语识别能力,大数据不可或缺。
人类对唇语的研究和学习由来已久。然而,由于经验、视线和主观因素的影响,人类唇语解读的正确率是不稳定的。因此,AI学习唇读在很多应用场景中具有现实意义。
唇读是一项特别难的技能。读唇语时,人们会尽可能根据词语之间的联系来判断,读唇语者的语言知识也很重要。AI“唇读”简单来说就是一种唇语识别技术。计算机通过视觉识别和自然语言处理,分析说话人的嘴唇运动,从而识别说话内容。
牛津大学计算机系开发了一个名为LipNet的人工智能系统。据悉,这个人工智能系统是基于一个名为“网格”的数据集。研究团队使用这些数据集来训练人工智能神经网络,并经常将其用于语言识别。随着时间的推移,AI的神经网络识别的口型越来越多,慢慢的它会理解它识别的信息。AI不仅会识别断断续续的图片,相反,它会根据整个演讲的大意,对其识别的信息进行整合。它会根据上下文自动分析句子,理解整篇演讲的大意。
近年来,海云数据、搜狗等国内多家企业也发布了唇语识别技术。唇识别技术在公共安全、军事情报、公益等诸多领域都能发挥巨大作用。
一个成熟的嘴唇识别系统需要大量的人脸特征样本数据,这些数据应该尽可能包含更多的场景和更多的说话人类型,这样才能保证训练出来的嘴唇识别模型具有更好的泛化能力。