汉语语音识别系统搭建音素识别模型大约有200个。
语言模型技术广泛应用于语音识别、OCR、机器翻译、输入法等产品上。语言模型建模过程中,包括词典、语料、模型选择,对产品的性能有至关重要的影响。
语言模型的建模需要利用复杂的模型公式进行模拟计算,是人工智能领域的关键技术之一。语言模型是针对某种语言建立的概率模型,目的是建立一个能够描述给定词序列在语言中的出现的概率的分布。
给定下边两句话:定义机器人时代的大脑引擎,让生活更便捷、更有趣、更安全。代时人机器定义引擎的大脑,生活让更便捷,有趣更,安更全。语言模型会告诉你,第一句话的概率更高,更像一句”人话”。
语言模型技术广泛应用于语音识别、OCR、机器翻译、输入法等产品上。语言模型建模过程中,包括词典、语料、模型选择,对产品的性能有至关重要的影响。Ngram模型是最常用的建模技术,采用了马尔科夫假设,目前广泛地应用于工业界。
语言模型的性能,很大程度上取决于语料的质量和体量。和特定任务匹配的大语料,永远是最重要的。但是实际应用中,这样的语料往往可遇不可求。
传统的ngram建模技术,对长距离的依赖处理的欠佳。如工业界常用的四元模型,即当前词的概率,只依赖三个历史词。因此,更远距离的历史词在建模中,没有对当前词概率产生影响。
此外,ngram模型建模的参数空间过于庞大。同样以四元模型为例,词典大小为V,参数空间就是。实际应用中V大小为几万到几个。