该篇翻译自How to start with Kaldi and Speech Recognition
Kaldi架构
Kaldi主要分为两个主要部分:分别是特征抽取、识别模型
特征抽取模块
大多数处理音频数据的模型都会需要对音频进行特征的抽取,用以达到以下两个目的: 识别人类语音的声音丢弃任何不必要的噪音。今…
记录一下kaldi安装过程踩坑
安装步骤
1.进入tools文件目录,执行命令
extras/check_dependencies.sh
显示 all is ok 的话通过,否则按照提示操作
2.执行命令
make
这一步可能会出现 ERROR: cannot verify sourceforge.nets certificate 的错误,查到的原因大概是目标网…
区分性训练和mmi
信息论概念
在信息论中表示信息数量的定义为信息量,它用来表示系统状态数,它随着一个时间的概率增大而变小,该信息量定义为 l o g a 1 / p ( x i ) log_a1/p(x_i) loga1/p(xi) 而信息论中的熵则是在信息量的基础上定义…