该篇翻译自How to start with Kaldi and Speech Recognition
Kaldi架构
Kaldi主要分为两个主要部分:分别是特征抽取、识别模型
特征抽取模块
大多数处理音频数据的模型都会需要对音频进行特征的抽取,用以达到以下两个目的: 识别人类语音的声音丢弃任何不必要的噪音。今…
记录一下kaldi安装过程踩坑
安装步骤
1.进入tools文件目录,执行命令
extras/check_dependencies.sh
显示 all is ok 的话通过,否则按照提示操作
2.执行命令
make
这一步可能会出现 ERROR: cannot verify sourceforge.nets certificate 的错误,查到的原因大概是目标网…
区分性训练和mmi
信息论概念
在信息论中表示信息数量的定义为信息量,它用来表示系统状态数,它随着一个时间的概率增大而变小,该信息量定义为 l o g a 1 / p ( x i ) log_a1/p(x_i) loga1/p(xi) 而信息论中的熵则是在信息量的基础上定义…
DCI调度PDSCH与SPS PDSCH的调度限制
在38.214的5.1节中,UE不期望接收DCI调度的PDSCH与SPS PDSCH的时域有部分重叠或者全部重叠,除非DCI的结束符号位置距离SPS PDSCH(起始位置最靠前)的起始位置大于等于14个符号。
The UE is no…
下文为对3GPP TS38.212 Clause5.3部分的学习。
LDPC编码
针对每一个码块进行编码,给定一个码块,其比特序列输入为 c 0 , c 1 , c 2 , . . . , c K − 1 c_0,c_1,c_2,...,c_{K-1} c0,c1,c2,...,cK−1,码块分割部分见PDSCH物理层处理…