| 作 者: | 陈果果 |
| 出版社: | 电子工业出版社 |
| 丛编项: | |
| 版权说明: | 本书为出版图书,暂不支持在线阅读,请支持正版图书 |
| 标 签: | 暂缺 |
| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
1 语音识别技术基础 1
1.1 语音识别极简史 1
1.2 语音识别系统架构 6
1.3 一些其他细节 11
2 Kaldi概要介绍 15
2.1 发展历史 15
2.2 设计思想 18
2.3 安装 20
2.4 一个简单的示例 26
2.5 示例介绍 34
3 数据整理 44
3.1 数据分集 44
3.2 数据预处理 49
3.3 输入和输出机制 56
3.4 常用数据表单与处理脚本 69
3.5 语言模型相关文件 79
4 经典声学建模技术 94
4.1 特征提取 95
4.2 单音子模型的训练 107
4.3 三音子模型训练 128
4.4 特征变换技术 139
4.5 区分性训练 143
5 构图和解码 147
5.1 N元文法语言模型 148
5.2 加权有限状态转录机 151
5.3 用WFST表示语言模型 156
5.4 状态图的构建 158
5.5 图的结构优化 170
5.6 最终状态图的生成 174
5.7 基于令牌传递的维特比搜索 176
5.8 SimpleDecoder源码分析 178
5.9 Kaldi 解码器家族 187
5.10 带词网格生成的解码 189
5.11 用语言模型重打分提升识别率 192
6 深度学习声学建模技术 195
6.1 基于神经网络的声学模型 195
6.2 神经网络在Kaldi中的实现 200
6.3 神经网络模型训练 214
6.4 神经网络的区分性训练 228
6.5 与其他深度学习框架的结合 242
7 关键词搜索与语音唤醒 245
7.1 关键词搜索技术介绍 245
7.2 语音检索 247
7.3 语音唤醒 263
……