文字识别:原理、方法和实践

文字识别:原理、方法和实践
作 者: 丁晓青 王言伟
出版社: 清华大学出版社
丛编项:
版权说明: 本书为出版图书,暂不支持在线阅读,请支持正版图书
标 签: 计算机/网络 人工智能
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  作者:丁晓青 王言伟等

内容简介

本书基于模式识别和信息熵理论,全面、系统和深入地分析介绍了各种汉字、多文种文字识别的理论和方法,以及解决复杂多变的多文种文字和文档识别中关键问题的有效算法和具体实践。本书可以作为相关专业研究生的参考书,也可以供从事模式识别、文字和文档识别等计算机信息处理研究的科研人员和从事相关产品开发的工程技术人员阅读参考。

图书目录

目录第1章绪论1.1引言1.2文字和汉字1.2.1文字的代码表示1.2.2汉字的字体字形1.2.3汉字的特点

1.2.4中文信息处理1.3文字识别和汉字识别1.4文字识别研究历程1.5文字识别分类1.5.1按照不同文种文字和文档的识别技术分类1.5.2按照获取图像方式和识别对象不同分类1.5.3单个字符识别和文档篇章识别1.6文字识别与笔迹鉴别1.7汉字识别的基本方法——基于视觉感知的汉字识别方法1.8关于本书参考文献第2章模式识别和模式识别信息熵理论2.1引言:

模式与模式识别2.2基于贝叶斯统计决策的模式识别2.3模式识别统一信息熵理论2.3.1特征和类别及其相关信息熵2.3.2后验熵:*优贝叶斯分类器误识率的上限2.3.3模式识别的学习与识别信息过程2.3.4互信息:决定模式识别性能的鉴别熵2.4正态分布条件下的模式识别信息熵系统2.5*大互信息鉴别分析(互信息鉴别子空间模式识别)

2.5.1*大互信息子空间线性鉴别分析方法2.5.2*大互信息线性鉴别分析与线性鉴别分析LDA2.6特征选择的信息熵准则2.6.1基于错误概率的类别可分性准则2.6.2基于有效互信息的类别可分性准则2.7从信息熵分析看提高识别性能的途径2.8汉字集合和汉字文本的信息熵2.8.1汉字集合的信息熵2.8.2汉字文本的信息熵和汉字的极限熵2.9本章小结参考文献第3章汉字识别的特征提取3.1引言3.2汉字字符图像规一化预处理3.2.1线性规一化3.2.2非线性规一化3.2.3基于整体密度均衡的非线性规一化3...

3.4.2基于形态学汉字结构分析的两级印刷汉字识别特征和系统3.4.3汉字笔画密度微结构全局特征及多字体汉字识别系统3.4.4基于汉字笔画方向网格特征的鲁棒汉字识别系统3.5笔画方向线素特征3.5.1方向线素特征的形成方法3.5.2网格化方向线素特征3.5.3对原模糊分块方法的改进——低通采样方向线素特征3.5.4实验和结果3.6基于Gabor滤波器的高性能汉字识别方向特征3.6.1Gabor变换理论分析3.6.2适用于汉字识别的Gabor滤波器组设计及实验验证3.6.3对Gabor滤波器组输出的非...

4.3正则化线性鉴别分析4.3.1小样本带来的问题4.3.2利用正则化估计协方差阵4.3.3实验结果4.4异方差鉴别分析4.4.1基于极大似然估计的异方差线性鉴别分析4.4.2基于Chernoff准则的异方差线性鉴别分析4.4.3基于Mahalanobis准则的异方差线性鉴别分析4.4.4实验结果4.4.5小结4.5特征统计分布整形变换4.5.1特征分布的整形4.5.2正态性检验4.5.3BoxCox变换4.5.4方向线素及梯度特征的整形4.5.5实验与结果4.6本章小结参考文献第5章模式识别分类...

5.3.4二次鉴别函数分类器QDF5.3.5二次鉴别函数5.3.6QDF误差分析5.4改进二次鉴别函数分类器MQDF5.4.1修正二次鉴别分类MQDF5.4.2QDF修正形式的贝叶斯估计推导5.4.3实验与结果5.5系统实现与应用5.5.1非限定脱机手写汉字识别系统5.5.2多字体印刷中、日、韩文识别系统5.6分类器的置信度分析5.6.1分类器的置信度和广义置信度5.6.2基于距离的分类器的广义置信度估计5.6.3多层前向神经网络分类器广义置信度估计5.6.4从广义置信度求置信度的方法5.6.5使用...

参考文献第11章蒙藏维多文种识别11.1引言11.1.1蒙藏维文识别11.1.2民族文字识别的现状11.1.3藏文及其识别11.1.4维吾尔文及其识别11.1.5蒙古文及其识别11.2蒙藏维文识别的基本策略11.2.1基本识别单元选择11.2.2基本框架和关键技术11.3多文种民族文字识别中的字符规一化11.3.1基于基线分块的民族字符规一化策略11.3.2规一化点阵大小选择11.3.3位置规一化11.3.4基于三次B样条函数的字符图像插值11.3.5笔画宽度调整11.4民族文字识别中的特征提取与特...