| 作 者: | 罗刚 |
| 出版社: | 电子工业出版社 |
| 丛编项: | |
| 版权说明: | 本书为公共版权或经版权方授权,请支持正版图书 |
| 标 签: | 操作系统/系统开发 计算机/网络 |
| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
第1章
应用自然语言处理技术 11.1
付出与回报 21.1.1
如何开始 21.1.2 招聘人员 21.1.3 学习 31.2 开发环境 31.3 技术基础 41.3.1 Java 41.3.2 规则方法 51.3.3 统计方法 51.3.4 计算框架 51.3.5 文本挖掘 71.3.6 语义库 71.4 本章小结 91.5 专业术语 9第2章
中文分词原理与实现 112.1 接口 122.1.1 切分方案 132.1.2 词特征 132.2 查找词典算法 132.2.1 标准Trie树 142.2.2 三叉Trie树 182.2.3 词典格式 262.3 最长匹配中文分词 272.3.1 正向最大长度匹配法 282.3.2 逆向最大长度匹配法 332.3.3 处理未登录串 392.3.4 开发分词 432.4 概率语言模型的分词方法 452.4.1 一元模型 472.4.2 整合基于规则的方法 542.4.3 表示切分词图 552.4.4...
英文分析 1943.1 分词 1943.1.1 句子切分 1943.1.2 识别未登录串 1973.1.3 切分边界 1983.2 词性标注 1993.3 重点词汇 2023.4 句子时态 2033.5 本章小结 204第4章
依存文法分析 2054.1 句法分析树 2054.2 依存文法 2114.2.1 中文依存文法 2114.2.2 英文依存文法 2204.2.3 生成依存树 2324.2.4 遍历 2354.2.5 机器学习的方法 2374.3 小结 2374.4 专业术语 238第5章
文档排重 2395.1 相似度计算 2395.1.1 夹角余弦 2395.1.2 最长公共子串 2425.1.3 同义词替换 2465.1.4 地名相似度 2485.1.5 企业名相似度 2515.2 文档排重 2515.2.1 关键词排重 2515.2.2 SimHash 2545.2.3 分布式文档排重 2685.2.4 使用文本排重 2695.3 在搜索引擎中使用文本排重 2695.4 本章小结 2705.5 专业术语 270第6章
信息提取 2716.1 指代消解 2716.2 中文关键词提取 2736.2.1 关键词提取的基本方法 2736.2.2 HITS算法应用于关键词提取 2756.2.3 从网页中提取关键词 2776.3 信息提取 2786.3.1 提取联系方式 2806.3.2 从互联网提取信息 2816.3.3 提取地名 2826.4 拼写纠错 2836.4.1 模糊匹配问题 2856.4.2 正确词表 2966.4.3 英文拼写检查 2986.4.4 中文拼写检查 3006.5 输入提示 3026.6 本章小结...
自动摘要 3047.1 自动摘要技术 3057.1.1 英文文本摘要 3077.1.2 中文文本摘要 3097.1.3 基于篇章结构的自动摘要 3147.1.4 句子压缩 3147.2 指代消解 3147.3 Lucene中的动态摘要 3147.4 本章小结 3177.5 专业术语 318第8章
文本分类 3198.1 地名分类 3218.2 错误类型分类 3218.3 特征提取 3228.4 关键词加权法 3268.5 朴素贝叶斯 3308.6 贝叶斯文本分类 3368.7 支持向量机 3368.7.1 多级分类 3458.7.2 规则方法 3478.7.3 网页分类 3508.8 最大熵 3518.9 信息审查 3528.10 文本聚类 3538.10.1 K均值聚类方法 3538.10.2 K均值实现 3558.10.3 深入理解DBScan算法 3598.10.4 使用DBScan算...
文本倾向性分析 3649.1 确定词语的褒贬倾向 3679.2 实现情感识别 3689.3 本章小结 3729.4 专业术语 373第10章
问答系统 37410.1 问答系统的结构 37510.1.1 提取问答对 37610.1.2 等价问题 37610.2 问句分析 37710.2.1 问题类型 37710.2.2 句型 38110.2.3 业务类型 38110.2.4 依存树 38110.2.5 指代消解 38310.2.6 二元关系 38310.2.7 逻辑表示 38610.2.8 问句模板 38610.2.9 结构化问句模板 38910.2.10 检索方式 39010.2.11 问题重写 39510.2.12 提取事实 3951...
语音识别 41311.1 总体结构 41411.1.1 识别中文 41611.1.2 自动问答 41711.2 语音库 41811.3 语音合成 41911.3.1 归一化 42011.4 语音 42011.4.1 标注 42411.4.2 相似度 42411.5 Sphinx 42411.5.1 中文训练集 42611.6 Julius 42911.7 本章小结 42911.8 术语表 429参考资源 430后记 431