中文问答系统技术及应用

中文问答系统技术及应用
作 者: 张巍
出版社: 电子工业出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 计算机/网络 计算机理论
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  张巍,山西职工医学院副教授,中国计算机学会会员,山西省计算机学会会员,《软件导刊》编委会编委。荣获2011-2012学年学校十佳教师;2014-2015学年学校十佳教师。主讲Web系统与技术、无线网络通信技术、计算机应用基础、Visual Basic程序设计、网络数据库等课程。

内容简介

本书全面系统地介绍问答系统的基本技术及应用,不仅讨论受限领域的问答系统,而且讨论开放领域的问答系统。全书共13章,第1章为绪论,介绍问答系统的研究背景、意义、研究现状及分类,然后分为两个部分,分别介绍受限域问答系统和开放域问答系统。在受限域问答系统中,讨论面向常问问题库及面向本体的问答策略,并讨论推理机制在问答系统中的应用。在开放域问答系统中,讨论中文问题分类技术及关键词扩展技术,然后讨论大规模问答对库的建立、答案推荐的技术等。各章对理论的叙述力求概念清晰、表达准确,突出理论联系实际,富有启发性,易于理解。本书可以作为高等学校自然语言处理和计算语言学等专业本科生和研究生自然语言处理的教材,也可以作为从事自然语言处理相关领域的研究人员和技术人员的参考书。

图书目录

录第1章

绪论

中文问答系统研究

11.1.1

研究背景

11.1.2

研究意义

问答系统国内外研究现状

问答系统的分类

4第一部分

受限域问答系统第2章

受限域问答系统及本体

本书受限域问答系统研究内容

本书第一部分结构

本体语言简介

122.3.1

本体的概念

122.3.2

本体描述语言OWL

“医院”领域本体的构建

132.4.1

医学知识的特点

132.4.2

利用Protégé构建“医院”领域本体

实验及结果分析

172.5.1

本体构建实验

172.5.2

本体推理实验——阿莫西林与抗感染药推理过程

192.5.3

实验结果分析

19第3章

面向FAQ库的问答策略

问题库的建设

基于常问问题集的问答策略分析

253.2.1

索引表的建立

253.2.2

句子相似度计算策略1—基于统计和语义的方法

253.2.3

句子相似度计算策略2—基于依存句法和改进编辑距离的方法

293.2.4

FAQ库的更新

实验及结果分析

323.3.1

实验评测标准

323.3.2

实验结果及分析

32第4章

面向本体知识库的问答策略

本体知识库问答模块概述

问句浅层语义分析

374.2.1

语义块定义规则

374.2.2

问句向量

414.2.3

语义块的判定

424.2.4

语义块冲突的处理

问句处理实验结果及分析

本体查询模块答案的抽取

实验及结果分析

面向本体知识库的问答策略的不足与展望

47第5章

Jena推理及在问答系统中的应用

推理机研究

485.1.1

推理机的功能

485.1.2

本体推理机

Jena研究

505.2.1

Jena及其结构

505.2.2

Jena2推理机

实验设计及实现

525.3.1

Jena推理实验一

525.3.2

Jena推理实验二

545.3.3

实验结果分析

55第6章

SWRL及Jess推理在问答系统中的应用

SWRL架构及表示方式

基于本体的SWRL及Jess推理系统框架

推理系统的实现框架

推理过程

586.4.1

SWRL规则的建立

586.4.2

SWRL规则及OWL本体知识转换

实验及结果分析

616.5.1

在Protégé

3.4.1环境下的实验

616.5.2

在MyEclipse环境下的实验

636.5.3

实验结果分析

65第7章

城域医院问答检索系统的实现

系统的构建意义

系统设计原则

系统总体结构

系统实现与分析

67第二部分

开放域问答系统第8章

开放域问答系统概述

开放域问答系统的特点

开放域问答系统的基本结构

本书第二部分结构

73第9章

基于语义特征的中文问题分类方法

知网简介

问题的表示

问题预处理和关键词提取

问题分类特征的选取与表示

799.4.1

问题疑问词的提取

799.4.2

问题的核心关键词在《知网》中的主要义原的提取

809.4.3

命名实体的提取

849.4.4

单/复数的提取

849.4.5

问句分类特征的向量表示

问题分类算法

859.5.1

支持向量机

859.5.2

KNN算法

889.5.3

最大熵算法

问题分类体系

中文问题分类实验

909.7.1

实验方案

909.7.2

实验数据

919.7.3

评价标准

929.7.4

实验结果和实验分析

92第10章

基于同义词词林和知网的关键词扩展

关键词扩展的意义

信息检索中的同义词

同义词词林及其扩展版

基于知网的词语相似度计算

利用《同义词词林》扩展,利用《知网》精简的关键词扩展

实验结果及其讨论

10010.6.1

同义词扩展实验

10010.6.2

扩展查询实验

101第11章

答案源的获取方法研究

网页采集

网页去重

10611.2.1

网页的预处理

10611.2.2

网页去重的处理方法

10711.2.3

网页去重算法测评

信息提取

11111.3.1

网页净化

11111.3.2

DOM树的概念

11211.3.3

模糊归类算法

11311.3.4

节点影响度因子

11411.3.5

算法综述

11411.3.6

实验设计与结果

基于百度知道的问答对库的建立

11711.4.1

百度知道问答社区简介

11711.4.2

建立基于关系模式的问答对库

119第12章

基于大规模问答对库的答案推荐

研究背景和研究现状

问题相似度计算方法

12212.2.1

基于向量空间的TF-IDF句子相似度计算方法

12312.2.2

基于关键词语义的句子相似度计算方法

12312.2.3

基于语义依存的句子相似度计算方法

实验过程及结果分析句子相似度计算的评价

12512.3.1

实验数据

12512.3.2

实验方法及结果

125第13章

基于相似问题推荐的问答系统原型

基于相似问题推荐的问答系统技术路线

基于相似问题推荐的问答系统原型结构图

原型系统工作方式

128附录A

中文问题分类标准

130附录B

百度知道的分类体系

132附录C

知网与ICTCLAS词性标注方式比较

133附录D

哈尔滨工业大学的依存句法分析中的句法关系

134附录E

知网义原树的组成

135附录F

知网知识词典中特殊符号的含义

136参考文献