自然语言处理导论

作　者：	沈颖丁宁
出版社：	机械工业出版社
丛编项：
版权说明：	本书为公共版权或经版权方授权，请支持正版图书
标　签：	暂缺

ISBN	出版时间	包装	开本	页数	字数
未知	暂无	暂无	未知	0	暂无

作者简介

　　沈颖，中山大学智能工程学院副教授，获法国巴黎第十大学计算机博士学位。主要研究方向为通用人工智能的知识计算与推理，在国防信息和医学应用领域获得一系列有特色的成绩。在IEEE TOC、TKDE、TNNLS、TIP、TAC和ACL、AAAI、IJCAI、SIGIR等人工智能领域的知名期刊和会议上发表相关论文100余篇；开源数十项研究工作代码和6个数据集；授权专利16项；授权软件著作权15项。主持自然科学基金、国防科技173计划技术领域基金项目、科技发展中心新一代信息技术创新项目、高教司项目等。曾获欧盟硕士奖、法兰西大岛博士奖学金、巴黎大学博士一等荣誉毕业生、中国留学基金管理委员会海外留学生奖。多次担任IJCAI、ACL等会议程序委员会委员，AAAI和SDM领域。

内容简介

《自然语言处理导论》主要介绍自然语言处理理论与技术，旨在让多人了解和学习自然语言处理技术，让人工智能好地为我们服务。《自然语言处理导论》共16章，包括自然语言理解基础和具体任务探索两部分，主要讲述了自然语言处理文本表示、分析、挖掘、推理等方面的相关概念、方法、技术和近期研究进展；详细介绍了文本分类、情感计算、知识抽取等基础方法；全面讲述了自动文摘、问答系统、机器翻译、社会计算、内容生成和跨模态计算等具体任务；讨论了深度学习前沿问题。《自然语言处理导论》致力于帮助高等院校计算机相关专业学生牢固掌握自然语言处理的基本理论与技术，掌握如何分析文本信息、解决问题、完成相关研究的方法，以及了解自然语言处理的典型应用场景。

图书目录

前言

第1章绪论

1.1基本概念

1.1.1语言学与语音学

1.1.2自然语言

1.1.3自然语言处理

1.2自然语言处理的发展历程

1.2.1自然语言处理的发展历史

1.2.2自然语言处理的研究现状

1.2.3自然语言处理的发展前景

1.3自然语言处理的基本方法

1.3.1理性主义方法

1.3.2经验主义方法

1.3.3对比分析

1.4自然语言处理的研究内容

1.4.1文本分类

1.4.2信息抽取

1.4.3文本摘要

1.4.4智能问答

第2章语言模型

2.1语言模型概述

2.2n-gram统计语言模型

2.2.1何为n-gram模型

2.2.2n-gram语言模型评估词序列

2.2.3n-gram统计语言模型的应用

2.2.4n-gram模型中n对性能的影响

2.2.5n-gram模型小结

思考题

参考文献

第3章神经网络和神经语言模型

3.1人工神经网络和神经语言模型

3.1.1人工神经网络

3.1.2神经语言模型

3.2卷积神经网络

3.2.1卷积神经网络结构

3.2.2卷积神经网络的文本处理

3.3循环神经网络

3.4递归神经网络

3.4.1递归神经网络的前向计算

3.4.2递归神经网络的训练方法

思考题

参考文献

第4章词和语义向量

4.1离散分布表示

4.1.1独热表示法

4.1.2词袋表示法

4.2分布式表示

4.2.1Word2vec

4.2.2矩阵分解

4.2.3GloVe

4.3文本特征选择法

4.3.1基于文档频率的特征提取法

4.3.2 χ2统计量

4.3.3信息增益法

4.3.4互信息法

4.4特征权重计算方法

4.4.1布尔权重

4.4.2 词频

4.4.3TF-IDF

思考题

参考文献

第5章预训练语言模型

5.1Transformer

5.2ELMo

5.3GPT

5.4BERT

5.5后BERT时代

思考题

参考文献

第6章序列标注

6.1马尔可夫模型

6.2条件随机场、维特比算法

6.2.1条件随机场的原理解析

6.2.2条件随机场的特性

6.3序列标注任务

6.3.1自动分词

6.3.2汉语自动分词中的基本问题

6.3.3歧义切分问题

6.3.4未登录词问题

6.4汉语分词方法

6.4.1基于词频度统计的分词方法

6.4.2N- 短路径方法

6.4.3基于词的n元语法模型的分词方法

6.4.4由字构词的汉语分词方法

6.4.5基于词感知机的汉语分词方法

6.4.6基于字的生成式模型和区分式模型相结合的汉语分词方法

6.4.7其他分词方法

6.5词性标注

6.5.1词性标注概述

6.5.2基于规则的词性标注方法

6.5.3基于统计模型的词性标注方法

6.5.4统计方法与规则方法相结合的词性标注方法

6.5.5词性标注的一致性检查

6.5.6技术评测

6.6命名实体识别

6.6.1基于条件随机场的命名实体识别方法

6.6.2基于多特征的命名实体识别方法

6.6.3基于神经网络的命名实体识别方法

思考题

参考文献

第7章语义分析

7.1词义消歧

7.1.1有监督的词义消歧方法

7.1.2基于词典的词义消歧方法

7.1.3无监督的词义消歧方法

7.1.4词义消歧系统评价

7.2语义角色标注

7.2.1语义角色标注基本方法

7.2.2语义角色标注的领域适应性问题

7.3双语联合语义角色标注方法

7.3.1基本思路

7.3.2双语联合语义角色标注方法系统实现

思考题

参考文献

第8章文本分类

8.1文本分类概述

8.2传统分类器设计

8.2.1朴素贝叶斯分类器

8.2.2基于支持向量机的分类器

8.2.3KNN法

8.2.4线性小二乘拟合法

8.2.5决策树分类器

8.3基于神经网络方法

8.3.1文本分析中的循环神经网络方法

8.3.2文本分析中的递归神经网络方法

8.4文本分类性能评测

思考题

参考文献

第9章情感计算

9.1文档或句子级情感计算方法

9.1.1情感词典方法

9.1.2基于传统机器学习的监督情感分类

9.1.3深度神经网络方法

9.2属性级情感分析

9.2.1意见挖掘和属性抽取

9.2.2针对特定目标的情感分析

9.2.3立场检测

9.3其他情感分析任务

9.3.1讽刺识别

9.3.2多模态情感分析

思考题

参考文献

0章知识抽取

10.1知识抽取概述

10.2命名实体识别

10.2.1命名实体识别概述

10.2.2基于词典及规则的方法

10.2.3基于机器学习的有监督方法

10.2.4基于深度学习的方法

10.3实体链接

10.3.1实体链接概述

10.3.2通用解决框架

10.3.3实体链接数据集

10.4关系抽取

10.4.1关系抽取概述

10.4.2有监督关系抽取

10.4.3远程监督

10.4.4实体关系联合抽取

10.4.5小样本关系抽取

10.4.6开放域关系抽取

10.5事件抽取

10.5.1事件抽取概述

10.5.2基于模式匹配的方法

10.5.3基于机器学习的方法

10.5.4基于深度学习的方法

10.5.5事件抽取数据集

思考题

参考文献

1章统计机器翻译和神经机器翻译

11.1机器翻译概述

11.1.1机器翻译的发展

11.1.2机器翻译方法

11.1.3机器翻译研究现状

11.2基于HMM的词对位模型

11.3基于短语的翻译模型

11.4基于熵的翻译模型

11.4.1对位模板与近似

11.4.2特征函数

11.4.3参数训练

11.5基于层次短语的翻译模型

11.5.1概述

11.5.2模型描述和参数训练

11.5.3解码方法

11.6树翻译模型

11.6.1树到串的翻译模型

11.6.2树到树的翻译模型

11.6.3串到树的翻译模型

11.7树模型的相关改进

11.8基于谓词论元结构转换的翻译模型

11.9集外词翻译

11.9.1数字和时间表示的识别与翻译

11.9.2普通集外词的翻译

11.10统计翻译系统实现

11.11译文质量评估方法

11.11.1概述

11.11.2技术指标

11.11.3相关评测

思考题

参考文献

2章问答系统与多轮对话

12.1引言

12.1.1什么是问答系统

12.1.2从问答到对话的扩展

12.2 代：基于模板规则的问答系统

12.3第二代：基于信息检索的问答系统

12.3.1问题理解

12.3.2答案检索

12.4第三代：基于数据库的问答系统

12.4.1问题理解

12.4.2数据库的涌现

12.4.3FAQ问答系统

12.4.4特定领域问答系统（任务型）

12.4.5阅读理解型问答系统

12.5第四代：基于知识库的问答系统

12.5.1知识库

12.5.2语义分析范式

12.5.3信息提取范式

12.5.4对比信息提取范式与语义分析范式

12.5.5数据集

12.6多模态问答系统

12.6.1多模态任务概述

12.6.2视觉问答系统

12.6.3视频问答系统

12.7多轮对话系统与大语言模型

12.7.1多轮对话系统组成

12.7.2对话理解

12.7.3对话管理

12.7.4基于大语言模型的对话系统

12.8前景与挑战

思考题

参考文献

3章基于深度学习的社会计算

13.1基于深度学习的社会联系模型

13.1.1基于浅层嵌入的模型

13.1.2基于深度神经网络的模型

13.2基于深度学习的系统

13.2.1社交媒体中的系统

13.2.2基于浅层嵌入的模型

13.2.3基于深度神经网络的模型

思考题

参考文献

4章自动文摘与信息抽取

14.1自动文摘技术概要

14.2抽取式自动文摘

14.2.1句子重要性评估

14.2.2基于约束的摘要生成方法

14.3压缩式自动文摘

14.3.1句子压缩方法

14.3.2基于句子压缩的自动文摘

14.4生成式自动文摘

14.5基于查询的自动文摘

14.5.1基于语言模型的相关性计算方法

14.5.2基于关键词重合度的相关性计算方法

14.5.3基于图模型的相关性计算方法

14.6跨语言和多语言自动文摘

14.6.1跨语言自动文摘

14.6.2多语言自动文摘

14.7摘要质量评估方法和相关评测

14.7.1摘要质量评估方法

14.7.2相关评测活动

思考题

参考文献

5章内容生成和跨模态计算

15.1自然语言生成和图像描述

15.1.1自然语言生成

15.1.2图像中的自然语言描述示例

15.1.3图像描述技术

15.2图像描述的深度学习框架

15.2.1端到端框架

15.2.2组合框架

15.2.3其他框架

15.3评估指标和基准

思考题

参考文献

6章深度学下自然语言处理的前沿研究

16.1组合型泛化

16.2自然语言处理中的无监督学习

16.3自然语言处理中的强化学习

16.4自然语言处理中的元学习

16.5弱可解释性与强可解释性

思考题

参考文献