基于语料库的意象和语义可视化研究

作　者：	丁国旗
出版社：	中国社会科学出版社
丛编项：
版权说明：	本书为出版图书，暂不支持在线阅读，请支持正版图书
标　签：	暂缺

ISBN	出版时间	包装	开本	页数	字数
未知	暂无	暂无	未知	0	暂无

作者简介

　　丁国旗，男，外国语言学及应用语言学博士，浙江农林大学暨阳学院副教授，主要从事认知语言学、语料库翻译学及数字人文等方面的研究。主持完成教育部和浙江省人文社会科学研究项目各一项，已出版学术专著一部，在《外国语》、《中国翻译》、《外语研究》、《外语与外语教学》等期刊发表论文多篇。

内容简介

《基于语料库的意象和语义可视化研究》以认知语言学提出的基于使用的语言模型为理论依据，以英汉原创与翻译散文语料库为基础，对比分析文学性语言中的意象和语义结构，并探索对分析结果进行可视化的方法。研究的创新性在于将语料库与数据可视化相结合，有效利用R、Python、D3.js等多种文本分析、统计计算、数据处理和呈现手段，展示了数字人文方法对英汉对比与翻译及语言历时研究的意义。数字人文是近年来在国外蓬勃发展的一个研究方向，然而在国内人文社科领域此类研究较少，专著形式的研究成果亦不多见。

图书目录

章引言

节研究背景

第二节研究内容与意义

第三节本书的结构

第二章语义研究中的语料库方法

节语言使用和语料库

第二节语言形式的本质

一语言的象似性

二语法即意象

第三节语言的意义、可译性及语料库的应用

一意义的体验性

二意义的主观性

三意义即是概念化

四语义的百科性

五意义的可译性

六意义的语料库分析案例

七小结

第三章语料库创建及研究方法

节语料库的创建与加工

一语料库结构和选材

二对齐

三分词与赋码

四语料库基本信息

第二节研究方法与工具

―― WordSmith & AntConc

二 Notepad

三 PowerGREP

四 TextPro

五 ReNamer

六 R

七 Python

八 Gephi

九 D3．js

十 Photoshop

第三节小结

第四章频率、关键词、搭配、语义韵

节频率

一原始频率

二词语过滤

第二节关键词

一参照词表

二借助参照语料库或词表的关键词分析

三 TF―IDF

第三节搭配

一 quanteda

二 tidytext

第四节语义倾向和语义韵

一语义韵的定义及研究现状

二更广意义上的语义韵

三情感分析与数据驱动的语义韵研究

四中英翻译及原创散文语义韵分析

第五节小结

第五章英译中散文词类对比

节相关研究

第二节理论前提

一刻画

二名词与动词

第三节材料与方法

第四节数据与分析

一词类分布及差异

二词类相关性分析

三中译动词的回归分析

第五节讨论

第六节小结

第六章语义研究：词语关联

节 tidytext

第二节词语关联

一英文散文

二中译散文

三中文散文

第三节翻译对等词

第四节小结

第七章语义研究：词语嵌入

节 word2vec词语嵌人原理

第二节 t-SNE

一英文散文

二中译散文

三中文散文

第三节语义网络

一英文散文

二中译散文

三中文散文

第四节小结

第八章语义研究：主题分析1

节主题建模及其研究现状

一主题

二主题建模的定义与简单原理

三研究现状

第二节材料、工具与步骤

一语料库

二主题建模工具

三分析步骤

第三节结果与讨论

第四节小结

第九章语义研究：主题分析2

节研究现状

第二节材料、工具与步骤

一语料库

二中文分词

三主题建模工具

四分析步骤

第三节结果与讨论

一 tidytext语义相关性分析

二 Gensim神经网络分析

三 dfrtopics主题模型分析

第四节小结

第十章结语

节本书的发现

第二节本书的不足和对未来研究的建议

附录

附录1 斯坦福大学的分词和赋码工具使用方法及代码

附录2 借助参照语料库或词表的关键词分析和绘图代码（R）

附录3 文本中关键词的TF-IDF计算和绘图代码（R）

附录4 回归分析可视化代码（R）

附录5 获取翻译对等词的代码（R）

附录6 词嵌入模型训练代码（Python）

附录7 使用t―sNE降维和可视化代码（Python）

附录8 用于生成语义网络的代码（Python）

附录9 用于主题模型的代码（R）

参考文献

索引