基于语料库的意象和语义可视化研究

基于语料库的意象和语义可视化研究
作 者: 丁国旗
出版社: 中国社会科学出版社
丛编项:
版权说明: 本书为出版图书,暂不支持在线阅读,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  丁国旗,男,外国语言学及应用语言学博士,浙江农林大学暨阳学院副教授,主要从事认知语言学、语料库翻译学及数字人文等方面的研究。主持完成教育部和浙江省人文社会科学研究项目各一项,已出版学术专著一部,在《外国语》、《中国翻译》、《外语研究》、《外语与外语教学》等期刊发表论文多篇。

内容简介

《基于语料库的意象和语义可视化研究》以认知语言学提出的基于使用的语言模型为理论依据,以英汉原创与翻译散文语料库为基础,对比分析文学性语言中的意象和语义结构,并探索对分析结果进行可视化的方法。研究的创新性在于将语料库与数据可视化相结合,有效利用R、Python、D3.js等多种文本分析、统计计算、数据处理和呈现手段,展示了数字人文方法对英汉对比与翻译及语言历时研究的意义。数字人文是近年来在国外蓬勃发展的一个研究方向,然而在国内人文社科领域此类研究较少,专著形式的研究成果亦不多见。

图书目录

章 引言

节 研究背景

第二节 研究内容与意义

第三节 本书的结构

第二章 语义研究中的语料库方法

节 语言使用和语料库

第二节 语言形式的本质

一 语言的象似性

二 语法即意象

第三节 语言的意义、可译性及语料库的应用

一 意义的体验性

二 意义的主观性

三 意义即是概念化

四 语义的百科性

五 意义的可译性

六 意义的语料库分析案例

七 小结

第三章 语料库创建及研究方法

节 语料库的创建与加工

一 语料库结构和选材

二 对齐

三 分词与赋码

四 语料库基本信息

第二节 研究方法与工具

―― WordSmith & AntConc

二 Notepad

三 PowerGREP

四 TextPro

五 ReNamer

六 R

七 Python

八 Gephi

九 D3.js

十 Photoshop

第三节 小结

第四章 频率、关键词、搭配、语义韵

节 频率

一 原始频率

二 词语过滤

第二节 关键词

一 参照词表

二 借助参照语料库或词表的关键词分析

三 TF―IDF

第三节 搭配

一 quanteda

二 tidytext

第四节 语义倾向和语义韵

一 语义韵的定义及研究现状

二 更广意义上的语义韵

三 情感分析与数据驱动的语义韵研究

四 中英翻译及原创散文语义韵分析

第五节 小结

第五章 英译中散文词类对比

节 相关研究

第二节 理论前提

一 刻画

二 名词与动词

第三节 材料与方法

第四节 数据与分析

一 词类分布及差异

二 词类相关性分析

三 中译动词的回归分析

第五节 讨论

第六节 小结

第六章 语义研究:词语关联

节 tidytext

第二节 词语关联

一 英文散文

二 中译散文

三 中文散文

第三节 翻译对等词

第四节 小结

第七章 语义研究:词语嵌入

节 word2vec词语嵌人原理

第二节 t-SNE

一 英文散文

二 中译散文

三 中文散文

第三节 语义网络

一 英文散文

二 中译散文

三 中文散文

第四节 小结

第八章 语义研究:主题分析1

节 主题建模及其研究现状

一 主题

二 主题建模的定义与简单原理

三 研究现状

第二节 材料、工具与步骤

一 语料库

二 主题建模工具

三 分析步骤

第三节 结果与讨论

第四节 小结

第九章 语义研究:主题分析2

节 研究现状

第二节 材料、工具与步骤

一 语料库

二 中文分词

三 主题建模工具

四 分析步骤

第三节 结果与讨论

一 tidytext语义相关性分析

二 Gensim神经网络分析

三 dfrtopics主题模型分析

第四节 小结

第十章 结语

节 本书的发现

第二节 本书的不足和对未来研究的建议

附录

附录1 斯坦福大学的分词和赋码工具使用方法及代码

附录2 借助参照语料库或词表的关键词分析和绘图代码(R)

附录3 文本中关键词的TF-IDF计算和绘图代码(R)

附录4 回归分析可视化代码(R)

附录5 获取翻译对等词的代码(R)

附录6 词嵌入模型训练代码(Python)

附录7 使用t―sNE降维和可视化代码(Python)

附录8 用于生成语义网络的代码(Python)

附录9 用于主题模型的代码(R)

参考文献

索引