| 作 者: | 于康 |
| 出版社: | 浙江工商大学出版社 |
| 丛编项: | |
| 版权说明: | 本书为出版图书,暂不支持在线阅读,请支持正版图书 |
| 标 签: | 日语 日语教程 语言 |
| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
卷首语
前言
第1章 语言资源的利用与语料库建设
1.1 制作语料库的目的
1.2 现在可供使用的主要语料库
1.3 制作自己的语料库
1.4 语料库的多元化用途
第2章 电脑配置、所需软件及软件的安装
2.1 电脑的配置
2.1 所需软件
2.2.1 Java
2.2.2 「秀丸」
2.2.3 「えだまめ」
2.2.4 「ひまわり」
2.3 软件的下载和安装
2.3.1 Java的下载和安装
2.3.2 「秀丸」的下载和安装
3.3.3 「えだまめ」的下载和安装
2.3.4 「ひまわり」的下载和安装
2.4 小结
第3章 收集与保存语料
3.1 收集语料时所需的设备和软件
3.1.1 扫描仪
3.1.1.1 单页扫描仪
3.1.1.2 连续扫描仪
3.1.2 Adobe®Acrobat®9 Standard(或X,或Pro,或以上的版本)
3.1.3 JUST PDF 2 [作成?高度編集?データ変換]
3.1.4 OCR软件
3.1.5 「秀丸」
3.2 建立保存语料用的文件夹
3.3 收集语料的具体操作方法
3.3.1 从网上直接下载和保存语料
3.3.1.1 如何下载电子版报纸的社论
3.3.1.2 如何下载「青空文庫」中的作品
3.3.1.3 如何下载「国会会議録」中的会议记录
3.3.2 从PDF文件中读取和保存语料
3.3.3 将纸版语料转换为电子语料的步骤
3.3.3.1 如何将纸版语料转换为PDF格式的文件
3.3.3.2 如何将PDF格式的文件转换为文本格式的文件
3.3.3.2.1 如何使用OCR将PDF格式的文件转换为文本格式的文件
3.3.3.2.2 如何使用PDF软件自带的OCR功能将文件转换为文本格式的文件
3.4 小结
第4章 清理语料
4.1 手动删除无需的信息
4.2 使用“规则命令句”删除注音假名 (ルビ)
4.3 使用“规则命令句”删除文中的各类不需要的符号
4.3.1 删除各种装饰性符号
4.3.2 删除多余的文字和符号信息
4.3.3 删除空格和空行
4.3.3.1 删除空格
4.3.3.2 删除空行
4.4 出错时的返工方法
4.5 小结 第5章 制作语料库
5.1 使用「えだまめ」转换文件的格式
5.2 使用全文检索软件「ひまわり」制作语料库
5.3 设定检索条件与检索例句
5.3.1 「検索文字列」
5.3.1.1 无条件检索
5.3.1.1.1 固定形式的无条件检索
5.3.1.1.2 可变形式的无条件检索
5.3.1.2 有条件检索
5.3.2 「フィルタ」
5.3.3 「コーパス」
5.3.4 「検索オプション」
5.3.4 例句栏上方的10个栏目标题
5.4 在全文中观察、保存和使用例句
5.4.1 在全文中观察例句
5.4.2 保存例句
5.4.2.1 保存其中的个别例句
5.4.2.2 保存检索的全部结果
5.4.3 展开和使用例句
5.4.3.1 使用「秀丸」展开例句
5.4.3.2 使用Word展开例句
5.4.3.3 使用Excel展开例句
5.5 小结 第6章 给例句加注标签与日语研究
6.1 制作标签的思路
6.2 标签的分类与所需软件
6.2.1 标签的分类
6.2.2 加注标签时所使用的软件
6.3 如何给日语例句加注标签
6.3.1 加注标签与日语「存在構文」的研究
6.3.2 加注标签
6.3.2.1 通过语料库收集「NPに(は)+NPが+V」的例句
6.3.2.2 清除垃圾例句
6.3.2.3 给例句加注标签
6.3.3 制作加注标签的语料库「日本語の存在構文コーパス」
6.3.4 检索和保存例句以及清除垃圾例句
6.3.5 对标签进行统计和分析
6.3.5.1 「非対格自動詞」存在句
6.3.5.2 「他動詞」存在句
6.3.5.3 「非能格自動詞」存在句
6.3.5.4 日语存在句成句规则的假设
6.4 小结 后记
参考文献