| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
目录
第一部分背景与概念
第1 章绪论3
1.1 迁移学习3
1.2 相关研究领域 6
1.3 迁移学习的必要性8
1.3.1 大数据与少标注之间的矛盾 8
1.3.2 大数据与弱计算能力的矛盾 8
1.3.3 有限数据与模型泛化能力的矛盾 9
1.3.4 普适化模型与个性化需求的矛盾 9
1.3.5 特定应用的需求10
1.4 迁移学习的研究领域 11
1.4.1 按特征空间分类12
1.4.2 按目标域有无标签分类 12
1.4.3 按学习方法分类12
1.4.4 按离线与在线形式分类 13
1.5 迁移学习的应用14
1.5.1 计算机视觉14
1.5.2 自然语言处理 15
1.5.3 普适计算与人机交互16
1.5.4 医疗健康17
1.6 学术会议和工业界中的迁移学习 18
第2 章从机器学习到迁移学习21
2.1 机器学习及基本概念 21
2.2 结构风险最小化22
2.3 数据的概率分布23
2.4 概念与符号25
2.5 迁移学习的问题定义 26
第3 章迁移学习基本问题29
3.1 何处迁移30
3.2 何时迁移32
3.3 如何迁移32
3.4 失败的迁移:负迁移 33
3.5 完整的迁移学习过程 35
第二部分方法与技术
第4 章迁移学习方法总览39
4.1 迁移学习总体思路39
4.2 分布差异的度量40
4.2.1 百花齐放的迁移学习分布度量41
4.2.2 分布差异的统一表征42
4.2.3 分布自适应因子的计算 44
4.3 迁移学习统一表征45
4.3.1 样本权重迁移法46
4.3.2 特征变换迁移法47
4.3.3 模型预训练迁移法 48
4.3.4 小结 48
4.4 上手实践48
4.4.1 数据准备49
4.4.2 基准模型构建:KNN 51
4.5 迁移学习理论 53
4.5.1 概念与符号54
4.5.2 基于H-divergence 的理论分析 54
4.5.3 基于HΔH-distance 的理论分析55
4.5.4 基于差异距离的理论分析57
4.5.5 结合标签函数差异的理论分析58
第5 章样本权重迁移法 59
5.1 问题定义59
5.1.1 样本权重迁移法的可行性分析59
5.1.2 形式化定义60
5.2 基于样本选择的方法 61
5.2.1 基于非强化学习的样本选择法62
5.2.2 基于强化学习的样本选择法 63
5.3 基于权重自适应的方法 64
5.4 上手实践66
5.5 小结68
第6 章统计特征变换迁移法 69
6.1 问题定义69
6.2 最大均值差异法70
6.2.1 基本概念70
6.2.2 基于最大均值差异的迁移方法72
6.2.3 求解与计算75
6.2.4 应用与扩展76
6.3 度量学习法78
6.3.1 从预定义的距离到可学习的距离 78
6.3.2 度量学习及其形式化79
6.3.3 基于度量学习的迁移学习80
6.4 上手实践81
6.4.1 算法精炼81
6.4.2 编写代码82
6.5 小结84
第7 章几何特征变换迁移法 85
7.1 问题定义85
7.2 子空间变换法 86
7.3 流形学习法87
7.3.1 流形学习87
7.3.2 基于流形学习的迁移学习方法88
7.4 最优传输法91
7.4.1 最优传输91
7.4.2 基于最优传输法的迁移学习方法 92
7.5 上手实践94
7.6 小结97
第8 章预训练方法99
8.1 深度网络的可迁移性 99
8.2 预训练–微调102
8.3 预训练方法的有效性分析105
8.4 自适应的预训练方法 106
8.5 重新思考预训练模型的使用 108
8.6 上手实践110
8.7 小结113
第9 章深度迁移学习115
9.1 总体思路116
9.2 深度迁移学习的网络结构117
9.2.1 单流结构118
9.2.2 双流结构118
9.3 数据分布自适应的深度迁移学习方法120
9.3.1 边缘分布自适应120
9.3.2 条件、联合与动态分布自适应121
9.4 结构自适应的深度迁移学习方法 122
9.4.1 批归一化123
9.4.2 批归一化用于迁移学习 123
9.4.3 基于多表示学习的迁移网络结构 124
9.5 知识蒸馏125
9.6 上手实践127
9.6.1 网络结构127
9.6.2 损失 129
9.6.3 训练 131
9.6.4 测试 132
9.7 小结133
第10 章对抗迁移学习135
10.1 生成对抗网络 135
10.2 对抗迁移学习基本思路 136
10.3 数据分布自适应的对抗迁移方法137
10.4 基于信息解耦的对抗迁移方法 140
10.5 基于数据生成的对抗迁移方法 141
10.6 上手实践 142
10.6.1 领域判别器143
10.6.2 分布差异计算 143
10.6.3 梯度反转层144
10.7 小结 145
第11 章迁移学习热门研究问题 147
11.1 类别不均衡的迁移学习 148
11.2 多源迁移学习 150
11.3 开放集迁移学习153
11.4 时间序列的迁移学习154
11.5 联邦迁移学习 158
11.5.1 联邦学习158
11.5.2 联邦迁移学习 160
11.6 基于因果关系的迁移学习161
11.6.1 什么是因果关系161
11.6.2 因果关系与迁移学习163
11.7 自动迁移学习 168
11.8 在线迁移学习 171
第三部分扩展与探索
第12 章领域泛化177
12.1 领域泛化问题 177
12.1.1 背景177
12.1.2 问题定义179
12.1.3 常用方法180
12.2 基于数据分布自适应的方法181
12.2.1 领域无关成分分析DICA181
12.2.2 深度数据分布自适应183
12.3 基于解耦的方法184
12.4 基于集成模型的方法186
12.5 基于数据生成的方法187
12.5.1 领域随机法187
12.5.2 对抗数据生成 188
12.6 基于元学习的方法 190
12.7 小结 191
第13 章元学习193
13.1 元学习简介193
13.1.1 问题背景193
13.1.2 元学习 194
13.2 基于模型的元学习方法 196
13.3 基于度量的元学习方法 198
13.4 基于优化的元学习方法 199
13.5 元学习的应用与挑战201
13.5.1 应用201
13.5.2 现存的挑战202
13.6 小结 202
第14 章迁移学习模型选择205
14.1 模型选择 205
14.2 基于密度估计的模型选择206
14.3 迁移交叉验证 207
14.4 小结 208
第四部分应用与展望
第15 章迁移学习的应用211
15.1 计算机视觉212
15.2 自然语言处理 214
15.3 语音识别与合成216
15.4 普适计算与人机交互218
15.5 医疗健康领域 220
15.6 其他应用 223
15.7 小结 225
第16 章迁移学习前沿227
16.1 融合人类经验的迁移227
16.2 迁移强化学习 228
16.3 迁移学习的可解释性228
16.4 迁移学习系统 229
附录A231
A.1 常用度量准则 231
A.1.1 常见的几种距离231
A.1.2 余弦相似度232
A.1.3 互信息 232
A.1.4 相关系数232
A.1.5 KL 散度与JS 距离233
A.1.6 最大均值差异MMD 233
A.1.7 Principal Angle 234
A.1.8 A-distance234
A.1.9 希尔伯特–施密特独立性系数234
A.1.10 Wasserstein Distance234
A.2 迁移学习常用数据集235
A.2.1 手写体识别图像数据集 235
A.2.2 对象识别数据集236
A.2.3 图像分类数据集237
A.2.4 通用文本分类数据集237
A.2.5 行为识别公开数据集238
A.3 本书相关资源 238
参考文献241