卷积神经网络与计算机视觉

卷积神经网络与计算机视觉
作 者: 萨尔曼·汗 黄智濒 戴志涛
出版社: 机械工业出版社
丛编项: 智能科学与技术丛书
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  :作者简介: 萨尔曼?汗(Salman Khan) 澳大利亚国立大学讲师,联邦科学与工业研究组织(CSIRO)研究科学家。 侯赛因?拉哈马尼(Hossein Rahmani) 西澳大利亚大学计算机科学与软件工程学院研究员。 赛义德?阿法克?阿里?沙(Syed Afaq Ali Shah) 西澳大利亚大学计算机科学与软件工程学院副研究员。 穆罕默德?本纳努恩(Mohammed Bennamoun) 西澳大利亚大学教授,曾任计算机科学与软件工程学院院长。:译者简介: 黄智濒 北京邮电大学计算机学院讲师,博士,主要研究方向为计算机视觉和三维可视化。 戴志涛 北京邮电大学计算机学院教授,主要研究方向为深度学习加速器和嵌入式系统。

内容简介

本书自成一体,如果你既想了解CNN的原理,又想获得将CNN应用于计算机视觉的一手经验,那么本书将非常适合阅读。书中对CNN进行了全面介绍,首先是神经网络的基本概念:训练、正则化和优化。然后讨论了各种各样的损失函数、网络层和流行的CNN架构,回顾了评价CNN的不同技术,并介绍了一些常用的CNN工具和库。此外,本书还分析了CNN在计算机视觉中的应用案例,包括图像分类、对象检测、语义分割、场景理解和图像生成。

图书目录

译者序

前言

致谢

作者简介

第1章简介

11什么是计算机视觉

111应用案例

112图像处理与计算机视觉

12什么是机器学习

121为什么需要深度学习

13本书概览

第2章特征和分类器

21特征和分类器的重要性

211特征

212分类器

22传统特征描述符

221方向梯度直方图

222尺度不变特征变换

223加速健壮特征

224传统的手工工程特征的局限性

23机器学习分类器

231支持向量机

232随机决策森林

24总结

第3章神经网络基础

31引言

32多层感知机

321基础架构

322参数学习

33循环神经网络

331基础架构

332参数学习

34与生物视觉的关联

341生物神经元模型

342神经元的计算模型

343人工神经元与生物神经元

第4章卷积神经网络

41引言

42神经网络层

421预处理

422卷积层

423池化层

424非线性

425全连接层

426转置卷积层

427感兴趣区域的池化层

428空间金字塔池化层

429局部特征聚合描述符层

4210空间变换层

43CNN损失函数

431交叉熵损失函数

432SVM铰链损失函数

433平方铰链损失函数

434欧几里得损失函数

4351误差

436对比损失函数

437期望损失函数

438结构相似性度量

第5章CNN学习

51权重初始化

511高斯随机初始化

512均匀随机初始化

513正交随机初始化

514无监督的预训练

515泽维尔(Xavier)初始化

516ReLU敏感的缩放初始化

517层序单位方差

518有监督的预训练

52CNN的正则化

521数据增强

522随机失活

523随机失连

524批量归一化

525集成模型平均

5262正则化

5271正则化

528弹性网正则化

529最大范数约束

5210早停

53基于梯度的CNN学习

531批量梯度下降

532随机梯度下降

533小批量梯度下降

54神经网络优化器

541动量

542涅斯捷罗夫动量

543自适应梯度

544自适应增量

545RMSprop

546自适应矩估计

55CNN中的梯度计算

551分析微分法

552数值微分法

553符号微分法

554自动微分法

56通过可视化理解CNN

561可视化学习的权重

562可视化激活

563基于梯度的可视化

第6章CNN架构的例子

61LeNet

62AlexNet

63NiN

64VGGnet

65GoogleNet

66ResNet

67ResNeXt

68FractalNet

69DenseNet

第7章CNN在计算机视觉中的应用

71图像分类

711PointNet

72目标检测与定位

721基于区域的CNN

722快速RCNN

723区域建议网络

73语义分割

731全卷积网络

732深度反卷积网络

733DeepLab

74场景理解

741DeepContext

742从RGBD图像中学习丰富的特征

743用于场景理解的PointNet

75图像生成

751生成对抗网络

752深度卷积生成对抗网络

753超分辨率生成对抗网络

76基于视频的动作识别

761静止视频帧的动作识别

762双流CNN

763长期递归卷积网络

第8章深度学习工具和库

81Caffe

82TensorFlow

83MatConvNet

84Torch7

85Theano

86Keras

87Lasagne

88Marvin

89Chainer

810PyTorch

第9章结束语

91本书概要

92未来研究方向

术语表

参考文献