R语言实战 数据整理、可视化、建模与挖掘

R语言实战 数据整理、可视化、建模与挖掘
作 者: 薛震 孙玉林
出版社: 机械工业出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  薛震,博士、副教授、硕士生导师、香港城市大学访问学者、山西省数学学会理事、山西省数学类专业教学指导委员会秘书长、中北大学教学名师。从事统计分析、机器学习与数据可视化研究。主持参与国家自然科学基金、山西省自然科学基金、装备预研重点项目等10多项,发表论文30余篇,出版教材《R语言统计分析与机器学习》《R语言数据可视化实战》等,荣获全国“公益云图数据可视化创新大赛”优秀导师。孙玉林,西安电子科技大学人工智能学院博士在读,长期从事大数据统计分析、机器学习与计算机视觉等方面的研究,发表多篇SCI一区期刊论文,曾获得多次数学建模、数据挖掘等赛事一等奖。出版著作《R语言统计分析与机器学习》《R语言数据可视化实战》《R语言数据分析:基础、算法与实战》《Pytorch深度学习入门与实战》《Python机器学习:基础、算法与实战》等。

内容简介

本书是一本数据科学的入门与提升教程,全书共5篇,按照由浅入深、循序渐进的方式介绍R语言的基本语法与实际应用,并结合现实数据进行实战操作。内容涵盖R语言的安装与运行、数据对象的创建与编程、R语言初级与高级绘图、数据的管理与清洗、统计分析与数据降维、无监督与有监督学习、利用R Markdown创建动态报告和制作幻灯片等。本书为读者提供了相关案例的源码(获取方式见封底)。本书适合对数据可视化、统计建模、数据分析、数据挖掘感兴趣的研究人员和工程技术人员阅读,也可作为高等院校数学、统计学、数据科学、计算机科学、人工智能、云计算、大数据分析、生物医学、工业统计等方向本科生或研究生的参考教程。

图书目录

前言

第一篇 R语言入门

第1章 R语言简介/

1.1R语言的下载与运行/

1.2RStudio安装与设置/

1.3R语言包/

1.4数据类型与运算符/

1.5运行R语言代码/

1.6本章小结/

第2章 R语言数据对象/

2.1向量/

2.1.1数值型/

2.1.2逻辑型/

2.1.3缺失值/

2.1.4字符型/

2.1.5因子型/

2.1.6类型转换/

2.2矩阵与高维数组/

2.2.1矩阵/

2.2.2高维数组/

2.3数据框/

2.3.1生成数据框/

2.3.2数据框操作/

2.4列表/

2.4.1生成列表/

2.4.2列表操作/

2.5时间数据/

2.5.1基础包处理时间数据/

2.5.2lubridate包处理时间数据/

2.6本章小结/

第3章 程序编写与函数/

3.1条件判断语句/

3.1.1if语句/

3.1.2ifelse语句/

3.2循环语句/

3.2.1for循环/

3.2.2while循环/

3.2.3repeat循环/

3.3内置函数/

3.3.1常用的数学函数/

3.3.2常用的字符串处理函数/

3.3.3常用的统计函数/

3.4自定义函数/

3.4.1函数语法/

3.4.2函数编写/

3.4.3函数调试/

3.5本章小结/

第二篇 R语言数据整理实战

第4章 数据读写与管理/

4.1数据导入与保存/

4.2从文件中导入数据/

4.2.1导入带有分隔符的数据/

4.2.2导入Excel表格数据/

4.2.3导入SPSS数据/

4.2.4导入SAS数据/

4.2.5导入MATLAB数据/

4.2.6导入Stata数据/

4.2.7使用RStudio菜单导入数据/

4.3网络爬虫爬取数据/

4.3.1从网页中获取链接和表格/

4.3.2从网页中获取文本/

4.3.3从网页中获取图片/

4.4图像数据管理/

4.4.1读取图像/

4.4.2图像操作/

4.5数据并行计算/

4.5.1apply()函数的使用/

4.5.2lapply()函数的使用/

4.5.3sapply()和vapply()函数的使用/

4.5.4tapply()和mapply()函数的使用/

4.6本章小结/

第5章 数据清洗与操作/

5.1处理缺失值/

5.1.1发现缺失值/

5.1.2缺失值分布可视化/

5.1.3缺失值填补/

5.2dplyr数据操作/

5.2.1管道操作/

5.2.2数据选择/

5.2.3数据过滤/

5.2.4数据修改/

5.2.5数据排序/

5.2.6数据分组/

5.2.7数据融合/

5.3长宽数据转换/

5.3.1tidyr包长宽数据转换/

5.3.2reshape2包长宽数据转换/

5.4文本处理/

5.4.1正则表达式/

5.4.2stringr包文本操作/

5.4.3中文文本预处理/

5.5本章小结/目录

第三篇 R语言数据可视化实战

第6章 R语言基础绘图/

6.1图形的基础设置/

6.1.1图形的形状和线条/

6.1.2图形的坐标系/

6.1.3图形的颜色/

6.1.4图形的文本/

6.2基础图形可视化/

6.2.1散点图与线图/

6.2.2直方图与条形图/

6.2.3箱线图与平滑散点图/

6.2.4三维图形/

6.3子图可视化/

6.3.1图形窗口设计/

6.3.2绘制子图/

6.4本章小结/

第7章 ggplot2数据可视化/

7.1ggplot2简介/

7.1.1图形语法/

7.1.2qplot快速绘图/

7.2使用图层构建图形/

7.2.1几何对象/

7.2.2theme函数/

7.2.3统计变换/

7.2.4位置调整/

7.2.5形状和大小/

7.3ggplot2可视化进阶/

7.3.1主题/

7.3.2颜色/

7.3.3分面/

7.3.4坐标系/

7.3.5可视化地图/

7.4ggplot2数据可视化案例/

7.5本章小结/

第8章 R语言高级绘图/

8.1plotly可交互图形可视化/

8.1.1可交互统计图/

8.1.2可交互图形添加控件/

8.1.3制作可交互动画/

8.2ggplot2拓展包可视化/

8.2.1cowplot包可视化/

8.2.2ggfortify包可视化/

8.2.3ComplexUpset包可视化/

8.3特殊图形可视化/

8.3.1圆环条形图/

8.3.2弧形图/

8.4本章小结/

第四篇 R语言数据建模实战

第9章 基础统计分析/

9.1概率分布与抽样/

9.1.1随机数生成/

9.1.2概率分布/

9.1.3数据抽样/

9.2数据描述性统计/

9.2.1数据的变量类型/

9.2.2数据描述汇总/

9.2.3频数和列联表/

9.3数据相关性分析/

9.3.1Pearson相关性系数/

9.3.2Spearman秩相关性系数/

9.3.3Kendall相关性系数/

9.4假设检验/

9.4.1数据分布检验/

9.4.2t检验/

9.5方差分析/

9.5.1单因素方差分析/

9.5.2双因素方差分析/

9.5.3多变量方差分析/

9.6本章小结/

第10章 回归分析/

10.1一元线性回归/

10.1.1一元线性回归模型/

10.1.2一元线性回归实例/

10.2一元非线性回归/

10.2.1多项式回归/

10.2.2非线性最小二乘回归/

10.2.3样条模型/

10.3多元线性回归/

10.3.1回归模型的建立/

10.3.2回归诊断/

10.3.3异常值分析/

10.3.4改进回归模型/

10.4逐步回归/

10.4.1直接逐步回归/

10.4.2剔除异常值逐步回归/

10.5逻辑回归/

10.5.1用逻辑回归进行数据分类/

10.5.2逐步逻辑回归分析/

10.6本章小结/

第11章 特征提取与降维/

11.1主成分分析/

11.1.1判断主成分的个数/

11.1.2提取主成分得分/

11.1.3主成分得分系数/

11.1.4核主成分分析/

11.2因子分析/

11.2.1确定因子个数/

11.2.2提取公共因子/

11.3多维尺度分析/

11.3.1MDS数据降维/

11.3.2计算样本的空间位置/

11.4tSNE降维/

11.4.1tSNE数据降维案例/

11.4.2调整tSNE算法的困惑度/

11.5本章小结/

第五篇 R语言数据挖掘实战

第12章 无监督学习/

12.1聚类分析/

12.1.1选择合适的聚类数目/

12.1.2K均值与K中值聚类/

12.1.3层次聚类/

12.1.4密度聚类/

12.1.5模糊聚类/

12.2离群点检测/

12.2.1LOF离群点检测/

12.2.