大数据技术与应用

大数据技术与应用
作 者: 中国产业发展研究院
出版社: 机械工业出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  王丽,中科院电子学研究所物理电子学博士,北京航空航天大学博士后研究员,国网科学研究院研究员,主要研究领域为大数据挖掘与分析、MEMS传感器及芯片原理、光学传感技术、微流控技术、信号检测与处理等。发表SCI、EI学术论文10余篇,主持北京市自然科学基金一项。

内容简介

本书是围绕我国国民经济和社会发展第十四个五年规划和2035 年远景目标等重大要求, 由中国通信学会、中国产业发展研究院联合组织编写的“新基建核心技术与融合应用丛书” 之一。大数据技术的战略意义不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。换而言之, 如果把大数据比作一种产业, 那么这种产业实现盈利的关键在于提高对数据的“加工能力”, 通过“加工” 实现数据的“增值”。本书立足数字经济浪潮, 以促进数据合规高效流通使用、赋能实体经济为主线, 重点围绕大数据采集、流通、安全、治理及应用等全生命周期进行编写, 覆盖大数据存储、计算、管理、安全与治理、资产管理与流通、分析、平台、产业与应用等环节, 对培育新质生产力, 推动我国数字经济高质量发展具有重要参考价值。本书适合IT、金融、研究机构相关从业人员以及高等院校相关专业的学生使用, 也可供对大数据感兴趣的读者阅读。

图书目录

序一

序二

前言

第1 章 大数据时代的形成与发展/ 001

1.1 大数据发展历程/ 001

1.1.1 大数据的起源/ 001

1.1.2 全球大数据发展历程/ 001

1.1.3 我国大数据发展历程/ 002

1.2 大数据的定义与特征/ 003

1.2.1 什么是数据/ 003

1.2.2 大数据的定义/ 004

1.2.3 大数据的单位/ 005

1.2.4 大数据的5 V 特征/ 005

1.3 大数据技术/ 006

1.3.1 大数据关键技术/ 006

1.3.2 大数据技术体系分析/ 007

1.3.3 大数据技术细分领域/ 009

1.4 大数据政策及法规/ 010

1.4.1 国外的大数据政策及法规/ 010

1.4.2 我国的大数据政策及法规/ 014

第2 章 大数据核心发展理念/ 018

2.1 大数据新发展观/ 018

2.1.1 大数据理论组成/ 018

2.1.2 数据的资源属性/ 019

2.1.3 数据生产要素/ 021

2.1.4 数据要素价值化/ 022

2.1.5 数据要素价值实现途径/ 023

2.2 数字经济/ 025

2.2.1 数据成为数字经济时代关键生产要素/ 025

2.2.2 数字经济的发展历程/ 025

2.2.3 数字经济的概念与特征/ 026

2.2.4 数字经济新业态、新模式/ 031

2.2.5 数字化转型与数字经济/ 033

2.3 数据要素/ 035

2.3.1 数据治理与数据安全治理/ 035

2.3.2 数字治理体系与数字规则/ 037

2.3.3 依法数字治理/ 040

2.3.4 数字经济治理/ 040

2.3.5 数字治理与数字化转型/ 041

2.4 数据基础设施/ 042

2.4.1 算力新基建/ 042

2.4.2 数据新型基础设施/ 045

2.4.3 “东数西算”打造数据基础设施/ 047

第3 章 大数据存储/ 050

3.1 存储技术基础/ 050

3.1.1 数据存储发展史/ 050

3.1.2 存储系统的类型/ 051

3.1.3 存储架构/ 053

3.1.4 高速存储技术/ 054

3.2 大数据存储架构及技术/ 056

3.2.1 分布式存储/ 056

3.2.2 分布式存储架构/ 057

3.2.3 Google 分布式存储系统GFS / 059

3.2.4 大数据平台Hadoop 存储系统HDFS / 060

3.3 存储技术发展趋势/ 063

3.3.1 软件定义存储/ 064

3.3.2 超融合基础架构/ 067

3.3.3 下一代存储关键技术演进/ 068

3.4 数据存储技术赋能社会经济数字化转型/ 071

3.4.1 异构数据管理加速数据湖/ 071

3.4.2 多级存储介质助力实时分析能力构建/ 072

3.4.3 云存储备份简化数据安全实践路径/ 073

第4 章 大数据计算/ 074

4.1 大数据计算技术/ 074

4.1.1 数据计算技术发展历程/ 074

4.1.2 大规模分布式计算/ 076

4.2 大数据计算主流技术/ 077

4.2.1 大数据计算模式/ 077

4.2.2 批处理计算MapReduce / 078

4.2.3 内存计算Spark / 080

4.2.4 流计算Flink / 081

4.2.5 其他计算模型/ 083

4.3 算力重构大数据计算/ 083

4.3.1 数据处理单元/ 084

4.3.2 算存一体/ 085

4.3.3 算网一体/ 088

4.3.4 智算中心/ 090

4.4 隐私计算/ 091

4.4.1 隐私计算介绍/ 091

4.4.2 隐私计算架构/ 092

4.4.3 隐私计算关键技术/ 094

第5 章 大数据管理/ 095

5.1 大数据管理技术/ 095

5.1.1 大数据结构类型/ 095

5.1.2 CAP 定理/ 097

5.1.3 数据管理系统/ 098

5.2 数据库/ 099

5.2.1 数据库的发展历程/ 099

5.2.2 数据库管理系统架构/ 103

5.2.3 数据库关键技术/ 103

5.3 非关系型数据库/ 105

5.3.1 NoSQL 基本原理/ 106

5.3.2 NoSQL 关键技术/ 106

5.3.3 NoSQL 的数据库类型/ 109

第6 章 大数据安全与治理/ 114

6.1 数据安全与治理/ 114

6.1.1 信息安全/ 114

6.1.2 网络安全/ 115

6.1.3 数据安全/ 117

6.1.4 数据治理/ 118

6.2 大数据安全/ 120

6.2.1 大数据安全技术/ 120

6.2.2 大数据平台安全/ 121

6.2.3 大数据安全技术/ 122

6.2.4 隐私保护/ 123

6.3 大数据安全防护/ 124

6.3.1 大数据安全防护目标/ 124

6.3.2 大数据防护理念/ 125

6.3.3 大数据安全防护框架/ 126

6.3.4 大数据安全防护体系/ 128

6.4 大数据安全关键技术/ 129

6.4.1 风险识别/ 130

6.4.2 安全防护/ 130

6.4.3 安全检测/ 132

6.4.4 安全响应/ 133

6.4.5 安全恢复/ 134

6.4.6 反制/ 134

6.5 大数据安全治理/ 135

6.5.1 数据安全治理的概念/ 135

6.5.2 数据安全治理的内容/ 136

6.5.3 数据安全治理实践过程/ 142

第7 章 大数据资产管理与流通/ 149

7.1 数据与资产/ 149

7.1.1 资产与无形资产/ 149

7.1.2 数据价值表现形式/ 150

7.1.3 数据资产概念/ 150

7.1.4 数据资产特征与属性/ 153

7.2 大数据资产管理/ 154

7.2.1 数据资产管理发展历程/ 154

7.2.2 大数据资产与管理/ 155

7.2.3 大数据资产管理难点/ 157

7.2.4 大数据资产管理发展趋势/ 158

7.3 大数据资产管理体系/ 161

7.3.1 大数据资产管理体系构成/ 161

7.3.2 大数据资产管理活动/ 162

7.3.3 大数据资产管理法则/ 163

7.3.4 大数据资产运营支撑体系/ 166

7.4 大数据资产流通/ 169

7.4.1 数据要素流通/ 169

7.4.2 数据要素市场/ 171

7.4.3 数据确权/ 172

7.4.4 数据评估/ 173

7.4.5 数据交易/ 175

7.4.6 大数据资产流通挑战与发展/ 176

第8 章 大数据分析/ 178

8.1 大数据分析基本概念/ 178

8.1.1 数据分析与挖掘/ 178

8.1.2 什么是大数据分析/ 180

8.1.3 大数据分析与机器学习/ 181

8.1.4 大数据分析与数据科学范式/ 182

8.2 大数据分析流程与框架/ 183

8.2.1 大数据分析流程/ 184

8.2.2 业务理解/ 185

8.2.3 数据理解/ 186

8.2.4 数据准备/ 187

8.2.5 数据建模/ 188

8.2.6 模型验证与评估/ 190

8.2.7 模型部署/ 192

8.3 大数据分析模型与分析方法/ 193

8.3.1 数据清洗与数据探索/ 194

8.3.2 分类与回归/ 200

8.3.3 聚类分析/ 202

8.3.4 关联分析/ 203

8.3.5 时间序列分析/ 204

8.4 大数据分析关键技术/ 205

8.4.1 数据标注/ 205

8.4.2 大数据可视化技术/ 206

8.4.3 时序模式分析技术/ 206

8.4.4 多源数据融合技术/ 206

8.5 大数据分析典型应用/ 207

8.5.1 自然语言处理/ 207

8.5.2 AI 大模型/ 208

8.5.3 生成式人工智能/ 210

8.5.4 知识图谱/ 212

第9 章 大数据平台/ 213

9.1 大数据平台发展历程/ 213

9.1.1 数据平台的变迁/ 213

9.1.2 什么是大数据平台/ 214

9.1.3 大数据平台的发展/ 215

9.2 湖仓一体技术/ 217

9.2.1 数据仓库/ 217

9.2.2 数据湖/ 217

9.2.3 湖仓一体化/ 219

9.3 数据中台/ 220

9.3.1 数据中台的概念/ 220

9.3.2 数据中台建设条件/ 222

9.3.3 数据中台核心能力/ 223

9.3.4 大数据与数据湖、数据中台的区别/ 224

9.4 典型开源大数据平台/ 224

9.4.1 大数据平台核心功能/ 225

9.4.2 开源大数据平台Hadoop系统架构/ 225

9.4.3 城市大数据平台/ 228

第10 章 大数据产业与应用/ 232

10.1 大数据产业/ 232

10.1.1 大数据产业基本概念/ 232

10.1.2 大数据产业构成/ 233

10.1.3 大数据产业现状/ 234

10.2 大数据产业商业模式/ 236

10.2.1 大数据产业链/ 236

10.2.2 大数据商业模式/ 237

10.3 大数据应用/ 238

10.3.1 数据应用发展历程/ 238

10.3.2 大数据应用赋能新质生产力/ 239

10.3.3 大数据应用现状/ 243

10.3.4 大数据应用的难点与挑战/ 244

10.3.5 大数据与实体经济融合应用/ 244

10.4 大数据应用案例/ 245

10.4.1 行业大数据/ 245

10.4.2 地球大数据/ 246

10.4.3 工业大数据/ 249

参考文献/ 258