Python数据整理

Python数据整理
作 者: 提尔塔吉奥蒂·萨卡 舒布哈迪普·罗伊乔杜里
出版社: 机械工业出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  提尔塔吉奥蒂·萨卡(Tirthajyoti Sarkar),半导体技术领域的高级工程师,他将前沿的数据科学与机器学习技术应用于设计自动化和预测分析,并定期撰写关于Python编程和数据科学主题的文章。他拥有伊利诺伊大学的博士学位和斯坦福大学与麻省理工学院的人工智能和机器学习的证书。舒布哈迪普·罗伊乔杜里(Shubhadeep Roychowdhury),一家总部在巴黎的网络安全初创公司的高级软件工程师,目前致力于应用先进的计算机视觉、数据工程算法和工具开发尖端产品。他经常撰写Python算法实现和类似主题的文章。他拥有西孟加拉邦科技大学的计算机科学硕士学位和斯坦福大学的机器学习证书。

内容简介

《Python数据整理》是一本实用的Python数据整理入门教程。书中全面、系统地阐释数据整理和提炼过程背后的所有核心思想,通过大量的练习和实例,帮助你全方位理解并掌握相关概念、工具和技术。《Python数据整理》内容共分为9章,第1章详细介绍数据整理的重要性及工作重点,并介绍Python的基本数据结构及其实现;第2章是《Python数据整理》的基础,阐述Python中的高级数据结构和操作系统的文件操作功能;第3章着重描述Python中NumPy、pandas和Matplotlib三个基本库的基础知识;第4章深入分析pandasDataFrames的相关知识;第5章介绍应用于现实生活的网页抓取的数据整理技术;第6章提出现实生活中发生的数据问题,并学习如何解决这些问题;第7章学习如何从网页、XML文件和API中收集数据;第8章解释数据库的概念,包括数据库的创建、操作和控制,以及如何将表格转换为pandasDataFrame;第9章将前面所学的知识应用到实际数据集中,并对其不同方面进行研究。为了使数据有用且有意义,必须对其进行整理和提炼。《Python数据整理》将向你揭示这些过程背后的核心思想,并让你掌握该领域中流行的工具和技术的相关知识。《Python数据整理》以Python为基础,重点关注数据结构,然后深入到数据整理的基本工具,如Numpy和pandas库。你将深入了解为什么应该远离基于其他语言实现的传统数据清理方式,而利用Python中特定的预建例程。Python提示和技巧的组合将演示如何使用相同的Python后端从各种数据源(包括互联网、大型数据库和Excel财务表)提取和转换数据。为了帮你应对更具挑战性的场景,《Python数据整理》将向你介绍如何处理缺失数据或错误数据,并根据下游分析工具要求重新格式化数据。《Python数据整理》将通过现实世界的例子和数据集进一步帮助你掌握相关概念。通过《Python数据整理》的学习,你将有信心对各种不同的数据源进行高效的提取、清理、转换并格式化数据。,通过阅读《Python数据整理》,你将学到:使用与操作复杂和简单的数据结构。在运行时充分利用DataFrame和Numpy数组。使用BeautifuISoup4和htm151ib执行网络抓取。使用正则表达式(RegEX)执行高级字符串搜索和操作。通过pandas处理异常值与执行数据填充。描述性统计和绘图技术的使用。...

图书目录

译者序

前言

第1章 Python数据整理入门

1.1 引言

1.2 Python数据整理

1.3 列表、集合、字典、元组和字符串

1.3.1 列表

练习1:访问列表成员

练习2:生成列表

练习3:遍历列表并检查成员

练习4:列表排序

练习5:生成随机列表

活动1:处理列表

1.3.2 集合

1.3.3 字典

练习6:访问和设置字典中的值

练习7:遍历字典

练习8:再次讨论唯一值列表问题

练习9:删除字典中的值

练习10:字典推导式

1.3.4 元组

练习11:处理元组

1.3.5 字符串

练习12:访问字符串

练习13:字符串切片

练习14:字符串拆分与合并

活动2:分析多行字符串并生成唯一单词数量

1.4 小结

第2章 高级数据结构和文件处理

2.1 引言

2.2 高级数据结构

2.2.1 迭代器

练习15:迭代器介绍

2.2.2 栈

练习16:在Python中实现栈

练习17:使用用户定义的方法实现栈

2.2.3 Lambda表达式

练习18:用Lambda表达式证明三角恒等式

练习19:用于排序的Lambda表达式

练习20:多元素成员检查

2.2.4 队列

练习21:在Python中实现队列

活动3:Permutations、迭代器、Lambda、列表

2.3 Python基本文件操作

练习22:写入和读取环境变量

练习23:打开和关闭文件

练习24:逐行读取文件

练习25:写入文件

活动4:设计专属CSV解析器

2.4 小结

第3章 NumPy、pandas和Matplotlib简介

3.1 引言

3.2 NumPy数组操作

练习26:从列表中创建NumPy数组

练习27:两个NumPy数组相加

练习28:NumPy数组的数学运算

练习29:NumPy数组的高级数学运算

练习30:使用arange和linspace生成数组

练习31:创建多维数组

练习32:二维数组的维度、形状、大小和数据类型

练习33:全零、全一、随机、单位矩阵和向量

……

第4章 深入学习Python数据整理

第5章 适应不同类型的数据源

第6章 学习数据整理的隐藏秘密

第7章 高级网络抓取和数据收集

第8章 关系数据库管理系统和结构化查询语言

第9章 数据整理在现实生活中的应用

附录 活动实施步骤