入行数据科学,这些书一定要看
大数据已经成为这个时代的标志,如何理解和运用大数据,也是我们这个时代的重中之重。因此选择一本合适的数据科学书至关重要。
近日,在GitHub上看到一张大而全的数据科学书单图,该图片分成七大领域,各自都有相对应的推荐书单,本文就为为各位推荐几本书,希望能够有助于你在大数据方面的学习。
1、《数据科学入门》
本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。
2、《Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking》
本书清晰易懂,适合统计基础一般的人用来先理解ML的概念,书中涵盖大量数据科学的概念,读起来通俗易懂。你可以把书中大框架都理解了再去看别的更偏重理论或算法的书,
3、《贝叶斯思维》
这本书旨在帮助那些希望用数学工具解决实际问题的人们,但阅读本书之前你***懂一点概率知识和程序设计。本书在共计15章的篇幅中讨论了怎样解决十几个现实生活中的实际问题。在解决问题的过程中,作者还潜移默化的帮助读者形成了建模决策的方法论,在这个意义上,这本书又是一本关于数学建模的成功样本。
4、《数据科学实战》
这本书涉及的面包含数据科学的各个层面,是相关专家客座课堂讲义的分析和总结,主要涵盖以下内容:
- 统计推断、探索性数据分析(EDA)及数据科学工作流程
- 算法
- 垃圾邮件过滤、朴素贝叶斯和数据清理
- 逻辑回归
- 金融建模
- 推荐引擎和因果关系
- 数据可视化
- 社交网络与数据新闻
- 数据工程、MapReduce、Pregel和Hadoop
5、《复杂性思考》
本书提供了一系列练习;这些练习都要求学生重新实现一些开创性实验并对其进行扩展。复杂性吸引人的一个地方在于我们可以通过适当的编程技能与数学知识接触研究前沿。
6、《统计思维:程序员数学之概率统计》
本书是一本概率统计方面的入门图书,但视角极为独特,折射出大数据浪潮的别样风景。作者将基本的概率统计知识融入Python编程,告诉你如何借助编写程序,用计算而非数学的方式实现统计分析。
7、《利用Python进行数据分析》
本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题,十分适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。
8、《Python数据科学手册》
本书是对以数据深度需求为中心的科学、针对计算和统计方法的参考书。共有五章,每章介绍一到两个Python数据科学中的重点工具包。本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。
9、《Advanced and Multivariate Statistical Methods》
这是一本关于数据挖掘书籍,书中介绍了多种多元统计方法。
相关文章
- 图像处理工具Python扩展库,你了解吗?
- 十个常用的损失函数解释以及Python代码实现
- 30 个数据科学工作中必备的 Python 包
- 如何在 Windows 上安装 Python
- 几行 Python 代码就可以提取数百个时间序列特征
- 使用Python快速搭建接口自动化测试脚本实战总结
- 哪种编程语言最适合开发网页抓取工具?
- 不要在 Python 中使用循环,这些方法其实更棒!
- 震惊!用Python探索《红楼梦》的人物关系!
- 如何最简单、通俗地理解Python模块?
- 酷炫,Python实现交通数据可视化!
- 为什么急于寻找Python的替代者?
- 30 个数据工程必备的Python 包
- 去字节面试被面这题能答上来吗?谈谈你对时间轮的理解?
- 火山引擎在行为分析场景下的 ClickHouse JOIN 优化
- 用Python爬取了某宝1166家月饼数据进行可视化分析,终于找到最好吃的月饼~
- 在 Linux 上试试这个基于 Python 的文件管理器
- Python列表解析式到底该怎么用?
- 如何快速把你的 Python 代码变为 API
- 十个Python初学者常犯的错误