《Python数据科学实践指南》一0.2 如何成为数据科学家
本节书摘来自华章出版社《Python数据科学实践指南》一书中的第0章,第0.1节,纪路 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
0.2 如何成为数据科学家读者应该知道这个问题很难回答,失败的原因总是相似的,成功的经历却各有不同。从来没有人靠复制他人的经历就能获得同样的成就,就像“人不能两次踏入同一条河流”的哲学观点一样,没有人可以复制别人的经历,更何谈成就。因此在回答这个问题时,我只假设一些概念上的前提条件:良好的计算机科学基础,较高的英文读写水平,极强的自学能力,还有一些个人品质比如耐心、毅力、乐于分享,等等。不过最重要的还是“兴趣”,我相信能花上几十块钱购买这本书的读者一定是有兴趣的,因为这本书是给那些对数据科学有一些了解,希望学习具体方法的人准备的。所以,即使上面所说的前提条件你一个都不具备,只要有兴趣,那么让我们从现在就开始吧。
我需要数学或计算机科学的学位吗
最好有!如果你恰好是在校大学生,又碰巧学习数学或计算机相关专业(在这个程序员匮乏的年代,所有必修C语言的专业都称为“计算机相关专业”),希望你能学习好学校的课程,下面是一份技能清单,如果其中有一些技能没有在你的课程安排里,那么最好是通过选修或自学的方式进行补充。
一门编程语言
算法、数据库、操作系统
概率与统计、线性代数
英语
对于已经错过了花季、雨季的社会人来讲,如果你并非从事计算机程序开发的相关工作,上述几项技能对你来说可能要求太高了。不过,你还是需要多付出一些努力来补上这些知识,当然是在读过本书之后。得益于互联网的发达,很多教学资源都能够从网上获取。
这是由布鲁诺·R·普莱斯所著的一系列算法图书的在线版,包括C++版、Java版、C#版、Python版、Ruby版、Lua版、Perl版、PHP版、Objective-C版等,你能想到的常用编程语言都有对应的版本,它们中的一部分有过正式引进的中文版,或者有爱好者翻译的版本,当然推荐阅读原版。
另外,本书会带领读者复习一下概率与统计和线性代数的基本概念,以及介绍一些SQL方面的知识。最后,不要忘记本书的目的是通过数据科学实战学习Python编程。希望读者在读过这本书之后,能有充分的知识来支持后续的学习。
比PCA降维更高级——(R/Python)t-SNE聚类算法实践指南 本文介绍t-SNE聚类算法,分析其基本原理。并从精度上与PCA等其它降维算法进行比较分析,结果表明t-SNE算法更优越,本文最后给出了R、Python实现的示例以及常见问题。t-SNE算法用于自然语音处理、图像处理等领域很有研究前景。
相关文章
- 用 Python 爬虫框架 Scrapy 爬取心目中的女神
- 小白最想了解的最全Python就业方向
- 实战 | 如何用 Python 统计 Jira 数据并可视化
- Python数据可视化1.5 可视化图像
- 《 营销数据科学: 用R和Python进行预测分析的建模技术》——导读
- 《Python数据科学实践指南》一1.2 Python解释器
- gyp ERR! stack Error: Can‘t find Python executable “python“, you can set the PYTHON env variable.
- Python之对象的属性
- 概率分布之间的距离度量以及python实现(三)
- 《Python数据科学指南》——1.18 使用过滤器
- 《Python数据可视化编程实战》——5.4 在matplotlib中创建动画
- 《“笨办法”学Python(第3版)》——习题4 变量和命名
- 《Python数据可视化编程实战》—— 1.4 在Mac OS X上安装matplotlib
- 《Python数据可视化编程实战》—— 1.9 为项目设置matplotlib参数
- 数据科学必备Python使用Pandas数据处理技巧
- Python数据可视化 Pyecharts 制作 Pie 饼状图
- Python数据可视化 Pyecharts 制作 Boxplot 箱线图
- 如何在 Python 中创建用于分类的模拟数据?
- python数据模块类如何定义
- Python 数据分析教程之如何验证线性回归的假设,线性回归的假设是什么?以及如何用python验证它们?
- 如何毫不费力地探索您的 IDX 数据集,使用 idx2numpy 库在 Python 中探索原始 MNIST 文件
- Python 数据教程之如何将行转位列、删除指定行、合并多个表(列不一样)
- (数据科学学习手札20)主成分分析原理推导&Python自编函数实现
- 《Python数据科学实践指南》——0.2 如何成为数据科学家
- 《Python数据可视化之matplotlib实践》 源码 第二篇 精进 第五章
- python之json数据存储
- 华为OD机试 - 运动会(Python) | 机试题+算法思路+考点+代码解析 【2023】
- 电商 生意参谋 抓取 访客数据 Python版