《数据整理实践指南》一导读
![8817101c66332317b174bccf6f98eded8fbdccf0](https://yqfile.alicdn.com/8817101c66332317b174bccf6f98eded8fbdccf0.png)
数据整理实践指南
本书使用的体例
提示
这个图标代表小窍门、建议或一般注解。
警告
这个图标代表警示或警告。
代码范例的使用
本书是帮助你完成工作的。一般说来,你可以在没有我们许可的情况下,在程序和文件里使用本书中的代码,除非你在重复创建代码中极为重要的一部分。比如说,写一段程序要用好几段本书中的代码,不需要经过许可。而销售或发布来自O’Reilly书籍中配套的CD-ROM是需要经过许可的。通过引用本书内容和代码示例回答问题不需经过许可。但将来自本书的大量代码示例合并到你的产品文档时,必须经过许可。
如果能够标明引用的出处,我们将非常感激,但不做硬性要求。一个出处通常应包含题目、作者、出版社和国际标准图书编号(ISBN, International Standard Book Number)。例如:“Bad Data Handbook, Q. Ethan McCallum (Q’Reilly). Copyright 2013 Q. McCallum, 978-1-449-32188-8.”
如果你认为代码示例的使用已超出正常使用的范围或者超出了上面的许可范围,请使用permissions@oreilly.com随时联系我们。
Safari®图书在线
图像说明文字 Safari 图书在线(www.safaribooksonline.com)是一种按需数字化图书馆。它提供的专业内容都来自科技和商业领域的世界顶级作者。既有书籍也有视频形式。
技术专业人员、软件开发人员、网页设计师以及商业和创新型人才将Safari 图书在线作为他们研究、处理问题、学习和认证培训的首选。
Safari图书在线为各种组织、政府机构和个人提供一系列的产品组合和计价程序。订阅者可以在完全可搜索的数据库中访问成千上万的书籍、培训视频以及出版前的手稿。这些数据库来自诸如O’Reilly Media、Prentice Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit Press、Focal Press、Cisco Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、Jones Bartlett、Course Technology等的很多其他来源。如想了解更多关于Safari图书在线的内容,请在线访问。
第1章 从头说起:什么是噪音数据
第2章 是我的问题还是数据的问题
2.2 校验
2.3 可视化
2.4 小结
第3章 数据是给人看的不是给机器看的
第4章 纯文本中潜在的噪音数据
第5章 重组Web数据
第6章 检测撒谎者以及相互矛盾网上评论的困惑
第7章 请噪音数据站出来
第8章 血、汗和尿
第9章 当数据与现实不匹配
第10章 偏差和误差的来源
第11章 不要把完美和正确对立起来:噪音数据真是噪音吗
第12章 数据库攻击:什么时候使用文件
第13章 卧库表,隐网络
第14章 云计算神话
第15章 数据科学的阴暗面
第16章 如何雇佣机器学习专家
第17章 数据的可追踪性
第18章 社交媒体:是可抹去的印记吗
第19章 揭秘数据质量分析:了解什么时候数据足够优质
python数据分析-开篇什么是数据分析 在《增长黑客》提到的增长团队中重要成员是数据分析师;数据分析师从数据角度抽丝剥茧,不断验证,A/B测试,找到问题,提出增长建议。数据分析师就像侦探一样,找线索,求真相, 是艰难但富有挑战的工作。
探索性数据分析是一种态度,一种灵活的状态,一种寻找那些我们认为不存在和存在的东西的心愿。
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
相关文章
- 记一次CDH6.3.2集群日志数据清理指南
- Google Earth Engine(GEE) ——河流中管理不善的塑料垃圾数据集
- Google Earth Engine(GEE) ——从河流到海洋的塑料输入量数据集
- chloris.earth ——Chloris 全球生物量 2003 - 2019 数据平台
- 干货 :数据分析师的择业指南
- 基本线程同步(六)使用读/写锁同步数据访问
- 《Python数据科学实践指南》一2.3 获取键盘输入
- 将postgresql中的数据实时同步到kafka中(转载)
- c语言提取浮点型数据的整数部分与小数部分几种方法
- 【经验分享】数据科学与机器学习面试指南
- 《Python数据科学指南》——1.9 生成一个迭代器和生成器
- 《Python数据科学指南》——1.14 返回一个函数
- 《Python数据科学指南》——导读
- 《数据整理实践指南》一第1章 从头说起:什么是噪音数据
- 《数据整理实践指南》一2.3 可视化
- 《大数据存储:MongoDB实战指南》一1.8 几个重要的进程介绍
- 《写给程序员的数据挖掘实践指南》——5.7一个新数据集及挑战
- 《Core Data应用开发实践指南》一3.5 通过迁移管理器来迁移数据
- 《Python数据科学实践指南》——1.3 第一段Python程序
- STM32L476应用开发之二:模拟量数据采集
- 大数据驱动的管理与决策研究重大研究计划项目指南
- 阿里数加大数据平台发布,将培养5万大数据科学家
- PyTorch初学者指南:数据预处理
- 运用大数据的意义要用大数据意识应对新业态
- qq行情数据。sina行情JOSN,建议用qq,涨跌,财务数据有-市盈