您现在的位置是：首页 > IT要闻

当前栏目

Apache Spark机器学习3.8　小结

学习数据微软

2023-03-14 10:26:04 时间

3.8　小结

本章，我们一步一步实现了从数据到商业的整体视图，通过这个过程我们在Spark上处理了大量的数据，并且为IFS公司建立了一个生成销售团队成功的整体视图的模型。

具体来讲，首先我们在准备好Spark计算环境和载入预处理数据之后，为每个商业需求选择了模型。第二，我们准备并约减了特征。第三，估计模型系数。第四，评估了估计模型。接着，我们解释了分析结果。最后，部署了估计得到的模型。

这一处理过程与小数据集处理过程十分相似。然而，要处理大数据，我们需要并行计算，因此，我们使用了Spark。在前面描述的处理过程中，Spark使用简单、处理迅速。

学习完本章，读者全面了解了Spark在获得整体视图的过程中如何使我们的工作更容易和快捷。与此同时，读者应该熟悉了处理大量数据的RM4E建模和开发预测性模型的过程，尤其有能力生成自己的商业整体视图。

猜你喜欢

鲜为人知但很有用的 HTML 属性
在 Go 里用 CGO？这 7 个问题你要关注！
数据孤岛是业务效率的无声杀手
9款优秀的去中心化通讯软件 Matrix 的客户端
翻转再翻转！有意思的水平横向溢出滚动
发现 Linux SpaceFM 文件管理器的威力
图像处理工具Python扩展库，你了解吗？
求职数据分析，项目经验该怎么写
自定义计数器小技巧！CSS 实现长按点赞累加动画
在OKR中，我看到了数据驱动业务的未来
2023展望：新的一年将给大数据分析领域带来什么？
过五关！React高频面试题指南
阿里云ADB基于Hudi构建Lakehouse的实践
火山引擎云原生大数据在金融行业的实践
OpenHarmony富设备移植指南（二）—从postmarketOS获取移植资源
《数据成熟度指数》报告：64%的企业领袖认为大多数员工“不懂数据”
OpenHarmony 小型系统兼容性测试指南
肯睿中国（Cloudera）：2023年企业数字战略三大趋势预测
适用于 Linux 的十大命令行游戏
软件开发中的十个认知偏差

zl程序教程

当前栏目

Apache Spark机器学习3.8　小结

相关文章

当前栏目

Apache Spark机器学习3.8 小结

相关文章

Apache Spark机器学习3.8　小结