数据可视化常用的后端技术
这篇文章大致讲讲需要用到的后端技术。其实如果只是小数据量,或者是一些小型的项目,研究型的项目,纯前端就可以搞定,利用JS读取数据,JS处理数据。
后端无非就是处理数据,提取用户想要的数据。笔者最常用的就是python了,相对于java,c, c++,python简直对初学者太友好,提供了丰富多彩的API接口,比如常见的降维聚类算法:PCA, t-SNE, MDS, k-means等。笔者曾经用c实现过PCA算法,应该有几百行代码吧,可是在python里,只需要三行代码。下文将为大家介绍下如何用python实现对Iris数据集使用PCA算法,以及展示效果。
因此,笔者强烈建议新手使用python练手,操作门槛低,前期可以将更多的关注点集中在前端数据可视化上。到了后期,有经验了就可以自由组合。笔者前期使用的是python,可是到了后期由于性能问题,python已经很难解决我项目所遇到的数据和算法复杂度。于是我将复杂度高的算法全部用C重写了一遍,并用python调用这个模块。这样之前项目的项目代码框架不变,不需要代码全部重写重构,只需在相应的地方调用相应的C模块即可。
python使用PCA算法实战
在讲之前,用户需要安装python包,这里强烈建议新手安装anaconda,anaconda集成了python以及在开发过程中一大堆第三方包,比如下文用到的sklearn包。
引入第三方库的PCA算法,sklearn是pythonz中常用的机器学习第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。
- from sklearn.decomposition import PCA
加载python中自带的Iris数据集,做机器学习的应该比较熟悉这个数据集。主要包含4个维度,三个类。
- from sklearn.datasets import load_iris
- irisData = load_iris()
对数据集使用PCA算法,将数据降到2维。
- pca = PCA(n_components=2)
- reducedData = pca.fit(irisData)
将结果在散点图中画出来。这里就不讲具体python的绘制逻辑了,没错,python就是这么强大,也提供了可视化图表的能力。但是更多还是以处理数据为目的,将数据传给前端,让前端绘制。感兴趣的可以去了解下:matplotlib,这个是python的可视化绘图库。
![数据可视化常用的后端技术](https://s2.51cto.com/oss/201912/18/d48950fcb80470524cfd8086d4a66cad.jpeg)
iris数据集降到二维
相关文章
- 图像处理工具Python扩展库,你了解吗?
- 十个常用的损失函数解释以及Python代码实现
- 30 个数据科学工作中必备的 Python 包
- 如何在 Windows 上安装 Python
- 几行 Python 代码就可以提取数百个时间序列特征
- 使用Python快速搭建接口自动化测试脚本实战总结
- 哪种编程语言最适合开发网页抓取工具?
- 不要在 Python 中使用循环,这些方法其实更棒!
- 震惊!用Python探索《红楼梦》的人物关系!
- 如何最简单、通俗地理解Python模块?
- 酷炫,Python实现交通数据可视化!
- 为什么急于寻找Python的替代者?
- 30 个数据工程必备的Python 包
- 去字节面试被面这题能答上来吗?谈谈你对时间轮的理解?
- 火山引擎在行为分析场景下的 ClickHouse JOIN 优化
- 用Python爬取了某宝1166家月饼数据进行可视化分析,终于找到最好吃的月饼~
- 在 Linux 上试试这个基于 Python 的文件管理器
- Python列表解析式到底该怎么用?
- 如何快速把你的 Python 代码变为 API
- 十个Python初学者常犯的错误