机器学习笔记 - 主成分分析中的数学
2023-09-14 09:01:35 时间
一、主成分分析
维度是数据科学中的一个关键属性,维度是数据集的所有特征。例如,如果您正在查看包含音乐片段的数据集,维度可能是流派、片段的长度、乐器的数量、歌手的存在等等。
您可以将所有这些维度想象为不同的列。当只有两个维度时,可以使用X和Y轴绘制它。如果添加颜色,您可以表示第三个维度。如果你有几十个或几百个维度,它也是类似的,只是更难具象化它。
当你有这么多维度时,其中一些是相关的。例如,我们可以想当然地认为一段音乐的流派将与该作品中出现的乐器相关。降低维度的一种方法是只保留其中的一些维度。但很有可能丢失了代表性强的信息。所以需要一种方法可以减少这些维度,同时保持数据集中存在重要信息。
主成分分析(PCA) 的目的是减少数据集的维数。PCA为我们提供了一组新的维度,即主成分(PC)。它们是有序的:第一个主成分是与最大方差相关的维度。此外,主成分是正交的。请记住,正交向量意味着它们的点积等于0。这意味着每个主成分都与前一个主成分不相关。您可以选择只保留前几个主成分,因为每个主成分都是数据特征的线性组合。例如,一个主成分可以是乐曲长度和演奏乐器数量的线性组合。
单位向量是正交向量的一个例子。
相关文章
- IOS程序中打开自己的程序,测试机器中是否装了自己的程序(openURL:,canOpenURL:)
- 机器学习笔记汇总1
- 机器学习入门 - Google机器学习速成课程 - 笔记汇总
- 机器学习笔记:k近邻算法介绍及基于scikit-learn的实验
- 机器学习笔记 - 使用TensorFlow2.0 + ResNet进行疟疾预测
- 机器学习笔记 - MediaPipe了解 + 结合OpenCV进行人体姿势估计
- 机器学习笔记 - Siamese Neural Network 孪生神经网络
- 机器学习笔记 - Albumentations库实现的图像增强功能一览
- 机器学习笔记 - 机器学习系统设计流程概述
- 机器学习笔记 - Transformer/Attention论文解读
- 机器学习笔记 - 支持向量机(SVM)背后的数学二
- 机器学习笔记 - YOLO家族简介
- 机器学习笔记 - Kaggle表格游乐场 Feb 2022 学习二
- 机器学习笔记 - Kaggle表格游乐场 Jan 2022 学习二
- 机器学习笔记 - 基于OpenCV图像处理和手写数字识别进行数独求解
- DayDayUp:《机器崛起前传》第二十二章【蹒跚而来】读后感(文章源自网络)—听课笔记
- 机器学习第一周笔记
- Andrew NG机器学习课程笔记系列之——机器学习之逻辑回归(Logistic Regression)
- 机器学习笔记-LightGBM