为什么我们需要多重回归?
考虑一种情况,其中许多不同的因素(称为预测变量或自变量)相互作用以确定结果(称为标准或因变量)。根据因素的不同,可能会取得不同的结果。例如,房屋销售价格(标准)可能由许多因素(预测因素)决定,如房屋位置、建造年份、当地住房市场状况、房屋状况等。
多重回归用于建立一个模型,使我们能够研究这种相互作用。基于多重回归的模型将使用数据构建一个基于自变量预测结果的函数。例如,该模型是使用列出各种情况下结果的一组真实数据建立的。然后,该模型可用于预测给定一组自变量的结果,或找出现有数据与模型的拟合程度以及是否存在任何异常值。
为什么我们需要多重回归?
多重回归可用于多种领域。例如,人力资源专业人员可以根据员工的经验、工作领域、能力等各种因素收集员工的薪酬数据。然后,他们可以根据这些数据构建一个模型,并在自己的公司中使用该模型来设定薪酬,以检查自己的员工是否适合该模型。某些员工或团体的薪酬是否高于正常水平?比正常情况少?
类似地,不同的研究人员可能使用多重回归来找出特定结果的最佳预测因素。例如,需要哪些自变量来最适合所看到的结果。一所学校的考试成绩如何,是什么因素造成的?影响供应链生产率的因素有哪些?
假设和限制
多重回归仅在特定条件下才有效。该技术的基础是以下假设,这些假设必须正确才能使模型正常工作。
1.如果方程是线性的,变量之间的关系必须是线性的。非线性关系需要其他形式的回归。
2.偏离线路的分布必须为“正态”分布。
3.一个好的模型预测是一种关系,而不是原因。一个好模型的存在并不意味着自变量导致结果,只是因为它们的存在表明结果可能是由于相关性造成的。
4.变量的“独立性”。假设预测变量是独立的。如果它们相互依赖性很强,模型就不会很好。
天行健六西格玛顾问表示:在其局限性范围内,多重回归是一种适用于大量实际情况的良好技术,并被广泛用于构建简单易用的模型。这些可用于分析商业、医学、工程等广泛领域的数据。
相关文章
- 为什么ConcurrentHashMap不允许插入null值?
- 什么是数据安全,为什么需要数据安全,怎么才能实现数据安全?
- 日拱一卒,《机器学习实战》,为什么需要机器学习?
- 大企业为什么都在用钉钉?
- 为什么编程里习惯使用 i、j、k 等作为循环变量?
- 为什么 Vuex 的 mutation 和 Redux 的 reducer 中不能做异步操作?
- [答疑]EA的研发团队成员为什么不是EA的涉众
- 雅迪、哈啰为什么都在做高端两轮电车
- 引领数据领域AI工程化落地,为什么会是云测数据?
- 同是药品原料,“金银花”为什么会输给“云南白药”
- 为什么C代码比Python代码运行得更快?
- 徐大大seo:外贸网站为什么需要写博客
- 造成惨重伤亡的新西兰火山爆发,为什么完全无法准确预测?
- 高盛为什么需要9000名技术人员?
- Linux注册表: 是什么?如何使用?为什么需要?(linux注册表)
- Redis数据库0初探:为什么你需要它?(redisdb0)
- 优秀的网盘,为什么你需要Linux客户端?(网盘linux客户端)
- 探究Linux系统的价值与必要性:为什么我们需要它?(为什么要linux系统)
- Redis集群提升数据处理能力的不二之选(为什么需要redis集群)
- 数据库探究Redis之字符型数据库的原因(为什么Redis是字符型)
- Oracle慢一次又一次的问题(oracle为什么慢)
- Oracle在U01上发挥其独特优势的原因(oracle为什么u01)