您现在的位置是：首页 > 数据库

当前栏目

科普篇：什么是大数据

数据库数据库技术数据分布式分布式

2023-03-14 10:12:47 时间

对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

麦肯锡全球研究所给出的定义是：一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

从技术上看，大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理，必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

到底多少数据量才算大数据?到底是结构化的，还是非结构化的?到底是要精确的真实的?......

如果我们冷静的思考一下，就会发现，大数据与我们息息相关(大数据已经融入了我们衣食住行的每个角落)，但同时又会发现，大数据所涉及到的这些特殊技术，离我们又是那么的遥远。

我们还是来看看，大数据到底改变了什么?它其实就是通过海量的数据处理，让我们做决策时变的更轻松，更靠谱。比如我们在网上购物时，它首先会告诉你某个商品有多个人评价，评价越多，也就意味着越多人买;当你点击去之后，就可以看到好评度是95%，还是98%?如果是在360浏览器中打开的话，还有一个价格趋势，告诉你历史价位走势如何，其他电商平台是不是更便宜?除此之外，还有其他同类或同价位商品的推荐与排名等。有了这些信息，你就掌握了做一个购买决策时的几个关键信息：

1、这款商品好不好卖?

2、这款商品口碑好不好?

3、这个价格便不便宜，现在是不是最便宜的时候?

4、有没有其他更好的商品?——这个时候，是否将这个商品改进购物篮并付款，做这个决定变得非常轻松。

那它是怎么做到的呢?就是化繁为简，将海量的数据，归纳整理为几个简单的指标。

猜你喜欢

鲜为人知但很有用的 HTML 属性
在 Go 里用 CGO？这 7 个问题你要关注！
数据孤岛是业务效率的无声杀手
9款优秀的去中心化通讯软件 Matrix 的客户端
翻转再翻转！有意思的水平横向溢出滚动
发现 Linux SpaceFM 文件管理器的威力
图像处理工具Python扩展库，你了解吗？
求职数据分析，项目经验该怎么写
自定义计数器小技巧！CSS 实现长按点赞累加动画
在OKR中，我看到了数据驱动业务的未来
2023展望：新的一年将给大数据分析领域带来什么？
过五关！React高频面试题指南
阿里云ADB基于Hudi构建Lakehouse的实践
火山引擎云原生大数据在金融行业的实践
OpenHarmony富设备移植指南（二）—从postmarketOS获取移植资源
《数据成熟度指数》报告：64%的企业领袖认为大多数员工“不懂数据”
OpenHarmony 小型系统兼容性测试指南
肯睿中国（Cloudera）：2023年企业数字战略三大趋势预测
适用于 Linux 的十大命令行游戏
软件开发中的十个认知偏差

zl程序教程

当前栏目

科普篇：什么是大数据

相关文章