zl程序教程

您现在的位置是:首页 >  数据库

当前栏目

经济前景不明下 2022 数据库预期与分析

2023-02-18 16:23:53 时间

开门见山,2022 这一年站在今天看,对每一个人都是很 “难” 的,2022年的起始的一些观点,放到现在是否正确,通过一些已经发布的文字我们回顾一下。

这一篇是 dataversity 的 database management trends in 2022 ,发布的日期是 2022 ,2 ,1

https://www.dataversity.net/database-management-trends-in-2022/#

这篇文字的侧重点是基于云上的数据库管理方面的讨论和观点, 这里提出几个关于当前经济情况下,对数据库产品的推动和应用的转变,基于 新 冠 的影响,全世界范围的网上销售的份额,相对于之前有了很大的增长,同时基于当前世界经济的不明朗,更多的企业更愿意将数据迁移到云上。

其中对数据库在2022年的倾向性进行了一个总结,主要还是以上几个点

1 基于云数据库的管理系统

2 基于自动化自治的数据库管理系统

3 对数据智能辨别的需求

4 数据安全方面的需求

5 如何摆脱磁盘系统,让内存式的数据库成为主流

6 图数据库,基于关系方式的研究

7 开源数据库的快速增长

8 数据库作为服务的方式推出

下面针对文字中的内容,进行解读

1 云数据库,在一篇关于 未来的数据库市场在云上的文章,预期未来云数据库是数据库市场的主流,数据库的管理系统在云上作为一个服务被提供,不在是一个以系统出现的方式显现,诚然现有的数据库系统还将被使用,但混合着云和传统数据库的方式可能将更加的主流。

云数据库在商业角度最大的优势是,云数据库作为一个服务出现,可以快速的满足多变的商业环境和需求以及数据安全等多方面的需求。

实际上这样说是有一定的道理的,我们可以想想如果你使用实体机来部署数据库,或者使用云来部署数据库,这两者在便利性和成本方面的差距将是巨大的,从扩展性,以及灵活性方面考虑,更多的商业机构都会选择云上的数据库作为基础,这样在商业环境出现问题的时候,更容易节省成本,降低损耗。使用一个数据库本身,和打开开关和关闭开关一样的简单。

2 数据库管理趋向于自助性服务

这部分文字主要在说明自动化或数据库自治会改变数据库的使用的方式,一个自主型的数据库系统会根据数据存储的不同类型,来对数据进行更有效的管理,在数据的处理上通过上载,处理,和过程化数据工具的方式来,降低由于人为的问题,导致的数据库异常或数据处理出错的问题等等。

这里的好处是,数据库不在需要管理,整体的工作向商业化数据的分析迁移。

这部分写的有一些空洞,数据库自动化服务和自治,并不是完全脱离人工的管理,目前应用系统在数据库上的设计在目前的整体的情况下,是无法脱离人工管理的,各种不规范的问题,以及各种个性化的需求,让数据库自治很难实现,同时自治化的工作,是否与商业环境的数据库运营有冲突等等都还需要磨合,数据库自治的设想很好,但现实环节目前对数据库自治这样的实现并不友好。

3 ADM Augmented data management

ADM 强调了数据库机器学习的能力和人工智能部分的,同时系统还应该具有智能发现数据质量问题的能力,这部分希望数据库能进行自主的任务学习,通过人工操作后,能自主学习操作的步骤,并且能优化相关的操作过程,其中包含元数据管理、主数据管理和数据库管理系统中的操作。

这一部分是一个工作的方向,但实现起来问题点比较多,各个企业数据库的使用方式不同,同时学习这样的工作方式本身的正确性也需要进行确认和规划,所以这是一个研究的方向,但目前仅仅处于早期的探讨和初期的工作层面,成为主流的功能,还需要时日。

4 数据库安全

文字开头提出在去年发生了几起备受瞩目的数据泄露事件。例如,LinkedIn在2021年6月遭到入侵,导致7亿用户的信息在网上被出售。今年9月,零售商内曼·马库斯(Neiman Marcus)遭到黑客攻击,480万名顾客受到影响。2021年10月,有消息称15亿脸书用户的信息在黑客论坛上出售。而这些只是2021年发生的数百起数据泄露事件中的几起。在华盛顿州,已知的入侵数量从去年的220起上升到2021年的280起。

安全性一直是数据库管理员需要考虑的问题,但最近的入侵事件使其成为主要问题。因此,增加数据库安全性已成为一个趋势问题。

数据库的安全方面本身问题,并不是简单的数据库的问题,安全本身是一个复杂的问题大多数的数据库安全问题,是基于基础系统或应用系统本身,属于数据库单独的安全问题比较少。

5 内存数据库

内存的数据库本身在应用中是比较受欢迎的,主要的优势是对比传统的数据库本身响应速度快,内存数据库越来越受欢迎,因为它们的响应速度比传统系统快。内存数据库(IMDB)消除了磁盘驱动器,取而代之的是将数据存储在计算机的主存储器(即随机存取存储器或RAM)中。

降低响应时间是可能的,因为不需要翻译和缓存。正在使用的数据保持与到达时相同的形式,并且保持与使用它的应用程序相同的形式。这些数据库通常用于依赖快速响应时间和提供实时数据管理的应用程序。运行和受益于内存数据库的行业包括银行、旅游、游戏和电信。

内存式数据库产品,大家可能会想到REDIS ,实际上除了REDIS 作为传统型内存数据库产品以外,内存类的数据库产品很多,并且部分产品已经克服了REDIS 本身的一些缺陷问题。如最近的风头正劲的 Aerospike, Aerospike使用混合内存架构:数据库索引完全存储在主随机访问内存中,而数据使用数据层存储在持久设备上。数据层将数据存储在固态硬盘、NVMe或Persistent memory中通过从主索引使用直接指针直接访问磁盘上的记录位置来读取数据,并且通过大块写来优化数据写,以减少延迟这种体系结构从持久设备中获取所有记录,并取消数据缓存的使用。

另外内存式的数据库产品本身,也会跟随这硬件架构的变化而变得更加强悍,如未来整体的内存系统替换大容量磁盘系统,此时整体的硬件支持整体的数据全部在内存中运行。

6 图数据库产品

图数据库产品提供了非常优秀的关系图的建立和关系的查找的简便的方法,通过视图中的点和边来描述一段数据的关系,图数据库的设计目的是为数据实体之间的关系分配同等重要的数据接收。这种设计的结果是,只有需要访问的数据,而不必要的数据保持不变,使数据检索更有效。

其中图数据库主要应用于,商业关系分析,以及反欺诈等项目中,通过图数据库本身来发现与商业关系中有关的人员,或者有欺诈嫌疑人有关系的其他人员等。

同时除了这些,相关的文章中还提到在图数据库中还有如下的一些应用场景,如 网络管理, 电信运营,商业风险评估,数据中心和资产管理,云平台管理等。

目前整体的图数据库,暂无国产数据库产品,并且图数据库产品中,基本上是在 NEO4J 的把控下,另外云产品 cosmos db 也比较流行。

7 开源数据库

开源数据库在10年前并不像现在这样流行,而现在将近有7%的市场,(注意市场一词,没有付费的开源产品并不在市场一词范围内),开源技术发展迅速,这里包含数据库产品,开源技术的数据库作为一种没有应用障碍的产品,被广泛应用于云端的应用开发中。根据Gartner 预测在2022年,将近有超过70%的新的应用会建立在开源数据库产品上或者基于开源数据库基础平台上的服务等,开源数据库本身是一种成功的解决问题的方法,并且用于商业软件的分发和推广,并且开源数据库软件将继续增长。

开源数据库本身在使用中,尤其在一些非核心或已经具备管理开源数据库软件的商业体中,使用的是比较广泛的,同时在每个数据库解决问题的方向,都有对应的开源数据库产品,并且开源数据库与商业数据库本身在核心能力上的差距并不大,所以开源数据库产品在一些非核心的业务场景,完全可以替换商业数据库产品。

8 数据库即服务的理念

这是一种新的数据库设计的理念,过去的数据库设计中数据库并没有以引入微服务的设计理念,而是通过一个整体的设计方式来完成数据库的设计的。整体的数据库开发是一个整体的操作方式,这样的开发方式造成软件是单元化开发,整体的程序通常缺乏模块化的思维,应用程序等同于一个代码库加一个数据库的模式。

而后微服务的兴起,导向了数据库即服务的理念,在软件开发的过程中,微服务本身内部就有相关的数据库,每个微服务都有自己的数据需要存储,而幸运的是,更多无架构的数据库产品如MONGODB ,AWS DyNamoDB等产品让以微服务为理念的软件开发方式有了更合适的数据库产品使用。

基于微服务的开发理念和架构的软件产品针对数据库本身的要求也在变化,原来大而全的数据库产品,在一些软件开发以微服务为中心的开发模式中,显得笨重,微服务本身进行了应用和业务结构的解耦,而如果将数据库还放到类似与ORACLE 这样的数据库产品中,显然是不合理的,微服务为核心的应用建构产品,更多希望的是小而美的数据库产品,通过这样的产品本身提高微服务的灵活性,以及当微服务所在的数据库出现问题后,不会影响其他微服务的额运行,这就导致如果将原有的软件结构拆分为微服务架构,会导致数据库数量的暴增,所以原有的设计的结构的数据库,不适应与这样开发方式后的一些需求。

最后文中,提到虽然当前的数据库市场看起来增量很大,但实际上有一部分增量是从实体数据库到云数据库的迁移导致的增长,而这样的增长方式对于数据库的未来的发展和使用的方式都提出了新的要求,如远程管理工具,以及更贴合云方面的管理数据库的工具。

实际上传统数据库本身已经市场饱和的问题是确实存在的,现有的市场增量是一个此消彼长的状态,也属于新陈代新,大量的数据库需求来自,如替换ORACLE ,这并不是新的业务需求,而只是替换原有系统使用数据库的需求,在这样的需求下,目前众多的数据库产品对于用户本身在挑选中也产生了困扰,而选择更合适,或更有生命力的产品,则是一个用户需要有的能力,选错数据库产品对于任何一个项目都是一场灾难。