zl程序教程

您现在的位置是:首页 >  后端

当前栏目

大数据的体系架构

架构数据 体系
2023-09-27 14:24:57 时间

ZDNet至顶网软件频道消息:有些数据架构师早已开始应对物联网 (IoT)与智能设备私人网络合作产生的巨量数据。 集成专家 Brian Anderson 是软件和过程开发公司 Notionovus 的总经理。 他在职业生涯早期担任 Caterpillar 公司的嵌入式系统编程员。在当时,他主要负责为车间的机器人车辆网络构建应用系统。

在 Caterpillar 公司任职的 25 年里,Anderson 还担任过工程部主管、制造工程师和 6 西格玛黑带。 换句话说,在 IoT 还未普及以前,他便已开始处理数据问题。

Potential at Work 就有关架构师如何准备现有环境,才能进行 IoT 固有的海量扩充和大量集成的问题,对 Anderson 进行了咨询。

对于那些正在试图为 IoT 数据集成奠定结构化方法基础的架构师,您有何建议? 
Anderson: 集成专业人员需着眼于四项关键过程指标 (KPI):速度、可靠性、成本和安全性。 在人们谈及良好或糟糕的集成体验时,上述四项面向客户的指标总会重复出现。 但在讨论 IoT 时,其关键的指标主要集中在安全性上。 设备归属于所有者,而所有者必定会有隐私方面的担忧。

IoT 竞争舞台的胜出者将会是那些可以提供最佳用户友好数据控件,而且能够严密锁定访问者查看内容的企业。 而失败者将会是那些暗中使用其设备所生成的数据窥探用户隐私的企业。 此外,还要寻求可以重复使用和利用现有代码库的工具。 这将减少对高度专业化人员的需求。

架构师的工作要更多地涉及全局思考以及对未来集成需求的预期,以便能够将灵活性置入其规划模型当中。 例如,如果数据架构师和数据集成专业人员忙于处理特定界面上的某个问题,则表明您是在浪费金钱,而不是在规划未来。

您如何将精益方法应用于非结构化的 IoT? 
Anderson: 坚持使用有助于构建透明集成的工具。 以端对端可见的方式深入了解信息的价值链对于测量 KPI 至关重要。 如果致力于持续改进,便不能使用黑箱系统。 避免开发多余的应用系统以及重新创造已建立的连接点。

补丁、更新和错误修复程序为非客户选项,而且带有附加价值,所以要专注于最大程度地降低发行代码的复杂性。 由于坏数据造成的成本非常高昂,因此在软件中置入数据验证可以提高价值。 在系统及其用户生成无错误数据时,验证是唯一的非增值选项。

数据架构师如何才能使企业数据管理策略适应 IoT? 
Anderson: 企业数据管理策略需要重新访问未来和现有数据流的存档、安全性和用例。 IoT 上所有增加的数据流都将对当前的操作产生巨大的影响。 您需要在适当的位置采用存档和数据保留策略,以最大化地利用海量增加的数据流,同时最大程度地减少数据管理系统占用空间。

原文发布时间为:2014年10月20日 本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
23、一文读懂 Spring Boot、微服务架构和大数据治理三者之间的故事(十五) 微服务的诞生并非偶然,它是在互联网高速发展,技术日新月异的变化以及传统架构无法适应快速变化等多重因素的推动下诞生的产物。互联网时代的产品通常有两类特点:需求变化快和用户群体庞大,在这种情况下,如何从系统架构的角度出发,构建灵活、易扩展的系统,快速应对需求的变化呢?同时随着用户的增加,如何保证系统的可伸缩性、高可用性,成为系统架构面临的挑战。
X86 vs ARM 架构同台竞技: 生物大数据大规模并行计算(如何将WGS全基因组计算成本降到1美元) Sentieon DNAseq 实施的全基因组测序 (WGS) 二级分析流程与行业标准的 BWA-GATK 最佳实践流程结果相匹配,且运行速度提高了 5-20 倍。 Sentieon软件安装简单,开箱即用,并且提供了与ARM和x86指令集适配的版本。使30X WGS 数据样本在OCI 实例上的计算成本压缩到每个样本 1 美元以下,处理时间缩短到近一小时。
大数据繁荣生态圈组件之实时大数据Druid小传(二)Druid架构与原理 索引服务是数据摄入创建和销毁Segment的重要方式,Druid提供一组支持索引服务(Indexing Service)的组件,即Overlord和MiddleManager节点。
谈谈数据治理成熟度模型及大数据治理参考架构 数据是企业拥有的最大资产之一,但是数据也越来越难以管理和控制。干净、可信的数据能够为企业提供更好的服务,提高客户忠诚度,提高生产效率,提高决策能力。
阿里巴巴内部:2022年全技术栈PPT分享(架构篇+算法篇+大数据) 我只截图不说话,PPT大全,氛围研发篇、算法篇、大数据、Java后端架构!除了大家熟悉的交易、支付场景外,支撑起阿里双十一交易1682亿元的“超级工程”其实包括以下但不限于客服、搜索、推荐、广告、库存、物流、云计算等。 Java核心技术栈:覆盖了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、数据库、数据结构等大量知识点。 大数据:Spark、Hadoop
从传统的架构到云上大数据 在云计算走向成熟之前,我们更应该关注系统云计算架构的细节,从传统的架构到云上大数据,实现了很多的转变。
给 K8s 装上大数据调度引擎:伏羲架构升级 K8s 统一调度 飞天伏羲作为有着十多年历史的调度团队,在服务好 MaxCompute 大数据平台的过程中,一直在不断通过自我革新赶超业界先进水平,我们经历了 Fuxi 2.0 的这样的大规模升级,今天通过 K8s 统一调度项目又再次实现了系统架构的蜕变,将大数据平台强大的调度能力赋予 K8s 系统,同时去拥抱 K8s 周边丰富的生态。除了集团弹内集群,将来我们在公共云、专有云等多个场景,也会以 K8s 统一调度的方式进行输出,以更好地服务云上的用户,敬请期待!