拥抱开源!解析IBM Power8与Hadoop的不解之缘
大数据分析不仅改变了企业开展业务的地点和方式,而且还在改变业务决策流程的速度与范围。企业希望通过投资大数据分析技术来增强客户体验、提高客户忠诚度、开创全新的创收机会。他们需要部署经济高效的、高性能的、可靠敏捷的IT基础架构,以便利用特殊的数据资产来产生最佳业务成效。
与x86架构相比,客户能够通过数量更少但却更加可靠的Power8服务器来降低总体拥有成本(TCO)。更重要的是,这些客户还将能够受益于不断发展壮大的IBM合作伙伴开源生态圈(OpenPOWER基金会)及一致性附加处理器接口(CAPI)等颠覆性创新技术所交付的卓越价值。
IBM以开放的态度拥抱开源
IBM一直将开源合作视为创新驱动力,倡导、参与和支持Linux和开源软件,并将开源技术融入满足企业客户需求的各种方案中。IBM是大数据市场中规模最大的供应商。近10年来,他们投资超过150亿美元来开发全套的大数据解决方案。Power对开源的支持,也使今天的开发者更容易利用开源技术开发大数据分析应用。
IBM还在Power Systems服务器上提供最新版本的Ubuntu服务器、Ubuntu OpenStack和Canonical公司的JujuCloud Orchestration工具。基于Power 的Ubuntu为现有的Linux应用向Power移植提供简便的通道,用以轻松实现云部署,建成新的大数据和移动软件应用,并帮助提升现有云端应用的性能。基于Power 的Ubuntu对已经全线支持红帽和SUSE Linux操作系统的Power Systems产品线提供了良好的补充。
此外,IBM通过OpenPOWER基金会使POWER8用于开放式的开发。OpenPOWER基金会是一个多家业内公司围绕着POWER8平台成立的联合组织,致力于加快数据中心的创新及基于POWER8架构的系统设计变革。OpenPOWER基金会中不仅包括家喻户晓的科技巨头(如Google、Samsung、NVIDIA、Micron及Mellanox),还包括浪潮、中兴等国内企业。OpenPOWER基金会提供Power软硬件用于开放型开发,以及Power知识产权许可。Power8的开放将为大数据分析、移动、社交催生更好的基础架构平台。
Power8让Hadoop应用性能提升3.65倍
Hadoop是一个能够对大数据进行分布式存储和处理的软件框架,它具有高可靠性、高扩展、容错、高效、低成本的特点,一度广受互联网公司青睐,企业级用户也越来越多的接受Hadoop。但凡事都有两面性,佘晖表示,星环科技在做Hadoop应用和技术的时候,发现Hadoop是非常耗费计算资源的,用户希望获得更优秀的性能。
通过测试发现,IBM Power8产品非常适合Hadoop应用。据星环科技提供资料显示,在与IBM合作针对Hadoop的性能优化和调优后,IBM做了很多改进,与x86处理器相比,POWER8实现了3.65倍的运行速度提升。除了性能外,POWER在中国很多的行业、在企业级市场有着深厚的积淀和客户群,产品也非常适合这些客户,这也是星环科技选择POWER的原因。
大数据助力空气质量预测
拥有强大集群能力的POWER服务器在应用方面有何过人之处呢?帮助北京预测空气质量就是其中之一。IBM在去年就与北京市政府签署协议,利用先进的天气预报和云计算技术,协助中国防治大气污染。
据了解,北京市政府是IBM“绿色地平线”计划(Green Horizon)的合作伙伴之一。IBM与北京市相关单位合作并共同研发,利用IBM认知计算、大数据分析以及物联网技术的优势,分析空气监测站和气象卫星传送的实时数据流,凭借自学习能力和超级计算处理能力,提供未来72小时的高精度空气质量预报,实现对北京地区的污染物来源和分布状况的实时监测。
绿色地平线项目IBM实验室会跟环保局、监测站,收取很多的检验数据,通过软件做预计分析。比如原来可以预测3天,现在可能提前到10天。
据IBM大中华区硬件系统部PowerSystems产品总监李红介绍,IBM实验室有一套资产算法,去分析大气污染,提供算法服务和支撑。因为是计算密集型的,需要大量计算,所以用到了刚刚发布的S812LC平台。包括其他产品在内,构成了整个云平台环境,去完成对大数据的分析,对污染环境的预测等等。这个项目目前还在进行中,政府也希望这个项目未来可以推广扩展到其他的城市。
总的来看,IBM Power8依然是高性能、高可靠性的代表,它比较适合计算比较密集的场景,更适合于做数据仓库、做批处理、数据挖掘、模型建模等方面应用。因此,它与Hadoop也就有着不解之缘,未来的各种行业应用还在拓展之中,让我们拭目以待!
本文转自d1net(转载)
Hadoop社区支持阿里云OSS 云计算与开源融合的新里程碑 Hadoop社区作为大数据领域的开源软件,一直以来都受到了各个厂商的高度重视,对OSS的支持将更大程度的促进开源软件和云计算的互通与融合。
相关文章
- [Hadoop]Hive r0.9.0中文文档(二)之联表查询Join
- [Hadoop]转载-Pig的简单介绍
- Facebook公开其Hadoop与Avatarnode代码——有效解决Namenode顽疾
- hadoop集群配置SSH免登陆
- Hadoop社区支持阿里云OSS 云计算与开源融合的新里程碑
- Hadoop简介
- hadoop web 端口
- Hadoop 搭建分布式环境 hadoop-3.0.0.tar.gz
- hadoop多文件输出
- hadoop权威指南 chapter1 Meet Hadoop
- Hadoop之—— CentOS Warning: $HADOOP_HOME is deprecated解
- hadoop版本号变迁
- 大数据Hadoop之——EFAK安全认证实现(kafka+zookeeper)
- 使用Hadoop执行jar命令出现ClassNotFound错误
- Hadoop之hadoop fs命令
- 初识Hadoop,轻松应对海量数据存储与分析所带来的挑战