大数据科学认识与理解论坛全攻略
说到贵阳,你会想到什么?这里有文峰塔、阳明书院,然而毫无疑问,这两天这座城市拥有了一个别样的关键词:大数据。街道两旁的宣传广告随处可见。2016年5月25日,第一届大数据科学与工程国际会议——大数据科学认识与理解在贵阳召开。据说此前贵阳已阴雨连绵数日,而雨停,也许就是一种美好的昭示。
上午8:30,大会准时开始,清华大学教授,原中国计算机学会理事长郑纬民先生担任本次大会主持人。出席大会的嘉宾有:中国工信出版集团董事长,人民邮电出版社社长季仲华;
中国计算机学会大数据专家委员会秘书长,中国科学院计算机技术研究所研究员、所长助理、副总工程师程学旗;中国工程院院士邬贺铨;美国伊利诺伊大学芝加哥分校特聘主任教授,清华大学数据科学研究院院长,ACM/IEEE Fellow俞士纶;美国特拉华大学电子与集散机工程学院终身教授,ETI公司的创始人与首席科学家,ACM/EEE Fellow高光荣;英国帝国理工学院数据科学研究所终生教授/所长郭毅可;香港中文大学常务副校长,伟伦计算器科学与工程学讲座教授,ACM/EEE Fellow华云生;中国科学院院士,上海交通大学副校长,IEEE,Fellow梅宏。
贵阳市政协副主席孙袁为大会作为开场嘉宾发表致辞。她在现场表示:“此次数博会来自全国嘉宾和国际嘉宾预计达到2万人次,作为2016年的重磅学术活动,贵阳非常重视,我们要发展大数据,就应该对于大数据理念、内涵,关键数据以及人才培养的研究。我们希望本次会议在国家行业专家学者及全体人员的共同努力下,有效推动贵阳、贵州、中国乃至全球的大数据发展,为使我国走在大数据前端而共同努力奋斗。”
共八位专家在本场大会上分享了自己的观点,快和小编去现场看看,和大数据来一场“零距离”的接触吧!
邬贺铨:大数据总量巨大
大数据从结构上来看可以分成结构化、半结构化、非结构化。大数据是多来源的。大数据之大,这是全世界网民平均每个月上网的流量,2013年全球互联网流量每年为2.7EB,全年达到1ZB。2015年和2016年全世界新产生的数据量等于人类有历史以来一直累计到2014年全球数据重量的总和,量非常大。
高光荣:大数据系统软件前沿的几个开放问题
高性能并非计算的“又一春”,接着是高性能计算/大数据面临的挑战,既有挑战也有机遇。接着是大数据系统和软件,搞的开放问题。往往是你脑子里有一个思路,要怎么做。绝对不能忽悠,忽悠解决不了问题。二十五年以前认为计算机不用再发展了,已经很前沿了,但是现在这个观点已经不适用了。你想解决的问题,人工智能没有达到效果。二十五年以后情况不一样。山穷水尽无疑路,柳暗花明又一村,为什么这个事又活了?并非结构活了,并非数据活了,人工智能进入第二春。没有经过头一次死的人,现在看到的是第二次的出现。
俞士纶:对异构数据源的思考
把不同数据库联在一起,这些数据来自不同的领域,合并在一起的话,使我们能做更好的预测。现在是大数据时代,一个重要的事情是我们要怎么融合不同的数据?数据是很值钱的事情,其实IBM做气象预测,有不同的应用可以预测天气,根本赚不了什么钱。像运输路线怎么走的话,一定要知道天气,如果不知道天气的话,他可能开到一半,被大风吹走了,也可能会淹水。如果做奇货买卖的话一定要知道天气,比如这个地方有干旱、洪涝等等。像做农业的话也需要知道天气,天气这个数据可以应用在不同方面,知道这个数据可以改变很多细节。要了解到什么数据是很有意义的数据。
张晓东:大数据分析将对人类社会本身的了解达到前所未有的高度
算机是为网络研制的,互联网和无线上网是一个数据世界的基础。从1986年281PB,到2013年667EP,增加了2.9倍。这支持了我们的数据结构。计算机是一个数据中心,这个数据中心主要来源,这些数据,进去出来的数据相当多。所以从这个角度来讲,当数据量这么大,对我们数据处理有很多新的挑战。
郭毅可:数据科学与科学数据
我们知道科学研究有三个主要要素,理论、计算、实验。这三个理论是这样的,从理论出发,我们可以建立模型。对这个模型的模拟可以产生数据。我们理论至上,对事件进行假设,并进行观察,得到数据。我认为数据科学是当代科学的重要基础和方法论。实际上数据科学在当代的用处极其广泛,而且推动了许多技术的研究和发展。我们就是基于这个基础上做努力。
华云生:大数据研究的战略思考
数据特性的多样性,不同的应用有不同的特性,有些数据可能有规律的,有一些是没有规律的。他们的概念,表示方法也不一样,也有多样性。数据的目标也有多样性。数据的原因。不同的数据、不同的应用有不同的目标。算法的多样性,有不同的算法。基建的多样性,所以数据也有不同的地方。理论基础多样性。不像以前做做法有很好的规律、很好的算法。大数据其实是个现象。?现在从做大数据来讲,很多没有办法从一个应用上面找出一个规律,找出一个方法,很容易应用到其他应用上。
方滨兴:云监控与云加密——打造可信的云
云安全的四个层面,第一个是可靠的云,能够始终可靠地提供服务。安全云,保障用户及租户在云中不会因攻击而受到损害。可信云,保障云服务商不会对租户的运行进行侵害。客户把资料传到云上?怎么保障信息的安全?这是一个很大的问题。云加密,降低泄密风险。上网前把个人信息提交给网络才能上网,这叫上网实名制。不作为怎么办?我们能怎么办?无缝数据加密传输、支持任意云端平台。云监控,你不作为,不能乱作为,所以我要监督你,发现你是不是做了不该做的事情。
梅宏:对大数据热潮的若干反思
我们看到了很多数据应用的成功案例,在商业智能、在智能交通、在自然语言处理、在自动问答系统、下棋机器人等等。我想机器替代人做劳动、做体育、做计算到现在帮助人下棋,毫无疑问,还会继续往下走。在这个意义下,我们对大数据高度重视。大数据的应用仍处于初级发展阶段。现在的很多案例都很难被看作典型的大数据应用案例,很多都属于初级阶段。真正的大数据应用应该体现在数据挖掘的深度和多源(跨界)数据的融合的广度,绝不是数据的“海量”,这才是所谓的大数据。
本文转自d1net(转载)
相关文章
- PHP读取日志里数据方法理解
- Sql Server之旅——第六站 使用winHex利器加深理解数据页
- 大数据工具篇之Hive与MySQL整合完整教程
- 理解数据成员指针、函数成员指针
- 什么是大数据,怎么理解和应对大数据时代
- docker19.03使用数据卷
- 谈谈如何理解“大数据”
- 初始化数据库和导入数据
- 【STM32F407】第10章 ThreadX NetXDUO UDP用户数据报协议基础知识
- 深入理解空间搜索算法 ——数百万数据中的瞬时搜索
- 深入理解空间搜索算法 ——数百万数据中的瞬时搜索
- Atitit 存储引擎核心技术 总结目录1. 表的存储有三个文件:结构+数据+索引 12. 页式管理
- Mysql 查询今天,这周,这个月,今年的数据
- 低代码踩坑记解决无法提交数据的问题
- ML:MLOps系列讲解之《CRISP-ML (Q)ML生命周期过程—了解机器学习开发的标准过程模型—业务和数据理解→数据工程(数据准备)→ML模型工程→评估ML模型→模型部署→模型监控和维护》解读
- mysql常用基础操作语法(三)~~对数据的增删改操作【命令行模式】
- ML之回归预测:以某个数据集为例从0到1深入理解科学预测之回归(实数值评分预测)问题的思路框架
- ML之DR之PCA:利用PCA对手写数字图片识别数据集进行降维处理(理解PCA)
- SVM 用于将数据分类为两分类或多分类(Matlab代码实现)
- 【NLP】第9章 匹配分词器和数据集
- 9.3.1 map端连接- DistributedCache分布式缓存小数据集
- 快速访问WCF服务--ServiceModel 元数据实用工具 (Svcutil.exe)
- PostgreSQL的学习心得和知识总结(九十八)|深入理解PostgreSQL数据库开源MPP扩展Citus 时序数据(Timeseries Data) 的使用场景
- 深入理解angularjs $watch ,$apply 和 $digest --- 理解数据绑定过程
- Docker数据卷—Volumes
- 网络安全——数据链路层安全协议
- 数据链路层 点对点信道 PPP协议HDLC协议 特点 数据链路层协议的基本问题 循环冗余检验原理 HDLC的帧格式 PPP与HDLC比较 数据链路 帧 图解 新手入门 保姆式解析 表情包理解
- JAVA开发讲义(二)-Java程序设计之数据之谜四