KDD业界 | 滴滴出行研究院副院长叶杰平:如何利用大数据进行智能调度和供需预测
雷锋网(公众号:雷锋网)按:叶杰平,男,美国明尼苏达大学博士,现任滴滴研究院副院长。美国密歇根大学的终身教授,密歇根大学大数据研究中心管理委员会成员。叶杰平是机器学习领域国际领军人物,主要从事机器学习、数据挖掘和大数据分析领域的研究,尤其在大规模稀疏模型学习中处于国际领先地位。
滴滴研究院副院长叶杰平在KDD演讲
8月17日北京消息,国际顶级数据挖掘会议KDD2016日前在美国旧金山开幕,包括Google、Facebook、微软、Amazon、阿里巴巴、腾讯、百度及滴滴出行等在内的科技公司参加了本次会议,滴滴研究院副院长叶杰平在该会议上发表了如何利用大数据进行智能调度和供需预测的演讲。
问题与挑战叶杰平:“滴滴最大资产是每天产生的大量出行大数据,我们每日处理超过70TB数据,90亿次路径规划请求,90亿次地图定位90亿次地图定位以及10亿次派单,这还是我们收购Uber中国之前的数据。对我们来说,如何利用总量如此庞大的交通出行数据是个重大挑战。”
挑战1:等待时间长——订单量巨大
叶杰平:“滴滴出行成立于2012年,目前提供出租车、专车、快车、顺风车等业务,我们去年完成了14.3亿次出行订单,差不多是美国2015年全部出租车订单的两倍。2016年3月,我们实现了新的里程碑,即日出行订单量超过1000万,相当于美国单日分享出行订单总量的5到6倍。”
挑战2:交通拥堵——车辆密度高
叶杰平:“交通拥堵是一个大问题,中国也不例外,全球车辆密度最高的十个城市,前8个来自中国,后面紧随东京和纽约。”
挑战3:打车难——供需不平衡
叶杰平:“人们可能很难在高峰时段打到车,这就是供需不平衡导致的。”
基于人工智能的解决之道叶杰平:“我们用机器学习模型从海量的出行数据中寻找规律。最核心是找到解决ETA问题最有效的机器学习模型以及特征挖掘,刚开始为ETA建模的时候我们花了很多时间去找特征,现在我们准备不断优化我们的模型,将预估的精度不断提高,更好的服务用户。”
滴滴出行是国内第一家把机器学习成功应用到ETA的公司,这是解决“订单高效匹配”和“司机运力调度”的关键技术。
智能派单
智能派单是滴滴运营的核心技术之一,叶杰平表示:“每一秒,我们都要匹配成千上万的乘客和司机。乘客和司机之间的距离或车程时间是衡量派单质量的主要指标。我们需要用到两项关键的地图技术,即路径规划划和ETA(预估任意起终点所需的行驶时间),来完成派单。”
如何实现智能派单
传统方法一般通过路况和每段路的平均速度计算出时间,然后加上可能的等待时间,得到整体所需时间,而滴滴则是利用机器学习来计算时间,大幅提升了用户体验。根据这一技术,目前滴滴出行平台上已经可以实时更新所剩余的距离以及到达终点的时间。
供需预测
对于供需不平衡的问题,叶杰平表示:“可能更好的解决方案是对供需情况进行预测,以便提前对司机进行智能调度,比如我们预测到某个区域将会有很大供需不平衡,我们将会派司机到这一区域,避免用户乘车需求无法满足。实现供需预测将带来三大好处,供需得到平衡、乘客用车体验提升,以及司机收入增加。”
智能调度
逻辑上是为每个司机建立画像, 包括其接单习惯,接单区域,把合适的订单最快匹配到司机手里去,保证司机和用户都找到自己喜欢、适合的服务。
如何实现智能调度
本次KDD会议上,叶杰平还透露公司正在研发一款名为“九霄”的可视化系统Duse-eye,“该系统可以呈现过去发生了什么以及正在发生什么,比如告诉我们哪里有交通拥堵以及当前的供需情况等。”
智能拼车方案
针对打车难的另一种解决办法是拼车,叶杰平表示可以通过机器学习来智能优化拼车方案,他提到:“拼车降低了人们的出行成本和汽车燃油成本,但关键问题是,需要将所有乘客多耗费的时间最小化。很明显,乘客之间的路线越相似,多出的时间就越少。此外,如何进行拼车定价也是个问题,关键是计算每单的预期利润,如果预期利润很高,我们将给予较高的折扣。这实际上也是个机器学习的问题。”
滴滴的雄心滴滴研究院是滴滴出行全新的创新性研究机构,也是滴滴出行的“大脑”。未来一切有助于提高移动出行效率的技术创新,都将在这里孵化出来。
目前,滴滴研究院的研究方向包括:机器学习、计算机视觉、人工智能、数据挖掘、最优化理论、分布式计算等。滴滴研究院与业务线紧密结合,每一项研究成果都能以最快的速度应用到相应的产品上,给千万用户带去便捷。
合并Uber中国,网约车合法,滴滴出行在解决市场竞争和营运问题后,正准备用技术突破继续领跑出行领域,滴滴研究院正是其积极布局人工智能的产物。在未来的DT时代,赶上人工智能浪潮的滴滴出行,一定大有可为。
雷锋网版权文章,未经授权禁止转载。详情见转载须知。
60676.html
aliyunamazongoogleiPhonePhone人工智能人物微软百度美国腾讯车金山阿里相关文章
- 零门槛玩转数据万象 -【智能工具箱】
- 2022年 AI 技术成熟度曲线:合成数据、因果AI、决策智能、复合型AI、生成式AI、基础模型
- 数据集网站_drone无人机模拟训练软件
- MATLAB图像倾斜校正算法实现:图像倾斜角检测及校正|附代码数据
- 凯哥 | 当精益思想遇上数据智能
- R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)|附代码数据
- 23个优秀的机器学习数据集,给智能更好的经验
- 得“数据智能”者得天下,特斯拉、毫末智行、小鹏抢跑2022辅助驾驶赛道下半场
- 《智能时代》大数据与智能革命重新定义未来
- AI自给自足!用合成数据做训练,效果比真实数据还好丨ICLR 2023
- WAIC 2021 | 知乎CTO李大海:基于AI的智能社区多模态数据融合研究与实践
- 数据越多,AI越智能?我们一直以来都想当然了
- Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型|附代码数据
- Kafka数据每5分钟同步到Hive详解大数据
- MySQL数据程序设计之路(mysql数据程序设计)
- 集中解决:Oracle批量删除数据(oracle批量删除数据)
- Oracle数据的智能转化(oraclebytes)
- 碳云智能CEO王俊:大数据基础上人人都将活到120岁 | 2017 IT领袖峰会
- 化从SQL Server可视化到数据驱动的智能决策(sqlserver可视)
- 级数据分析SQL Server下的千万级数据智能分析(sqlserver千万)
- SQLServer与前端交互:实现智能数据驱动应用(sqlserver与前端)
- Oracle全家桶解锁数据智能与无限可能(Oracle全家桶)
- 如何将BIT类型数据插入MySQL数据库(bit在mysql怎么写)
- Redis极大提升数据处理效率(数据类redis)
- Oracle数据排序智能让您快速蒙对(oracle为数据做排名)
- 大数据智能存储Redis篇(大数据如何存redis)
- 使用Redis实现远程数据字典功能(redis 远程数据字典)
- 死去的记忆Redis过期数据的困境(redis 过期的数据)
- 三大案例分享:如何用物联网数据来构建工业智能 | 雷锋网公开课
- android实现关闭或开启移动网络数据