zl程序教程

您现在的位置是:首页 >  其他

当前栏目

阿里云MaxCompute(大数据)公开数据集---带你玩转人工智能

阿里数据人工智能 --- 玩转 公开 MaxCompute
2023-09-11 14:16:11 时间
公开数据集合对所有MaxCompute 用户开放 这是通过MaxCompute 特殊的授权机制实现的。在使用过程中 用户需要足以一下几点 1. 所有数据均存储在一个名为public_data 的项目空间中 但所有用户并未被加入到该空间下(非项目空间成员)。因此 用户需要跨项目空间访问数据 在数据工场中编辑SQL 时 必须在表明前指定项目名称 例如
Select * from public_data.ods_enterprise_share_basic where ds 20170114 

2. 由于是跨项目空间访问 所有用户在数据工场的[数据管理]中无法查找到公开数据集的表 3. 只有在执行”Add User”语句后 用户才有权限访问公开数据集。该语句可以再数据工场以及MaxCompte 提供的客户端中执行 下面我们将详细介绍目前开放的数据集合。

ods_enterprise_share_basic 股票基本信息
ods_enterprise_share_quarter_cashflow 季度报表说明
ods_enterprise_share_quarter_growth 季度业务增长情况
ods_enterprise_share_quarter_operation 季度财务周转
ods_enterprise_share_quarter_profit 季度利润
ods_enterprise_share_quarter_report 季度报表
ods_enterprise_share_trade_h 股票价格
更新周期
提供固定分区的历史数据 不再做增量更新。
查询示例 select * from public_data. ods_enterprise_share_basic where ds 20170114 ods_enterprise_share_basic 股票基本信息

数据样例
ods_enterprise_share_quarter_cashflow 季度报表说明
数据样例

ods_enterprise_share_quarter_growth 季度业务增长情况

数据样例
ods_enterprise_share_quarter_operation 季度财务周转

数据样例
ods_enterprise_share_quarter_profit 季度利润

数据样例



ods_enterprise_share_quarter_report 季度报表


字段英文名

字段类型

描述

是否为分区列

rank

STRING

排序

code

STRING

代码

name

STRING

名称

eps

STRING

每股收益

eps_yoy

STRING

每股收益同比(%)

bvps

STRING

每股净资产

roe

STRING

净资产收益率(%)

epcf

STRING

每股现金流量(元)

net_profits

STRING

净利润(万元)

profits_yoy

STRING

净利润同比(%)

distrib

STRING

分配方案

report_date

STRING

发布日期

ds

STRING

年份

分区列

quarter

STRING

季度。数据季度更新。

分区列

数据样例



ods_enterprise_share_trade_h 股票价格


字段英文名

字段类型

描述

是否为分区列

trde_date

STRING

日期

open

STRING

开盘价

high

STRING

最高价

close

STRING

收盘价

low

STRING

最低价

volume

STRING

成交量

price_change

STRING

价格变动

p_change

STRING

涨跌幅

ma5

STRING

5 日均价

ma10

STRING

10 日均价

ma20

STRING

20 日均价

v_ma5

STRING

5 日均量

v_ma10

STRING

10 日均量

v_ma20

STRING

20 日均量

turnover

STRING

换手率

code

STRING

股票代码

ds

STRING

导入日期。

分区列

数据样例



二手房产数据集

总体信息 二手房相关信息 注意 目前暂停更新 。


项目
public_data
表集合

dwd_prouduct_house_basic_info_out
更新周期
每日早10 点前更新。至2016 年12 月13 日开始更新 全量更新。
查询示例 Select * from public_data.dwd_prouduct_house_basic_info_out where ds 20170113

dwd_prouduct_house_basic_info_out信息说明


字段英文名

字段口型

描述

是否是分区列

house_id

STRING

房产 ID

house_city

STRING

房产所在城市

house_total_price

STRING

房产总价

house_unit_price

STRING

房产均价

house_type

STRING

房产类型

house_floor

STRING

房产楼层

house_direction

STRING

房产方向

house_deckoration

STRING

房产装修

house_area

STRING

房产面积

house_community_name

STRING

房产所在小区

house_region

STRING

房产所在地区

proj_name

STRING

楼盘名称

proj_addr

STRING

项目地址

period

STRING

产权年限

property

STRING

物业公司

greening_rate

STRING

绿化率

property_costs

STRING

物业费用

ds

STRING

数据导入日期

分区列


数据样例

影视及票房数据集

总体信息 每日更新国内影视剧信息及票房数据信息 。

项目
public_data
表集合

dwd_product_movie_basic_info 电影基本信息

ods_product_movie_box 票房基本信息

更新周期
每日早10 点前更新。至2016 年12 月13 日开始更新 全量更新。
查询示例 Select * from public_data.dwd_product_movie_basic_info where ds 20170112 limit 10; dwd_ product_ movie_ basic_ info



ods_product_movie_box 票房基本信息

字段英文名

字段口型

描述

是否是分区列

rank

STRING

排名

avgprice

STRING

平均票价

avppeople

STRING

场均人次

boxoffice

STRING

单日票房 万

boxoffice_ up

STRING

环比变化 %

irank

STRING

排名

movieday

STRING

上映天数

moviename

STRING

影片名

sumboxoffice

STRING

累计票房 万

womindex

STRING

口碑指数

ds

STRING

日期

分区列

数据样例



TPC-DS数据集 1TB

总体信息 TPC-DS是一套决策支持系统测试基准 主要针对零售行业。提供99个SQL查询 SQL99或2003 分析数据量大 测试数据与实际商业数据高度相似 同时具有各种业务模型 分析报告型 数据挖掘型等等 。


《阿里云MaxCompute百问百答》电子版地址 为了更好地帮助广大MaxCompute用户解决可能遇到的问题,阿里云 MaxCompute团队基于MaxCompute开发者社区和其它渠道反馈的问题,总结归纳 出MaxCompute各个功能点的常见问题,希望可以给正在学习和使用MaxCompute 的用户提供一些帮助。
阿里云 MaxCompute 阿里云 MaxCompute自制脑图, MaxCompute 是一种全新的大数据计算服务。它能提供快速完全托管的 PB 级仓库解决方案,让你不用花费大量成本建数据中心,就能分析处理高达 PB 级的海量数据。
《阿里云MaxCompute百问百答》电子版地址下载 为了更好地帮助广大MaxCompute用户解决可能遇到的问题,阿里云 MaxCompute团队基于MaxCompute开发者社区和其它渠道反馈的问题,总结归纳 出MaxCompute各个功能点的常见问题,希望可以给正在学习和使用MaxCompute 的用户提供一些帮助。
基于阿里云Maxcompute搭建商业广告数据分析系统 互联网时代,信息流广告越来越多。而信息流广告的投放以大数据测算为依托,同样的数据,不同的解读方式,在进行投放指导时会产生不同的效果。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。
隐林 阿里云大数据产品专家,擅长MaxCompute、机器学习、分布式、可视化、人工智能等大数据领域;