低门槛上手快!火山引擎 VeDI 这样满足数据分析新需求
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
近日,市场研究机构 IDC 发布《2022 年 V2 全球大数据支出指南》。
数据显示,2021 年全球大数据市场的 IT 总投资规模为 2176.1 亿美元(约 1.5 万亿元人民币),并有望在 2026 年增至 4491.1 亿美元(约 3.1 万亿元人民币),五年预测期内(2021-2026)实现约 15.6% 的 CAGR(复合增长率)。
聚焦中国市场,到 2026 年,中国大数据 IT 支出规模预计为 359.5 亿美元(约 2484.14 亿元人民币),市场规模位列单体国家第二;从增速的角度来看,中国大数据 IT 支出五年 CAGR (复合年均增长率)约为 21.4%,位列全球第一。
![](https://static001.geekbang.org/infoq/0d/0d018b357772ca66f65af5993498bcec.png)
软件市场方面,2026 年大数据软件将成为国内第二大技术市场,大数据软件将以 26.9%的五年 CAGR 强势增长,软件 IT 投资规模逐年接近硬件市场。
作为大数据领域贯穿数据集成、数据分析、数据应用等多环节流程的工具,BI 类产品是大数据软件大军中的重要一员。
目前,国内常用的 BI 产品种类繁多,但在进行数据提取、分析、展现全链路操作时,普遍对使用对象存在一定技术门槛。
以电商平台行业商家运营岗位为例,在双 11 期间需要对行业商品库存数据进行即时采集与分析,一般情况下行业数据分析师会在此环节承担大多数取数、统计工作,并将结果性数据反馈给运营。但在实际工作场景中,临时性的数据需求往往会因为包括分析师资源紧张、多需求并线等原因,难以被满足,这时候就需要运营自行按照临时自定义的逻辑,完成数据加工处理的操作。
但即便是借助 BI 产品,也并非仅靠“傻瓜式”操作就能完成整套工作流程。
首先,在数据提取上,运营必须掌握基础 SQL 操作,才能从庞杂的数据字段中筛选自己所需的数据,这对大多数非技术背景出身的运营岗位人员来说,是一道现实“拦路虎”。
其次,当部分业务数据存储在本地时,如果和线上数据库数据有关联交叉分析,那么本地数据无法定时自主更新,导致每次看板都需要手动迭代,数据的获取时效性和满足度大打折扣。
因此,在速度够快、稳定性高的基础上,企业员工对 BI 产品的要求也在进一步加码,“门槛低”“上手快”成为第二阶段的追求。
DataWind 是火山引擎数智平台 VeDI 面向企业数据分析场景推出的智能数据洞察产品,在历经字节跳动内部多业务多场景实践后,已正式对外进行能力输出。日前,DataWind 推出全新进阶功能——可视化建模,旨在为用户提供零门槛数据处理服务。
借助可视化建模,用户通过可视化拖、拉、连线操作,就能将复杂的数据加工建模过程简化成清晰明了的画布流程,真正帮助用户实现数据生产加工环节的“所想即所得”,极大降低数据使用门槛。
![](https://static001.geekbang.org/infoq/75/755a391c8ec40abea138422635b1e357.png)
此外,该功能还支持同时构建多组画布流程,用户可以一图实现多数据建模任务构建,提高数据建设效率、降低任务管理成本;同时,画布还集成封装了超过 40 种数据清洗、特征工程算子,可覆盖初阶到高阶的全面数据生产能力。
![](https://static001.geekbang.org/infoq/69/6984e82a4e79693ce3cbca451b655b7e.png)
而除了在技术层面为用户降低数据分析门槛,在使用场景上,DataWind 也为用户尽可能打破时空边界——早在今年月,DataWind 就全面与飞书、邮件等在线协同办公 IM 工具协同,如用户通过飞书可以实现 DataWind 数据服务一键订阅,实现随时随地查看数据、使用数据。
![](https://static001.geekbang.org/infoq/49/49959a411081d92ab65961d760dc8f0d.png)
速度够快、稳定性高、门槛低、上手快,不断升级自我功能、满足用户多重需求的 DataWind 目前已在零售、汽车、手机、金融等多个行业完成性能验证,受到企业欢迎。
点击跳转火山引擎智能数据洞察 DataWind了解详情
相关文章
- OpenHarmony 给你的输入法加点彩—星球崛起
- 剖析 Linux 内核在底层是如何工作的
- 如何高效开发相似图像搜索引擎?
- Linux Kernel 5.19 正式发布,支持龙芯 CPU架构
- Findex – 在 Linux 中搜索和启动应用程序的超快速工具
- 基于Spring接口,集成Caffeine+Redis两级缓存
- 新版Linux在M2 MacBook Air可用,Linus Torvalds发布最新内核
- Vue2剥丝抽茧-响应式系统之分支切换
- 比各种清理大师靠谱!Edge浏览器新技术大幅提速
- 谷歌 Chrome 浏览器 104 正式版发布:加快网页加载,蓝牙 API 改进
- 递归代码都可以转为非递归吗 ?
- DevEco Device Tool:HDF框架一键生成!
- HarmonyOS 实现一个滑块验证
- Linux终端居然也可以做文件浏览器?
- 什么是虚拟机,为什么它们如此有用?
- 为什么 Kubernetes 优先使用 Systemd 做为 Cgroup Driver?
- Chrome 插件开发指南
- 我是如何使用 Linux fmt 命令来格式化文本
- 如何利用迪米特法则实现“高内聚、低耦合”?
- Podman 和 Docker 的安装、部署和设置