码农创造了AI,但开发AI不再需要码农了
马上就要到一年一度的618大促,卖萌酱在添加购物车时,选择困难症又犯了。
如今的电商评论区,大量刷单行为淹没了重要的产品评价,有的被淹没在了追评区,有的平台甚至已经不分好评/中评/差评区了,而是“一眼望去好评如潮”。
比如某净水器的评论区,看似只有200条差评,但1.3w条追评、10w条好评中其实隐藏着数不清的差评,这些差评往往可信度极高(毕竟卖家和同行都不会雇水军去好评区写差评)。
但如果想从追评和好评区找出这些差评,能找到你眼瞎。
于是卖萌酱心生一计,既然评论数量这么多,为啥不自己训练个AI模型来从动辄10万+评论的评论区里自动挖掘差评呢?
毕竟人眼一秒看不了10条评论,但AI模型一秒看100条甚至1000条评论也不成问题(只要你有好显卡部署服务)。
说!干!就!干!
首先卖萌酱将这个“找差评”的问题抽象成NLP中的“情感极性分类”问题,进而我们的任务就变成了四步:
富集评论情感极性分类数据集 —> 训练调优情感分类模型 —> 部署模型得到API —> 调用API解决问题
富集评论情感极性数据还好说,中文社区有不少公开数据集。但AI模型的训练和部署就麻烦多了。如果基于传统的深度学习框架从头折腾,无论代码量还是调试调优成本都不低。
这对于只想快速实现情感挖掘功能的我来说无疑效率太低了。
这时大佬给卖萌酱推荐了一个高效低成本的平台——EasyDL,不到一天就能完成从数据集到部署API。
半信半疑的卖萌酱开始了试用之路…
打开EasyDL官网后,首先要选择你要做什么任务:
好家伙,我开始以为是个high-level深度学习框架,看到上图才意识到原来这是个更上层的AI应用开发平台,涵盖了图像、文本、语音、视频、结构化数据等各种任务场景和数据场景。
这里我们关注的是里面的EasyDL-文本任务。针对本次的任务目标,我们可以选择文本分类-单标签,但卖萌酱发现还有更加具体的“情感倾向分析”任务,于是直接选择了后者(上图红框部分)。
完成任务选择后,平台给到了开发任务的流程提示:
这个流程对于一个久经沙场的算法工程师来说已经非常熟悉了,于是卖萌酱跳过指导,开始了开发。
…
随着开发的进行,卖萌酱慢慢发现不对劲了。
数据载入处理完了,我没写代码?
模型训练&效果调优完了,我依然没写代码?
部署完成,服务的远端API我也拿到了,我最终一行代码都没写??
甚至,就连调用API的client端脚本,平台都给出来了,也不用自己写。。
卖萌酱进而将某商品评论区爬下来的数万条评论存到文件comments.txt
中,调用我们已经部署完成的API来挖掘负面评论:
负面评论被源源不断的挖掘出来了!
最后发现某净水器商品的差评区尽管只有200条差评,但通过我们的脚本过全部的数万条评论,却挖掘出来了3300多条差评。
此时卖萌酱陷入了深深的思考——
“做了这么多年的AI算法工程师,到头来,却发现AI的训练和部署已经不需要写代码了?”
虽然码农创造了AI技术,但从技术应用的角度,开发AI已经越来越不需要码农了…
需要注意的是,卖萌酱全程没有任何人指导,甚至也没看官方的指导手册,此前也从未用过EasyDL。初次跑通以上全流程,卖萌酱只用了3小时,而且其中还包括了1个多小时的模型训练与自动调优的时间。
放在以前,3小时对AI算法工程师来说能做什么?
从0开始一个任务的话,3小时,大概模型训练代码还没写完吧。。。
在初次听说EasyDL之前,卖萌酱以为这只是个API封装怪,但真正试用下来,却发现这是个颠覆性的AI开发平台。
本着把3天开发时间降低到1天的心态试用,结果没想到3小时就解决了,而且没有写一行代码。EasyDL的易用性和使用门槛,就连非专业的算法工程师,也绝对可以应付的来了。
想体验零代码NLP开发全流程的小伙伴们,EasyDL官方会于6月9号晚20点组织一场直播,传送门:
戳完报名后,记得定好闹钟!届时会有诸多学习干货、实战体验和大礼包相送哦~
另外,卖萌酱还有一点不解,从最终的负面评论挖掘效果来看,是非常精准、惊艳的。但是卖萌酱却只丢了1万条标注样本给平台,是什么撑起来了模型效果呢?
卖萌酱在配置模型训练环节时,注意到了EasyDL平台有这么一个选项:
意思是说,如果训练阶段是选择了高精度,那就会调用文心大模型作为backbone并完成参数热启。
关注NLP预训练进展的小伙伴对文心大模型“ERNIE”一定不陌生了。
2019年12月,ERNIE 2.0登顶GLUE:
2021年7月,百亿参数规模的ERNIE 3.0霸榜SuperGLUE:
在中文任务上,ERNIE 3.0更是实现了全面屠榜:
而在EasyDL·文本任务中就内置了包含ERNIE 3.0在内的30+预训练大模型,除了通用大模型外,还包括了抽取、匹配等专属任务模型和金融、法律、医疗等领域模型。正是文心大模型的赋能,EasyDL·文本才得以在实现极简易用性的同时,做到超高精度的模型产出。
毫不夸张的说,这个写了0行代码、花了3个小时部署得到的评论极性判别的API,可能比许多专业的算法工程师折腾数天搞出来的API都好用。
至此,作为一个AI算法工程师,卖萌酱深深的感慨:
我们开发了AI,但AI开发可能不再需要我们了。
最后,想体验零代码NLP开发全流程的小伙伴们,EasyDL官方会于6月9号晚20点组织一场直播,传送门:
戳完报名后,记得定好闹钟!届时会有诸多学习干货、实战体验和大礼包相送哦~
相关文章
- 跑道防侵入,华为云ModelArts平台助力航空器识别AI模型开发
- 解密昇腾AI处理器--DaVinci架构(存储系统)
- 跑道防侵入,华为云ModelArts平台助力航空器识别AI模型开发
- AI - TensorFlow - 示例05:保存和恢复模型
- 基于百度AI平台的语音识别功能开发-SDK调用
- AI&BlockChain:“知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理和区块链技术的乘客智能报警系统》案例的界面简介、功能介绍分享之计算机视觉技术
- 想学AI开发很简单:只要你会复制粘贴
- 基于昇腾计算语言AscendCL开发AI推理应用
- 边缘AI研发落地生态挑战调研报告发布
- 云图说 | 华为云医疗智能体智联大健康:AI医学影像
- 云图说|AI开发难!难!难!端云协同多模态AI开发套件你需要了解一下
- 华为云MVP高浩:打破AI开发瓶颈,解决数据、算法、算力三大难题
- 【华为云技术分享】深度理解AI概念、算法及如何进行AI项目开发
- 【NLP】第8章 将 Transformer 应用于法律和财务文件以进行 AI 文本摘要
- 【人工智能 AI 2.0】阿里VP贾扬清被曝将离职创业:建大模型基础设施 已火速锁定首轮融资
- AI绘画怎么能画出好图?先理解知识点、流程再开发代码
- AI学习之路(4): TensorFlow是什么
- 各种 AI 数据增强方法,都在这儿了
- 第三篇 Ubuntu 20.04 搭建AI开发环境