zl程序教程

您现在的位置是:首页 >  工具

当前栏目

数仓工具—Hive实战之UDF汉字首字母(22)

工具 实战 hive 22 汉字 数仓 UDF 首字母
2023-09-11 14:15:37 时间

UDF 汉字首字母

今天这个业务背景其实很简单,就是公司有很多品牌,我们要提取每个名牌的第一个汉字的首字母,例如"宝马"就是 B , 然后"福特" 就是F,“长安” 就是C 。

业务背景差不多就是这样的,关于UDF 我就不再过多介绍了,已经介绍过无数次了,你可以参考前面的文章

  1. Hive实战之UDF分词
  2. Hive实战之UDF解析IP地址
  3. Hive实战之UDF 加密
  4. Hive 实战之UDF 复杂JSON 处理

所以这里我们直接上代码,出解决思路就可以了

pinyin4j 获取汉字的拼音

pinyin4j是一个开源的流行java库

  1. 官网地址:http://pinyin4j.sourceforge.net/
  2. 在线文档:http://pinyin4j.sourceforge.net/pinyin4j-doc/ )

使用来处理中文转换成拼音(汉语拼音,罗马拼音等),功能强大。

添加依赖