您现在的位置是：首页 > 后端

当前栏目

PHP解码unicode编码的中文字符代码分享

PHP 中文编码字符代码分享解码 Unicode

2023-06-13 09:15:42 时间

问题背景：
晚上在抓取某网站数据，结果在数据包中发现了这么一串编码的数据："......\u65b0\u6d6a\u5fae\u535a......",这其实是中文被unicode编码后了的数据，我现在就是想解码出中文来，上度娘搞了半天，试了很多的姿（方）势（法），终于搞定了。

解决方案：
呵呵，老外就是给力啊，猛戳这里看老外给的解决方案

方案A(稳定版+推荐)：

functionreplace_unicode_escape_sequence($match){
returnmb_convert_encoding(pack("H*",$match[1]),"UTF-8","UCS-2BE");
}
$name="\u65b0\u6d6a\u5fae\u535a";
$str=preg_replace_callback("/\\\\u([0-9a-f]{4})/i","replace_unicode_escape_sequence",$name);
echo$str;//输出：新浪微博

//咱将上述方案A给封装起来~~~(方案A稳定版+升级+推荐)
classHelper_Tool
{
staticfunctionunicodeDecode($data)
{
functionreplace_unicode_escape_sequence($match){
returnmb_convert_encoding(pack("H*",$match[1]),"UTF-8","UCS-2BE");
}

$rs=preg_replace_callback("/\\\\u([0-9a-f]{4})/i","replace_unicode_escape_sequence",$data);

return$rs;
}
}
//调用
$name="\u65b0\u6d6a\u5fae\u535a";
$data=Helper_Tool::unicodeDecode($name);//输出新浪微博

方案B(次推荐)：

<?php
functionunicodeDecode($name){
$json="{"str":"".$name.""}";
$arr=json_decode($json,true);
if(empty($arr))return"";
return$arr["str"];
}
$name="\u65b0\u6d6a\u5fae\u535a";
echounicodeDecode($name);//输出：新浪微博

对于方案B，我要特别重点说明下注意事项，在好友XAR(猛戳XAR博客)的技术支持下，总结出要处理的字符串（即传递给函数unicodeDecode的参数$name的内容中一定不能包含单引号，否则就会导致解析失败,所以有必要的话可以借助str_replace()函数将非法字符格式化为合格字符）

猜你喜欢

BBS(php&mysql)完整版(二)
jenkins 邮件_邮件发送服务
可视化cmd中mysql初探不可视化的世界（cmd中mysql不是）
MySQL备份常规实践（mysql一般如何备份）
MySQL出现故障如何解决不能使用的问题（mysql不能用了么）
ES7集群搭建_elasticsearch集群搭建
十问分布式数据库：技术趋势、选型及标准思考
Ubuntu One文件服务将关闭 Canonical无以为继“免费存储大战”
解决问题启动Redis服务器提供相应端口（启动redis 端口）
红色加速Redis配置优化提升性能（redis配置性能优化）
Oracle中建立全局索引：提升查询性能（oracle 全局索引）
Oracle 904错误及其解决方案（oracle904）
Redis存储实时流水的利器（redis能存放流水吗）
数据库管理软件Navicat Premium Essentials Mac 中文版

zl程序教程

当前栏目

PHP解码unicode编码的中文字符代码分享

相关文章