您现在的位置是：首页 > 系统

当前栏目

Linux下使用unzip解压缩中文乱码问题

Linux 中文乱码解压缩问题 unzip 使用

2023-09-14 08:59:42 时间

使用info-zip.org 的 unzip类解压zip压缩包，如果压缩包中有中文文件名，那么解压这些文件出来时文件名是乱码的。
分析：

参考这篇文章让Unzip正确解压其中包含中文文件名的Winzip压缩包，原因是unzip试图将zip文件中用 oem(ibm-dos) codepage 编码的文件名转换成自己的内部编码。可惜unzip只能转换极少数几种codepage，中文的 cp936 不在其列。

如果您的系统还未编译安装Unzip

调试发现问题出现在MultiByteToWideChar方法里，

如 MultiByteToWideChar(CP_ACP,0,fn,-1,tfn,MAX_PATH); 到这里时fn中的name属性值还是正常的，在这个方法内部执行完tfn就乱了。

解决方法：

打开unzip.cpp源文件，找到函数

ZRESULT TUnzip::Get(int index,ZIPENTRY *ze)

 // ......

 // ......

把 CP_UTF8 改为CP_ACP，（ CP_ACP 指示要使用当前设置的 API 默认 Windows ANSI 代码页）

重新编译后

这样就解决了解压中文文件名称乱码的问题

编译时解决源码问题（无需更改源码）

上面的情况，我们我观察到unzip源代码这段开始的地方有判断

#ifndef Ext_ASCII_TO_Native

这样问题似乎更简单了，不用改源代码，只需在make时定义 Ext_ASCII_TO_Native 即可，这样 Ext_ASCII_TO_Native 实际为一个空的宏，不进行任何转换操作。
比如，使用下面的方法编译

make -DExt_ASCII_TO_Native

或者在bash执行下面两行

export LOCAL_UNZIP=-DExt_ASCII_TO_Native

通过unzip行命令解压，指定字符集

unzip -O CP936 xxx.zip (用GBK, GB18030也可以)

方法二在环境变量中，指定unzip参数

在环境变量中，指定unzip参数，总是以指定的字符集显示和解压文件
/etc/environment中加入2行

UNZIP=”-O CP936″

ZIPINFO=”-O CP936″

复制以下内容（Python）保存未myuzip.py文件脚本，并修改运行权限为可运行(chmod +x uzip)

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# uzip.py

import os

import sys

import zipfile

print "Processing File " + sys.argv[1]

file=zipfile.ZipFile(sys.argv[1],"r");

for name in file.namelist():

 utf8name=name.decode(gbk)

 print "Extracting " + utf8name

 pathname = os.path.dirname(utf8name)

 if not os.path.exists(pathname) and pathname!= "":

 os.makedirs(pathname)

 data = file.read(name)

 if not os.path.exists(utf8name):

 fo = open(utf8name, "w")

 fo.write(data)

 fo.close

file.close()

180606-Linux下jdk中文乱码问题解决之前遇到过一次中文乱码问题，是通过在jdk的jre目录下的lib/fonts文件中添加simsun.ttf字体文件解决，但是这次遇到一个奇怪的问题，同样的字体拷贝过去后，中文不乱但是英文乱码了记录一下解决过程：主要思路就是给系统安装中文字体，让系统本身就支持中文即可
Mac Terminal ssh连接linux服务器中文乱码整理了近期在项目上做的一些技术研究，希望与大家共同探讨交流。场景：Mac OSterminal 本地中文显示正常ssh 登陆linux，服务器中文显示乱码尝试解决：方法1. （未解决）在本地与服务器执行 locale 命令，发现字符编码一致，都是 zh_CN.UTF-8。

猜你喜欢

操作oracle，突破20000万条记录的瓶颈（oracle两亿条记录）
一文吃透es6 ~ es13所有新特性
在JSP中处理虚拟路径
MySQL中使用FOR循环快速编写函数（mysql函数for）
数据分析用MongoDB进行商品数据分析（mongodb商品）
【Android NDK 开发】Kotlin 语言中使用 NDK ( 创建支持 Kotlin 的 NDK 项目 | Kotlin 语言中使用 NDK 要点 | 代码示例 )
JSP上传图片产生java.io.IOException:Streamclosed异常解决方法
排好队，挨着跑
兼容IE和Firefox火狐的上下、左右循环无间断滚动JS代码
简化MRO工业品供采交易路径，S2B2B系统助力企业构建业务一体化管理优势
函数Linux中atoi函数的简单应用（linuxatoi）
360 Linux：展现完美技术新版本（360linux版本）
探究Redis默认并发配置（redis默认并发是多少）
查阅Redis命令指南极速搞定Redis使用（查看redis命令大全）
Linux下让快捷键变得更简单（linux定义快捷键）
【Kotlin】扩展属性 ( 扩展变量属性 | 扩展常量属性 | 注意事项 | 本质分析 )
让我们用 Rust 重写那些伟大的软件吧
Linux系统输入法设置指南（linux输入法设置）

相关主题

Linux巡检
Linux查看日志

zl程序教程

当前栏目

Linux下使用unzip解压缩中文乱码问题

相关文章