zl程序教程

您现在的位置是:首页 >  后端

当前栏目

C++判断文件编码格式

C++文件编码 判断 格式
2023-09-14 09:07:08 时间

转载:https://blog.csdn.net/kikityan/article/details/89923808

记事本打开txt文件,然后另存,有四种编码格式可供选择,分别是:
ANSI 无格式定义 对于中文编码格式是GB2312;
Unicode 文本里前两个字节为FF FE 字节流是little endian
Unicode big endian 文本里前两个字节为FE FF 字节流是big endian
UTF-8 前两字节为EF BB,第三字节为BF 带bom

下面用c++判断这四种编码格式

int main()
{
	ifstream fin("E:\\C和C++\\log4\\CPlusPlusExamples-master\\CPlusPlusExamples-master\\CppLog4cpp\\gb2312_input_py_mb2.h",ios::binary);
    unsigned char  s2;
    fin.read((char*)&s2, sizeof(s2));//读取第一个字节,然后左移8位
    int p = s2<<8;
    fin.read((char*)&s2, sizeof(s2));//读取第二个字节
    p |=s2;

    string code;

    switch(p)//判断文本前两个字节
    {
    case 0xfffe:  //65534
        code = "Unicode";
        break;
    case 0xfeff://65279
        code = "Unicode big endian";
        break;
    case 0xefbb://61371
        code = "UTF-8";
        break;
    default:
        code = "ANSI";
    }
    fin.close();
    cout<<code<<"\n";
}

//有问题。。。。。