最近被Qt使用过程中的一些乱码问题所困扰。从QString的中文乱码这个小问题,到windows系统下Qt代码移植到ubuntu系统的中文乱码,在网上搜索了许多方法,最后才磕磕碰碰地解决。这些问题归结起来都有一个关键的点:Qt中的QString类在创建对象时输入为双引号字符串时,默认其使用的是UTF-8编码(注意,QString的内部存储是Unicode,构建对象时还会进行一步转换)[1]。
在windows操作系统中,如果使用visual studio编程,程序文件是GBK编码。也就是说,当我们输入一个中文字符之后,会被转换为GBK编码的二进制数被保存到文件中。但QString类在构建对象时,默认输入的字符是UTF-8编码,也就是说,QString会根据UTF-8编码的规则理解这个二进制数,因此会理解错误,产生乱码。
为了解决这个问题,可以使用fromLocal8Bit这个函数构建QString对象。这个函数让QString按当前操作系统默认的8位编码来理解二进制。在windows中,就是GBK编码。
#include <QString>
QString chineseStr = QString::fromLocal8Bit("中文");
如果代码需要移植到linux系统中,就不能使用fromLocal8Bit这个函数。在windows系统中,程序文件按GBK编码保存,在linux系统中,需按GBK编码才能正确显示文件内容。但在linux系统中,本地的8位编码是UTF-8,因此使用fromLocal8Bit这个函数依然会产生乱码。如果要将windows系统下的Qt工程迁移到linux系统下,在处理中文字符时