// 转化为utf-8文本
$utf8Content = iconv('ISO-8859-1', 'UTF-8', $content);
// 检测整个输出的编码 下面的检测没啥用。下面的检测没啥用
$encoding = mb_detect_encoding($output, “UTF-8, ISO-8859-1, GBK”, true);
一般中文选乱码
$utf8Content = iconv('GBK', 'UTF-8', $content); $utf8Content = iconv('GB2312', 'UTF-8', $content);
- UTF-8:一种可变长度的编码方式,可以表示Unicode字符集中的所有字符,广泛用于互联网和多语言文本处理。
- ISO-8859-1:也称为Latin-1,是ISO/IEC 8859标准的一部分,主要用于西欧语言。
- GBK:是GB2312的扩展,用于简体中文字符的编码。
- GB2312:主要用于简体中文字符的编码。
- Big5:主要用于繁体中文字符的编码。
- ASCII:美国信息交换标准代码,只能表示英文字符和一些特殊符号。
- EUC-JP:用于日文字符的编码。
- Shift_JIS:也是用于日文字符的编码。
- KOI8-R:用于俄语字符的编码。
- TIS-620:用于泰文字符的编码。
- ISO-8859-2:用于中欧语言。
- ISO-8859-3:用于南欧语言。
- ISO-8859-4:用于北欧语言。
- ISO-8859-5:用于斯拉夫语系。
- ISO-8859-6:用于阿拉伯语。
- ISO-8859-7:用于希腊语。
- ISO-8859-8:用于希伯来语。
- ISO-8859-9:用于土耳其语。
- ISO-8859-15:是ISO-8859-1的扩展,增加了欧元符号。
- UTF-16:一种固定长度的编码方式,可以表示Unicode字符集中的所有字符。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...