一、编码范围
1. GBK (GB2312/GB18030)
x00-xff GBK双字节编码范围
x20-x7f ASCII
xa1-xff 中文
x80-xff 中文
2. UTF-8 (Unicode)
u4e00-u9fa5 (中文)
x3130-x318F (韩文
xAC00-xD7A3 (韩文)
u0800-u4e00 (日文)
ps: 韩文是大于[u9fa5]的字符
正则例子:
preg_replace("/([x80-xff])/","",$str);
preg_replace("/([u4e00-u9fa5])/","",$str);
二、代码例子
//判断内容里有没有中文-GBK (PHP)
function chec...
Linux解压rar文件内容全部乱码的处理
原Windows rar压缩的文件,Linux系统下解压后打开里边的文件,内容全部乱码。
之所以出现乱码是因为所压缩的文件中,有的文件是以中文命名。而在windows下中文的编码一般为gbk,而linux下中文的编码一般为utf8,所以在windows下正常打开的文件,到linux下很可能会出现乱码。
MySQL数据库编码转换方法
将latin1字符集转换成utf8字符集
源数据库:4.1.7(缺省latin1)
目标数据库:5.0.44(缺省utf8)
1、从源数据库服务器导出数据库
假定需要转码的数据库名称为bugs
#mysqldump -u root -p --opt --compatible=mysql40 --default-character-set=latin1 bugs > /root/xiaowei.sql
2、在目标数据库服务器创建新数据库
mysql>CREATE DATABASE `aaa` DEFAULT CHARACTER SET utf8 COLLATE utf8_g...