最近公司一个旧的项目需要支持 emoji 表情,一开始以为只要修改下数据库的表字段就好,没想到引发了一系列的问题。这里总结下,以作备忘。
01 MySQL 字符集设置
系统变量:
character_set_server: 默认的内部操作字符集
character_set_client: 客户端来源数据使用的字符集character_set_connection:连接层字符集character_set_results: 查询结果字符集character_set_database: 当前选中数据库的默认字符集character_set_system: 系统元数据(字段名等)字符集02 MySQL 中的字符集转换过程
MySQL Server收到请求时将请求数据从
character_set_client
转换为character_set_connection
;-
进行内部操作前将请求数据从
character_set_connection
转换为内部操作字符集,其确定方法如下:使用表中字段的 CHARACTER SET 设定值;
若上述值不存在,则使用对应数据表的 DEFAULT CHARACTER SET 设定值(MySQL扩展,非SQL标准);
若上述值不存在,则使用对应数据库的 DEFAULT CHARACTER SET 设定值;
若上述值不存在,则使用
character_set_server
设定值。
将操作结果从内部操作字符集转换为
character_set_results
, 响应请求。
03 MySQL 启动配置文件 my.cnf
default-character-set: 设置 mysql 命令行连接的默认字符集
character-set-server: 设置系统内部操作字符集(即上文说到的character_set_server)collation_server: 设置系统默认字符集排序04 PHP连接 MySQL(以PDO连接方式为例)
常见的两种设置字符集的方式
mysql:host=localhost;dbname=db_demo;charset=utf8mb4
PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4"
05 总结
数据表字段的字符集需要是
utf8mb4
,这个是刚需一般
character_set_client
、character_set_connection
、character_set_results
的字符集相同,且都为utf8mb4
(这三个参数默认都是utf8mb4
,如果不是,是实现不了 emoji 表情的,原因参照字符集转换过程)。连接数据库的字符集也需要是
utf8mb4
character_set_server
、character_set_database
等默认字符集的类型并没有那么重要,但最好还是保持一致TP 的坑果然是多,远离TP
参考