问题:
备注文字中包含了emoji表情,
由于
公司数据库版本较老,暂时也不可能更换数据库,utf-8无法存储emoji这种四个字节的字符。所以解决方案是将文字转换成base64后存入。但是
MySQL
要对字段长度进行限制,需要知道原文本长度与base64加密后文本长度的比例。
Base64
加密原理:
Base64就是说选出64个字符,包括小写字母a-z、大写字母A-Z、数字0-9、符号”+”、”/”作为基本基础集的编码方式。
①将每三个字节作为一组,一共是24个二进制位。
②将这24个二进制位分为四小组,每个小组有6个二进制位。
③在每小组前面加两个00,扩展成32个二进制位,即四个字节。
④根据base64基础表,得到扩展后的每个字节的对应的base64符号。
对比:
UTF-8编码下的中/日/韩文占了3/4个字节
占四个字节是最长的情况:1 : 8
1个中文字符 –》 4个字节 –》 每三个字节分为一组,则分成两组,共6个字节 –》 扩展,得到8个字节 –》 将8个字节转换成8个base64字符。
毕竟四个字节占少数,三个字节情况下是:1 : 4
1个中文字符 –》 3个字节 –》 每三个字节分为一组,则分成一组,共3个字节 –》 扩展,得到4个字节 –》 将4个字节转换成4个base64字符。
所以加密后的字符长度为原长度的4~8倍。这边暂时取值4.5倍
问题解决方法
:
我当时也是选择解决方案也是将文字转换成base64后存入,当时数据库的备注的50字内,varchar(150)类型。
忘记把字段类型改成text了,所以提交保存的时候有些备注写的比较多的保存不成功。
修改之前如下:
desc varchar(150) NOT NULL 备注
修改之后:(这样才不会数据库字段长度溢出,保存成功)
desc text NOT NULL 备注