字符Base64加密后的长度变化

  • Post author:
  • Post category:其他




问题:


备注文字中包含了emoji表情,

由于

公司数据库版本较老,暂时也不可能更换数据库,utf-8无法存储emoji这种四个字节的字符。所以解决方案是将文字转换成base64后存入。但是

MySQL

要对字段长度进行限制,需要知道原文本长度与base64加密后文本长度的比例。




Base64

加密原理:





Base64就是说选出64个字符,包括小写字母a-z、大写字母A-Z、数字0-9、符号”+”、”/”作为基本基础集的编码方式。






①将每三个字节作为一组,一共是24个二进制位。

②将这24个二进制位分为四小组,每个小组有6个二进制位。

③在每小组前面加两个00,扩展成32个二进制位,即四个字节。

④根据base64基础表,得到扩展后的每个字节的对应的base64符号。



对比:



UTF-8编码下的中/日/韩文占了3/4个字节

占四个字节是最长的情况:1 : 8

1个中文字符 –》 4个字节 –》 每三个字节分为一组,则分成两组,共6个字节 –》 扩展,得到8个字节 –》 将8个字节转换成8个base64字符。


毕竟四个字节占少数,三个字节情况下是:1 : 4

1个中文字符 –》 3个字节 –》 每三个字节分为一组,则分成一组,共3个字节 –》 扩展,得到4个字节 –》 将4个字节转换成4个base64字符。


所以加密后的字符长度为原长度的4~8倍。这边暂时取值4.5倍



问题解决方法




我当时也是选择解决方案也是将文字转换成base64后存入,当时数据库的备注的50字内,varchar(150)类型。


忘记把字段类型改成text了,所以提交保存的时候有些备注写的比较多的保存不成功。


修改之前如下:


desc      varchar(150)      NOT NULL     备注


修改之后:(这样才不会数据库字段长度溢出,保存成功)


desc     text     NOT NULL     备注





版权声明:本文为LY_Dengle原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。