经过Base64加密后字符的长度变化

  • Post author:
  • Post category:其他




Base64加密后字符长度变化

问题:文字中包含了emoji表情,公司数据库版本较老,utf-8无法存储emoji这种四个字节的字符。所以解决方案是将文字转换成base64后存入。mysql要对字段长度进行限制,需要知道原文本长度与base64加密后文本长度的比例。

所谓Base64,就是说选出64个字符—-小写字母a-z、大写字母A-Z、数字0-9、符号”+”、”/”作为基本基础集的编码方式。



base64加密原理:

①将每三个字节作为一组,一共是24个二进制位。

②将这24个二进制位分为四小组,每个小组有6个二进制位。

③在每小组前面加两个00,扩展成32个二进制位,即四个字节。

④根据base64基础表,得到扩展后的每个字节的对应的base64符号。

UTF-8编码下的中/日/韩文占了3/4个字节

占四个字节是最长的情况:1 : 8

1个中文字符 –》 4个字节 –》 每三个字节分为一组,则分成两组,共6个字节 –》 扩展,得到8个字节 –》 将8个字节转换成8个base64字符。

毕竟四个字节占少数,三个字节情况下是:1 : 4

1个中文字符 –》 3个字节 –》 每三个字节分为一组,则分成一组,共3个字节 –》 扩展,得到4个字节 –》 将4个字节转换成4个base64字符。

所以加密后的字符长度为原长度的4~8倍。这边暂时取值4.5倍



版权声明:本文为lalioCAT原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。