Base64加密后字符长度变化
   
问题:文字中包含了emoji表情,公司数据库版本较老,utf-8无法存储emoji这种四个字节的字符。所以解决方案是将文字转换成base64后存入。mysql要对字段长度进行限制,需要知道原文本长度与base64加密后文本长度的比例。
所谓Base64,就是说选出64个字符—-小写字母a-z、大写字母A-Z、数字0-9、符号”+”、”/”作为基本基础集的编码方式。
    
    
    base64加密原理:
   
    ①将每三个字节作为一组,一共是24个二进制位。
    
    ②将这24个二进制位分为四小组,每个小组有6个二进制位。
    
    ③在每小组前面加两个00,扩展成32个二进制位,即四个字节。
    
    ④根据base64基础表,得到扩展后的每个字节的对应的base64符号。
   
    UTF-8编码下的中/日/韩文占了3/4个字节
    
    占四个字节是最长的情况:1 : 8
    
    1个中文字符 –》 4个字节 –》 每三个字节分为一组,则分成两组,共6个字节 –》 扩展,得到8个字节 –》 将8个字节转换成8个base64字符。
   
    毕竟四个字节占少数,三个字节情况下是:1 : 4
    
    1个中文字符 –》 3个字节 –》 每三个字节分为一组,则分成一组,共3个字节 –》 扩展,得到4个字节 –》 将4个字节转换成4个base64字符。
   
所以加密后的字符长度为原长度的4~8倍。这边暂时取值4.5倍
 
版权声明:本文为lalioCAT原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
