现在的位置: 首页 > 综合 > 正文

Cocos2d-x学习（二十三）：Base64解码

2013年10月14日 ⁄ 综合 ⁄ 共 2566字 ⁄ 字号小中大 ⁄ 评论关闭

使用过Tiled的朋友应该都有所了解，Tiled生成的tmx格式的文件其实就是xml，唯一特殊的地方就是tmx文件中都会有一个或者多个"data"的节点，用来存放Tiled的块数据！类似于这样的格式

<map version="1.0" orientation="orthogonal" width="40" height="40" tilewidth="32" tileheight="32">
 <tileset firstgid="1" source="desert.tsx"/>
 <layer name="Ground" width="40" height="40">
  <data encoding="base64" compression="zlib">
   eJztmNkKwjAQRaN9cAPrAq5Yq3Xf6v9/nSM2VIbQJjEZR+nDwQZScrwztoORECLySBcIgZ7nc2y4KfyWDLx+Jb9nViNgDEwY+KioAXUgQN4+zpoCMwPmQAtoAx2CLFbA2oDEo9+hwG8DnIDtF/2K8ks086Tw2zH0uyMv7HcRr/6/EvvhnsPrsrxwX7rwU/0ODig/eV3mh3N1ld8eraWPaX6+64s9McesfrqcHfg1MpoifxcVEWjukyw+9AtFPl/I71pER3Of6j4bv7HI54s+MChhqLlPdZ/P3qMmFuo5h5NnTOhjM5tReN2yT51n5/v7J3F0vi46fk+ne7aX0i9l6If7mpufTX3f5wsqv9TAD2fJLT9VrTn7UeZnM5tR+v0LMQOHXwFnxe2/warGFRWf8QDjOLfP
  </data>
 </layer>
</map>

很明显，data数据已经被加密了，根据data的属性，可以得知是在压缩后进行了Base64编码！

1.什么是Base64：

我自己的总结就是源字符串的二进制格式（之前一个字符由8位二进制位表示），拆分成6位二进制位，前面两位补0，组成新的8位二进制位的字符（这样可以保证新的字符只占8位中的低6位），也就是说用2^6=64个字符来表示原字符的一部分，暂时忘掉字符与ascii码之间的关系，Base64定义了一套字符表（即26个大写字母，26个小写字母，10个阿拉伯数字，已经‘+’'/'两个符号组成64个字符），详情请点击

2.解码：

（1）字符表

我使用了一个std::map<unsigned char, unsigned int>来保存Base64的字符表，键为64个Base64字符，值为相对索引

（26个大写字母，26个小写字母，10个阿拉伯数字，已经‘+’'/'两个符号的索引为从0到63）

（2）4的倍数

根据Base64的定义可以得知，Base64编码后的每4个字节对应原码的每3个字节，所以Base64编码后的字符的个数必须是4的倍数（图片来源于wiki）

问题来了，如果原码是2个字符，应该对应的Base64编码是 2*4/3个，这样并不合理，需要我们在结尾处做特殊处理才能得到正确的结果，于是Base64定义为如果原码个数%3=1，则补2个'='；如果原码个数%3=2，则补1个‘=’。于是就有了Base64编码后面有0,1,2个=符号的可能，而在解码的时候会将'='解码为0.

（3）四变三

根据Base64的定义可知，每个字符的高2位都是0，只有填充的意义，而每个字符的低6位需要两两组合运算得到源码，将Base64编码后字符4个分成1组（可以解码出3个原码），我用A,B,C,D表示Base64编码后的字符，a,b,c表示1,2,3,4解码后的原码，根据规则可以得出：

a = (A << 2) + (B >> 4)

b = (B << 4) + (C >> 2)

c = (C << 6) + D

具体代码实现（Qt版本）

for (; i<(size-4); i+=4)
{
        unsigned char c1 = simplifiedText[i].toAscii();
        unsigned char c2 = simplifiedText[i+1].toAscii();
        unsigned char c3 = simplifiedText[i+2].toAscii();
        unsigned char c4 = simplifiedText[i+3].toAscii();

        if (!IsBase64Character(c1) || !IsBase64Character(c2) ||
                !IsBase64Character(c3) || !IsBase64Character(c4))
        {
            return Base64ParseError_Illegal_CH;
        }

        unsigned char ch1 = mAlphabetMap[c1];
        unsigned char ch2 = mAlphabetMap[c2];
        unsigned char ch3 = mAlphabetMap[c3];
        unsigned char ch4 = mAlphabetMap[c4];

        desText.append((unsigned char)((ch1 << 2) + (ch2 >> 4)));
        desText.append((unsigned char)((ch2 << 4) + (ch3 >> 2)));
        desText.append((unsigned char)((ch3 << 6) + ch4));
}

这里的范围只用到了size-4，是考虑到末尾4位的不确定性

unsigned char ch3 = 0;
    unsigned char ch4 = 0;

    if (c3 == '=' && c4 != '=')
    {
        return Base64ParseError_Illegal_CH;
    }
    else if (c3 != '=' && c4 != '=')
    {
        ch3 = mAlphabetMap[c3];
        ch4 = mAlphabetMap[c4];
    }
    else if (c3 != '=' && c4 == '=')
    {
        ch3 = mAlphabetMap[c3];
        ch4 = 0;
    }

3.测试解码

我选择了wiki上的一段文本，测试如图

（PS：还有一个检查字符是否为Base64的方法，只要在map中检测键值就可以了，这也是我选择map的原因。）

这个目前对于Tiled的研究还没有太大帮助，因为数据在进行Base64编码之前先进行了zip的压缩。

【上篇】Linux动态链接库搜索路径问题
【下篇】B2B

作者: recoil

该日志由 recoil 于11年前发表在综合分类下，最后更新于 2013年10月14日.
转载请注明: Cocos2d-x学习（二十三）：Base64解码 | 学步园 +复制链接

抱歉!评论已关闭.

学步园