上一篇文章介绍sproto的构建流程(http://www.cnblogs.com/RainRill/p/8986572.html),这一篇文章介绍sproto如何使用,参考https://github.com/cloudwu/sproto

A端主动给B端发送请求:调用request_encode对lua表进行编码,再用sproto.pack打包。

B端收到A端的请求:用sproto.unpack解包,再调用request_decode解码成lua表。

B端给A端发送返回包:用response_encode对lua表进行编码,然后用sproto.pack打包。

A端收到B端的返回包:用sproto.unpack解包,再调用request_decode解码成lua表。

不管是是request_encode还是response_encode,最终都会调用c层的encode接口,request_decode和response_decode都会调用c层decode接口。encode负责将lua数据表编码成二进制数据块,而decode负责解码,二者是互补操作。同样,pack和unpack也是互补操作。

1 -- lualib/sproto.lua
 2 function sproto:request_encode(protoname, tbl)
 3     ...
 4     return core.encode(request,tbl) , p.tag
 5 end
 6
 7 function sproto:response_encode(protoname, tbl)
 8     ...
 9     return core.encode(response,tbl)
10 end
11
12
13
14 function sproto:request_decode(protoname, ...)
15     ...
16     return core.decode(request,...) , p.name
17 end
18
19 function sproto:response_decode(protoname, ...)
20     ...
21     return core.decode(response,...)
22 end
23
24
25 sproto.pack = core.pack
26 sproto.unpack = core.unpack

1. encode编码

先放一个例子(在github上有),分析源码时会用到:

person { name = "Alice" ,  age = 13, marital = false }

03 00 (fn = 3)
00 00 (id = 0, value in data part)
1C 00 (id = 1, value = 13)
02 00 (id = 2, value = false)
05 00 00 00 (sizeof "Alice")
41 6C 69 63 65 ("Alice")

encode的目的是按指定协议类型将lua表里的数据转化成c中的类型,然后按特定格式编码成一串二进制数据块。

最终调用sproto_encode api编码,有5个参数:st,sproto指定类型的c结构;buffer、size,存放编码结果的缓冲区和大小,如果缓冲区不够,会扩充缓冲区,重新编码;cb,对应lsproto.c中encode api,是一个c接口,负责获取lua表中指定key的值,或数组中指定索引位置的值;ud,额外信息,包含lua与c之间交互用的虚拟栈、sproto中对应类型的c结构等。

第3-6行,编码结果分两部分:头部header和数据data,header长度是固定的,等于2字节field总数+field的数目*2字节每个field长度。如下图:header指针指向缓冲区首地址,data指向header+header_sz位置,接下skynet源码分析之sproto使用方法-LMLPHP

 来编码每个field信息时,data指针会往后移动,而header指针保持不动。

第63-65行,将field的总数按大端格式打包长2字节大小(示例中的03 00),data指向header+header_sz处,最后用memmove将头部和数据块连在一起。

 接下来就是编码每一个field数据,根据field类型做不同的处理:

第11-13行,如果是array,调用encode_array编码,稍后介绍。

第33-37行,如果是string或自定义类型,调用encode_object编码,稍后介绍。

第16-32行,如果是integer或boolean类型,调用cb(lsproto.c中的encode)获取lua表中对应field名字的数值,保存到args.value(即u中)。第21行,变量value等于(原来的值+1)*2,因为编码后的0有特殊作用,为了区分原来值是0的情况。

第58-59行,最后将value按大端格式编码2字节,存到header指定的位置。比如示例中的1C 00,(13+1)*2=28=1C, 02 00,(0+1)*2=2=02,注:lua中的false会编码成0,true编码成1。如果是array、string或自定义类型,value是0,编码后是00 00,代表数值在data部分。 

第47-56行,如果某些tag没有设置值,需要把tag信息编码到header里。

 1 // lualib/sproto/sproto.c
 2 int sproto_encode(const struct sproto_type *st, void * buffer, int size, sproto_callback cb, void *ud) {
 3     uint8_t * header = buffer;
 4     uint8_t * data;
 5     int header_sz = SIZEOF_HEADER + st->maxn * SIZEOF_FIELD;
 6     data = header + header_sz;
 7     ...
 8     for (i=0;i<st->n;i++) {
 9         struct field *f = &st->f[i];
10         int type = f->type;
11         if (type & SPROTO_TARRAY) {
12             args.type = type & ~SPROTO_TARRAY;
13             sz = encode_array(cb, &args, data, size);
14         } else {
15             switch(type) {
16                 case SPROTO_TINTEGER:
17                 case SPROTO_TBOOLEAN: {
18                     sz = cb(&args);
19                     if (sz == sizeof(uint32_t)) {
20                         if (u.u32 < 0x7fff) {
21                             value = (u.u32+1) * 2;
22                             sz = 2; // sz can be any number > 0
23                         } else {
24                             sz = encode_integer(u.u32, data, size);
25                         }
26                     } else if (sz == sizeof(uint64_t)) {
27                         sz= encode_uint64(u.u64, data, size);
28                     } else {
29                        return -1;
30                     }
31                     break;
32                 }
33                 case SPROTO_TSTRUCT:
34                 case SPROTO_TSTRING:
35                     sz = encode_object(cb, &args, data, size);
36                     break;
37                 }
38             if (sz > 0) {
39                 uint8_t * record;
40                 int tag;
41                 if (value == 0) {
42                     data += sz;
43                     size -= sz;
44                 }
45                 record = header+SIZEOF_HEADER+SIZEOF_FIELD*index;
46                 tag = f->tag - lasttag - 1;
47                 if (tag > 0) {
48                     // skip tag
49                     tag = (tag - 1) * 2 + 1;
50                     if (tag > 0xffff)
51                         return -1;
52                     record[0] = tag & 0xff;
53                     record[1] = (tag >> 8) & 0xff;
54                     ++index;
55                     record += SIZEOF_FIELD;
56                 }
57                 ++index;
58                 record[0] = value & 0xff;
59                 record[1] = (value >> 8) & 0xff;
60                 lasttag = f->tag;
61            }
62        }
63        header[0] = index & 0xff;
64        header[1] = (index >> 8) & 0xff;
datasz = data - (header+header_sz);
data = header +header_sz;

memmove(header + SIZEOF_HEADER + index * SIZEOF_FIELD, data, datasz);
65 }

如果是string或自定义类型,调用encode_object编码,4个参数是:cb,即lsproto.c中encode接口;args,额外参数;data,存放编码结果的缓冲区,由4个字节的长度+具体数据组成;size,缓冲区长度

第9行,填充4字节的长度放到data的首地址处,比如示例中05 00 00 00

第5行,数据从data+SIZEOF_LENGTH开始存放,前4个字节存放数据长度

第26行,如果是字符串,拷贝字符串到指定位置,比如示例中41 6C 69 63 65("Alice")

第31行,如果是自定义类型,对子类型再次调用sproto_encode递归处理

 1 // lualib-src/sproto/sproto.c
 2  static int
 3  encode_object(sproto_callback cb, struct sproto_arg *args, uint8_t *data, int size) {
 4      int sz;
 5      args->value = data+SIZEOF_LENGTH;
 6      args->length = size-SIZEOF_LENGTH;
 7      sz = cb(args);
 8      ...
 9      return fill_size(data, sz);
10  }
11
12  static inline int
13  fill_size(uint8_t * data, int sz) {
14      data[0] = sz & 0xff;
15      data[1] = (sz >> 8) & 0xff;
16      data[2] = (sz >> 16) & 0xff;
17      data[3] = (sz >> 24) & 0xff;
18      return sz + SIZEOF_LENGTH;
19  }
20
21 // lualib-src/sproto/lsproto.c
22 static int
23 encode(const struct sproto_arg *args) {
24     ...
25     case SPROTO_TSTRING: {
26         memcpy(args->value, str, sz);
27         ...
28     }
29     case SPROTO_TSTRUCT: {
30         ...
31         r = sproto_encode(args->subtype, args->value, args->length, encode, &sub);
32     }
33 }

 如果是array类型,调用encode_array进行编码,遍历数组,对每一个元素进行编码,同样把数据长度编码成4个字节填充到前面。例如:

children = {
        { name = "Alice" ,  age = 13 },
        { name = "Carol" ,  age = 5 },
    }
26 00 00 00 (sizeof children)

0F 00 00 00 (sizeof child 1)
02 00 (fn = 2)
00 00 (id = 0, value in data part)
1C 00 (id = 1, value = 13)
05 00 00 00 (sizeof "Alice")
41 6C 69 63 65 ("Alice")

0F 00 00 00 (sizeof child 2)
02 00 (fn = 2)
00 00 (id = 0, value in data part)
0C 00 (id = 1, value = 5)
05 00 00 00 (sizeof "Carol")
43 61 72 6F 6C ("Carol")

注: 如果数组元素是整数,在长度和数据之间会多用一个字节用来标记是小整数(小于2^32)还是大整数,小整数用4个字节(32位)存放,大整数用8个字节(64位)存放,例如:

numbers = { 1,2,3,4,5 }
15 00 00 00 (sizeof numbers)
04 ( sizeof int32 )
01 00 00 00 (1)
02 00 00 00 (2)
03 00 00 00 (3)
04 00 00 00 (4)
05 00 00 00 (5)

小结:编码后的二进制数据块由头部和数据两部分组成。头部包含field总数,以及每个field值。数据部分由长度和具体的数值组成。如果field值为0,表示数据在数据部分(array、string或自定义类型);如果field值最后一位为1,表示该field没数据;否则field值可直接转化对应lua数据(integer或boolean类型)。

 2. decode解码

了解了encode编码过程,decode解码过程就是编码的逆过程,将二进制数据块解码成lua表。5个参数:st,sproto类型的c结构;data和size,待解码的二进制数据块和长度;cb,是一个c接口,即lsproto.c中decode,负责将c类型的数据push到lua虚拟栈里,然后供lua层使用;ud,额外参数,包括cb中需要用的lua虚拟栈。

第9-12行,获取头两字节表示field总数fn,stream指向头部,datastream指向数据块

第17行,对每一个field进行解码

第20行,获取field的值value。如果value最后一位为1,说明之后value/2个tag都没数据(第22-25行);

第26行,计算value的实际值,currentdata指向当前数据块(第27行)。如果小于0,说明是array、string或自定义类型,说明数据在数据部分,计算出数据长度sz,然后把datastream移到下一个field对应的数据块的位置(28-33行)。

第34-37行,找出tag对应的field信息,赋值给args,调用cb时根据args信息进行相应转化。

第61-66行,如果是integer或boolean类型,value即数据本身,调用cb,设置lua虚拟栈指定表的指定key的位置。

第49-58行,如果是string或自定义类型,先从数据部分中获取数据(52行),再调用cb。

第39-42行,如果是array类型,调用decode_array解码

 1 // lualib-src/sproto/sproto.c
 2 int
 3 sproto_decode(const struct sproto_type *st, const void * data, int size, sproto_callback cb, void *ud) {
 4     struct sproto_arg args;
 5     int total = size;
 6     uint8_t * stream;
 7     uint8_t * datastream;
 8     stream = (void *)data;
 9     fn = toword(stream);
10     stream += SIZEOF_HEADER;
11     size -= SIZEOF_HEADER ;
12     datastream = stream + fn * SIZEOF_FIELD;
13     size -= fn * SIZEOF_FIELD;
14     args.ud = ud;
15
16     tag = -1;
17     for (i=0;i<fn;i++) {
18         uint8_t * currentdata;
19         struct field * f;
20         int value = toword(stream + i * SIZEOF_FIELD);
21         ++ tag;
22         if (value & 1) {
23             tag += value/2;
24             continue;
25         }
26         value = value/2 - 1;
27         currentdata = datastream;
28         if (value < 0) {
29             uint32_t sz;
30             sz = todword(datastream);
31             datastream += sz+SIZEOF_LENGTH;
32             size -= sz+SIZEOF_LENGTH;
33         }
34         f = findtag(st, tag);
35
36         args.tagname = f->name;
37         ...
38         if (value < 0) {
39             if (f->type & SPROTO_TARRAY) {
40                 if (decode_array(cb, &args, currentdata)) {
41                     return -1;
42                 }
43             } else {
44                 switch (f->type) {
45                 case SPROTO_TINTEGER: {
46                     ...
47                     break;
48                 }
49                 case SPROTO_TSTRING:
50                 case SPROTO_TSTRUCT: {
51                     uint32_t sz = todword(currentdata);
52                     args.value = currentdata+SIZEOF_LENGTH;
53                     args.length = sz;
54                     if (cb(&args))
55                         return -1;
56                         break;
57                 }
58             }
59         } else if (f->type != SPROTO_TINTEGER && f->type != SPROTO_TBOOLEAN) {
60             return -1;
61         } else {
62             uint64_t v = value;
63             args.value = &v;
64             args.length = sizeof(v);
65             cb(&args);
66         }
67    }
68    return total - size;
69 }

3. pack打包 与unpack解包

将lua表编码成特定的二进制数据块后,再用pack打包。其原理是:每8个字节为一组,打包后由第一个字节+原数据不为0的字节组成,第一个字节的每一位为0时表示原字节为0,否则就是跟随的某个字节。当第一个字节是FF时,有特殊含义,假设下一字节为N,表示接下来(N+1)*8个字节都是原数据。例如:

unpacked (hex):  08 00 00 00 03 00 02 00   19 00 00 00 aa 01 00 00
packed (hex):  51 08 03 02   31 19 aa 01

51 = 0101 0001,从右到左数,表示该组第1,5,7个位置一次是08,03,02,其余位置都是0。

调用sproto_pack打包,4个参数:srcv、srcsz原数据块和长度;bufferv、bufsz存放打包后数据的缓冲区和长度。

第5-6行,ff_srcstart,ff_desstart分别指向ff代表的源地址和目的地址

第11行,8个一组进行打包

第17-19行,不足8个,用0填充

第22行,调用pack_seg,打包成特定格式,存放在buffer里

第33,40行,如果ff_n>0,调用write_ff,按照ff的含义,重新打包,然后存放在buffer里。

 1 int
 2 sproto_pack(const void * srcv, int srcsz, void * bufferv, int bufsz) {
 3     uint8_t tmp[8];
 4     int i;
 5     const uint8_t * ff_srcstart = NULL;
 6     uint8_t * ff_desstart = NULL;
 7     int ff_n = 0;
 8     int size = 0;
 9     const uint8_t * src = srcv;
10     uint8_t * buffer = bufferv;
11     for (i=0;i<srcsz;i+=8) {
12         int n;
13         int padding = i+8 - srcsz;
14         if (padding > 0) {
15             int j;
16             memcpy(tmp, src, 8-padding);
17             for (j=0;j<padding;j++) {
18                 tmp[7-j] = 0;
19             }
20             src = tmp;
21         }
22         n = pack_seg(src, buffer, bufsz, ff_n);
23         bufsz -= n;
24         if (n == 10) {
25             // first FF
26             ff_srcstart = src;
27             ff_desstart = buffer;
28             ff_n = 1;
29         } else if (n==8 && ff_n>0) {
30             ++ff_n;
31             if (ff_n == 256) {
32                 if (bufsz >= 0) {
33                     write_ff(ff_srcstart, ff_desstart, 256*8);
34                 }
35                 ff_n = 0;
36             }
37         } else {
38             if (ff_n > 0) {
39                 if (bufsz >= 0) {
40                     write_ff(ff_srcstart, ff_desstart, ff_n*8);
41                 }
42                 ff_n = 0;
43             }
44         }
45         src += 8;
46         buffer += n;
47         size += n;
48     }
49     if(bufsz >= 0){
50         if(ff_n == 1)
51             write_ff(ff_srcstart, ff_desstart, 8);
52         else if (ff_n > 1)
53             write_ff(ff_srcstart, ff_desstart, srcsz - (intptr_t)(ff_srcstart - (const uint8_t*)srcv));
54     }
55     return size;
56 }

了解打包原理后,解包就是打包的逆过程,变得很容易了。调用sproto_unpack解包:

第11-27行,如果第一个字节是ff,计算出可直接拷贝的字节数n,然后拷贝到buffer。

第30-50行,计算第一个字节的每一位(总共8位),如果是1,复制跟随的一个字节给buffer(32-41行);否则,设置buffer为0(42-49行)。

 1 // lualib-src/sproto/sproto.c
 2 int
 3 sproto_unpack(const void * srcv, int srcsz, void * bufferv, int bufsz) {
 4     const uint8_t * src = srcv;
 5     uint8_t * buffer = bufferv;
 6     int size = 0;
 7     while (srcsz > 0) {
 8         uint8_t header = src[0];
 9         --srcsz;
10         ++src;
11         if (header == 0xff) {
12             int n;
13             if (srcsz < 0) {
14                 return -1;
15             }
16             n = (src[0] + 1) * 8;
17             if (srcsz < n + 1)
18                 return -1;
19             srcsz -= n + 1;
20             ++src;
21             if (bufsz >= n) {
22                 memcpy(buffer, src, n);
23              }
24              bufsz -= n;
25              buffer += n;
26              src += n;
27              size += n;
28          } else {
29              int i;
30              for (i=0;i<8;i++) {
31                  int nz = (header >> i) & 1;
32                  if (nz) {
33                      if (srcsz < 0)
34                          return -1;
35                      if (bufsz > 0) {
36                          *buffer = *src;
37                           --bufsz;
38                           ++buffer;
39                       }
40                       ++src;
41                       --srcsz;
42                   } else {
43                       if (bufsz > 0) {
44                           *buffer = 0;
45                           --bufsz;
46                           ++buffer;
47                       }
48                   }
49                   ++size;
50               }
51         }
52     }
53     return size;
54 }

sproto协议是为lua量身定制的,非常适合用lua为脚本语言的框架。

04-19 06:09