量’这几个字。
\n
这是之前陆长歌和周霜提到过的一个需要攻坚的技术。
\n
流量不控制好,什么都别谈了。
\n
并且陆长歌记得早起文字聊天并不耗费流量,别的厂家开发的软件能做到,他们做不到,这太致命。
\n
所以他很关心这一点,今天是再一次和他们提起来,说:“你看到那个测出来的结果没有,我们每条消息平均要218个字节,edge网络下发送要3秒,太慢了。”
\n
惠传坤推了推眼镜,“你第一天提出这个以后,我就很在意。我仔细看了,光时间戳字段就占15字节,xml标签冗余太严重。我提议改用二进制协议?”
\n
余娜蹙着眉头有些顾虑,“可是xmpp标准里规定用xml传输,我们改协议会不会影响兼容性?”
\n
“绕过它好了……外层保持xml结构过gfw检测,内层消息体做三重压缩,把utf-8转成自定义gbk子集、再用哈夫曼编码高频词。我测试过,中文‘你好’原占6字节,用gbk子集压到3字节,但可惜英文效果差,像‘hello’只能从5压到4。”
\n
陆长歌知道,惠传坤肯定给自己加工作量了,否则这个老实人不敢讲的。
\n
周霜也深深看了他一眼,问道:“英文效果差,有解决办法吗?”
\n
惠传坤面对众人的目光又拘谨起来,“我……我想过把键盘布局绑定进去,九宫格输入法每个数字对应多个字母,比如按2键可能选a/b/c,咱们传输时只传数字代码…然后做动态字典,统计用户前100条消息的高频词生成专属词库,第一次登录时下发到本地。”
\n
“好思路!其实可以分阶段实施,1.0版先用静态字典压缩到120字节,等用户量过百万再启用动态算法,只是还需要写压缩组件……”
\n&nb
本章未完,请点击下一页继续阅读! 第2页 / 共8页