阅读:13706回复:22

小小的遗憾?

楼主#
更多 发布于:2014-01-16 17:36
小小坚持使用 GB18030 编码,从维护小小输入法的个头来讲有意义,却使得小小在强大方面受损。比如很多字小小打不出来,而我的码表里有这些字,这些字不能正常打出来的原因是受到 GB18030 编码的限制,它们都变成了 “??”。小小的文档称小小支持 UTF-8 编码,那么,如果我的码表改为 UTF-8 如何?可以打出这些字了,不过将来某个时候小小又要打不出来,因为我总得优化和合并码表,小小的工具会将我的码表又改回 GB18030 编码格式。这是个问题,也是个小小的遗憾。


这个问题和遗憾对于不用到 GBK 以外的汉字的朋友来说倒是无所谓,不过词典也限用 GB18030 编码,我个人觉得这就不太恰当了。词典不可回避生僻字,GB不支持的字总会有的。而且,词典说白了也就是一个显示界面,Unicode 要比 GB 强大,支持一下它为什么不可以呢?
沙发#
发布于:2014-01-16 21:25
dgod:从来没有unicode比gb强大这回事,gb18030编码也没有什么限制,提问题之前请详细去了解一下这些编码的情况。回到原帖
这要看理解的角度。我对编码了多少有几分了解。从事实上看,Unicode能正常显示的汉字,gb编码的未必,反之则没有这回事。
板凳#
发布于:2014-01-16 21:32
不管怎么说吧,utf-8编码的确要比gb18030编码好用。gb18030即使是装现代汉语词典,也会有很多问号,utf-8就不会,非常完整。小小既然可以支持utf-8,为什么仅仅支持原始码表而不向前走一小步?
地板#
发布于:2014-01-16 21:44
老大对GB18030情有独钟,我也喜欢GB18030。可事实上GB和UTF-8相比,不得不承认有一定的差距。


描述:gb18030

图片:gb18030.PNG

gb18030

描述:utf-8

图片:utf-8.PNG

utf-8
4楼#
发布于:2014-01-16 23:14
老大误会了。你看9楼那个字,亲自测一下吧。你的永码没有这个字,而我们做的码表,这类字有200多个,必需得用utf-8编码存放。
我们没有必要为难你,也不会诋毁小小,我们承认小小很优秀,在使用中发现问题才来这里讨论,并非自说自话,还请理解。
5楼#
发布于:2014-01-17 19:08
看了12楼龘游弋朋友的回复,我再仔细地检查了一下,我承认,问题出在我自己对码表的操作上:刚使用小小之初,我按照说明把UTF-8的码表转存为GB18030,用的是EmEditor编辑器,是这次转存行为导致了200多个汉字变为双问号,与小小确实无关!
我又进一步测试:使用UTF-8当作原始码表,经小小合并和优化后,码表的编码格式确实变成了GB18030,但不影响输入法的正常使用,可见小小在编码转换方面功夫实在过硬(怪不得老大在10楼用那样的语气跟我说话(*_*)!不过,如果使用第三方文本编辑器对码表进行编辑,保存后那200多个汉字将不能在小小输入法中正确打出。因此还是建议:

如果用户的编码是UTF-8的,优化和合并用户码表时可考虑继续使用该编码,以方便用户能够使用第三方文本编辑器进行编辑。
游客

返回顶部