阅读:16671回复:22

小小的遗憾?

楼主#
更多 发布于:2014-01-16 17:36
小小坚持使用 GB18030 编码,从维护小小输入法的个头来讲有意义,却使得小小在强大方面受损。比如很多字小小打不出来,而我的码表里有这些字,这些字不能正常打出来的原因是受到 GB18030 编码的限制,它们都变成了 “??”。小小的文档称小小支持 UTF-8 编码,那么,如果我的码表改为 UTF-8 如何?可以打出这些字了,不过将来某个时候小小又要打不出来,因为我总得优化和合并码表,小小的工具会将我的码表又改回 GB18030 编码格式。这是个问题,也是个小小的遗憾。


这个问题和遗憾对于不用到 GBK 以外的汉字的朋友来说倒是无所谓,不过词典也限用 GB18030 编码,我个人觉得这就不太恰当了。词典不可回避生僻字,GB不支持的字总会有的。而且,词典说白了也就是一个显示界面,Unicode 要比 GB 强大,支持一下它为什么不可以呢?
沙发#
发布于:2014-01-16 17:50
从来没有unicode比gb强大这回事,gb18030编码也没有什么限制,提问题之前请详细去了解一下这些编码的情况。
mpk
mpk
新手上路
新手上路
板凳#
发布于:2014-01-16 20:26
默认的ANSI编码格式的txt,无法支持完整的GB18030,甚至连GBK内的部分字也丢。如:
mpk
mpk
新手上路
新手上路
地板#
发布于:2014-01-16 20:27
希望可以引起重视,让码表调频以及合并码表后自动生成的txt保存为UTF-8编码格式。
mpk
mpk
新手上路
新手上路
4楼#
发布于:2014-01-16 20:36
dgod:从来没有unicode比gb强大这回事,gb18030编码也没有什么限制,提问题之前请详细去了解一下这些编码的情况。回到原帖
希望可以引起重视,让码表调频以及合并码表后自动生成的txt保存为UTF-8编码格式。默认的ANSI无法支持18030仅支持到GBK。用户词库部分一经调频,合并合,就丢字,都是??号
5楼#
发布于:2014-01-16 21:20
该说的已经说过,你不想听或不理解,我也不想重复
6楼#
发布于:2014-01-16 21:25
dgod:从来没有unicode比gb强大这回事,gb18030编码也没有什么限制,提问题之前请详细去了解一下这些编码的情况。回到原帖
这要看理解的角度。我对编码了多少有几分了解。从事实上看,Unicode能正常显示的汉字,gb编码的未必,反之则没有这回事。
7楼#
发布于:2014-01-16 21:29
大醉猫:这要看理解的角度。我对编码了多少有几分了解。从事实上看,Unicode能正常显示的汉字,gb编码的未必,反之则没有这回事。回到原帖
随便你
8楼#
发布于:2014-01-16 21:32
不管怎么说吧,utf-8编码的确要比gb18030编码好用。gb18030即使是装现代汉语词典,也会有很多问号,utf-8就不会,非常完整。小小既然可以支持utf-8,为什么仅仅支持原始码表而不向前走一小步?
9楼#
发布于:2014-01-16 21:44
老大对GB18030情有独钟,我也喜欢GB18030。可事实上GB和UTF-8相比,不得不承认有一定的差距。


描述:gb18030

图片:gb18030.PNG

gb18030

描述:utf-8

图片:utf-8.PNG

utf-8
上一页
游客

返回顶部