|
阅读:12回复:0
发现一个汉字过滤的特性
设置“汉字过滤”为“过滤”时,根据帮助里的说明:
“有个例外情况,就是你打了一个编码,这个编码在过滤之后是空码,但里面有生僻字,程序就自动关掉了生僻字过滤功能,这就是为什么经常能看到生僻字出现在候选中的原因了。” 但在实际使用中发现有些特殊情况。在编码过滤后是空码的时候,有些生僻字在候选框中并不会显示。比如在拼音输入法下“biang ????(扩展G U+30EDE)”输入 biang 的时候并不会在候选框中显示“????”。进一步尝试,当设置“汉字过滤”为“不过滤”时,在拼音输入法下“biang ????(扩展G U+30EDE)”输入 biang 也不会在候选框中显示“????”,只有在输入 biang 后在按汉字过滤快捷键时才会显示这个字。查找资料发现 biang 并不是一个“标准”的拼音,????不在于GB18030字符集中。这里初步得出一个结论:yong输入法的汉字过滤功能,默认过滤的是规范汉字表中的一二级6500汉字。其余的生僻字指GB18030字符集中除了规范汉字表中一二级6500汉字之外的字。至于拼音输入法中用了非“标准”拼音,这个应该没啥影响,依据是码表中能够添加类似 date 这种不是拼音的编码。 |
|