成语大全网 - 汉语词典 - word分词器分的词怎么都是一个词

word分词器分的词怎么都是一个词

我们知道,Word中的words对象是Word可以识别的词语,对于汉语词语来说,有的词语和我们的习惯并不完全相符。简单的说就是有的词语在Word

中被认为是一个词语,如 阿波罗 ,有的词语被识别为多个词语,如 一字之差

。这样的差别就是Word在分词方面的bug。下面就谈谈如何实现对Word汉语分词自定义。

首先特别要感谢Excelhome论坛sylun兄。之前我还一直固执地认为Word只支持导入英文词典,对于中文词语不支持自定义,是这位哥哥告诉我,可以通过导入微软拼音输入法自造词实现自定义分词效果。我的工作其实就是想办法把这个效果的实现更简单一些:不再必须安装庞大的微软拼音输入法,且一经导入制作的自造词在用户间可以简单实现通用。

效果如下:

1、 首先不做任何操作,打开测试文档,点击“统计每段词语数”看看结果。不保存关闭文档。

2、 运行Word自造词工具.exe,点击修改按钮。

3、 再次打开测试文档,点击“统计每段词语数”看看结果。两次结果是否相同。

原来每一段都被自定义成了一个词语。(回车符除外)