java中文词语相似,【转】 一个使用WordNet比较词语相似度的Java包——JWS(Java WordNet Similarity)…

  • Post author:
  • Post category:java


JWS是WordNet::Similarity(一个Perl版的WordNet相似度比较包)的Java实现版本,想用Java实现用WordNet比较词语相似度的朋友有福拉!!简述使用步骤:

4、安装WordNet;

5、解压WordNet-InfoContent-2.1,并将文件夹拷贝至WordNet目录D:/Program Files/WordNet/2.1下;

6、将JWS中的两个jar包:edu.mit.jwi_2.1.4.jar和edu.sussex.nlp.jws.beta.11.jar拷贝至Java的lib目录下,并设置环境变量;

7、在Eclipse下运行JWS中的例子程序:TestExamples

说明:由于下载的WordNet是2.1版本的,所以程序中有几处需要修改

String dir = “C:/Program Files/WordNet”;    //这里指定WordNet的安装路径,按照你实际安装的路径加以修改

JWS ws = new JWS(dir, “3.0”);                   //把3.0改为2.1即可

8、例子运行结果:

Loading modules

set up:

… finding noun and verb

… calculating IC …

… ICFinder

… DepthFinder

… PathFinder

… JiangAndConrath

… Lin

… Resnik

… Path

… WuAndPalmer

… Adapted Lesk : all relations

… Adapted Lesk (1)

… Adapted Lesk (2)

… HirstAndStOnge

… LeacockAndChodorow

… calculating depths of …

Java WordNet::Similarity using WordNet 2.1 : loaded

Jiang & Conrath

apple#n#1,banana#n#1 0.04658846107981151

apple#n#1,banana#n#2 0.13115409462626942

apple#n#2,banana#n#1 0.0

apple#n#2,banana#n#2 0.0

specific pair = 0.04658846107981151

highest score = 0.13115409462626942

Lin

apple#n#1,banana#n#1 0.11802556069890623

apple#n#1,banana#n#2 0.6867056880240358

apple#n#2,banana#n#1 0.0

apple#n#2,banana#n#2 0.0

specific pair = 0.11802556069890623

highest score = 0.6867056880240358

具体还在学习中,先记录这些,权当笔记了。