├── WordNet.java ├── wordnet └── HiWordNet.java ├── StanfordCollocationFinder.java └── README.md /WordNet.java: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/lihait/CollocationFinder/HEAD/WordNet.java -------------------------------------------------------------------------------- /wordnet/HiWordNet.java: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/lihait/CollocationFinder/HEAD/wordnet/HiWordNet.java -------------------------------------------------------------------------------- /StanfordCollocationFinder.java: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/lihait/CollocationFinder/HEAD/StanfordCollocationFinder.java -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # CollocationFinder 2 | 基于WordNet和句法依存树,实现对英语短语的搭配提取,包括连续的和非连续的英语短语词组。 3 | 连续的提取可以是任意长度的。非连续的对句法分析得到的任意长的词组,只提取长度为2的非连续词组。 4 | StanfordCollocationFinder.java是入口函数,主要是根据句法分析的结果得到词组搭配的结果。并与WordNet建立连接。 5 | WordNet.java是判断短语搭配是否在WordNet中,并返回提取出的词组。 6 | 7 | 输入:需要提取短语的文件目录 8 | 输出:连续和非连续短语提取的结果文件 9 | --------------------------------------------------------------------------------