com.hankcs.hanlp.corpus.dictionary
类 CommonSuffixExtractor

java.lang.Object
  继承者 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor

public class CommonSuffixExtractor
extends Object

公共后缀提取工具

作者:
hankcs

构造方法摘要
CommonSuffixExtractor()
           
 
方法摘要
 void add(String key)
           
 List<String> extractSuffix(int length, int size, boolean extend)
          提取公共后缀
 List<String> extractSuffixByWords(int length, int size, boolean extend)
          此方法认为后缀一定是整个的词语,所以length是以词语为单位的
 List<String> extractSuffixExtended(int length, int size)
           
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

构造方法详细信息

CommonSuffixExtractor

public CommonSuffixExtractor()
方法详细信息

add

public void add(String key)

extractSuffixExtended

public List<String> extractSuffixExtended(int length,
                                          int size)

extractSuffix

public List<String> extractSuffix(int length,
                                  int size,
                                  boolean extend)
提取公共后缀

参数:
length - 公共后缀长度
size - 频率最高的前多少个公共后缀
extend - 长度是否拓展为从1到length为止的后缀
返回:
公共后缀列表

extractSuffixByWords

public List<String> extractSuffixByWords(int length,
                                         int size,
                                         boolean extend)
此方法认为后缀一定是整个的词语,所以length是以词语为单位的

参数:
length -
size -
extend -
返回:


Copyright © 2014–2015 鐮佸啘鍦�/a>. All rights reserved.