com.hankcs.hanlp.summary
类 TextRankKeyword

java.lang.Object
  继承者 com.hankcs.hanlp.summary.KeywordExtractor
      继承者 com.hankcs.hanlp.summary.TextRankKeyword

public class TextRankKeyword
extends KeywordExtractor

基于TextRank算法的关键字提取,适用于单文档

作者:
hankcs

构造方法摘要
TextRankKeyword()
           
 
方法摘要
 List<String> getKeyword(String content)
          提取关键词
static List<String> getKeywordList(String document, int size)
          提取关键词
 Map<String,Float> getRank(List<Term> termList)
          使用已经分好的词来计算rank
 Map<String,Float> getTermAndRank(String content)
          返回全部分词结果和对应的rank
 Map<String,Float> getTermAndRank(String content, Integer size)
          返回分数最高的前size个分词结果和对应的rank
 
从类 com.hankcs.hanlp.summary.KeywordExtractor 继承的方法
setSegment, shouldInclude
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

构造方法详细信息

TextRankKeyword

public TextRankKeyword()
方法详细信息

getKeywordList

public static List<String> getKeywordList(String document,
                                          int size)
提取关键词

参数:
document - 文档内容
size - 希望提取几个关键词
返回:
一个列表

getKeyword

public List<String> getKeyword(String content)
提取关键词

参数:
content -
返回:

getTermAndRank

public Map<String,Float> getTermAndRank(String content)
返回全部分词结果和对应的rank

参数:
content -
返回:

getTermAndRank

public Map<String,Float> getTermAndRank(String content,
                                        Integer size)
返回分数最高的前size个分词结果和对应的rank

参数:
content -
size -
返回:

getRank

public Map<String,Float> getRank(List<Term> termList)
使用已经分好的词来计算rank

参数:
termList -
返回:


Copyright © 2014–2015 鐮佸啘鍦�/a>. All rights reserved.