com.hankcs.hanlp.corpus.document
类 Document

java.lang.Object
  继承者 com.hankcs.hanlp.corpus.document.Document
所有已实现的接口:
Serializable

public class Document
extends Object
implements Serializable

作者:
hankcs
另请参见:
序列化表格

字段摘要
 List<Sentence> sentenceList
           
 
构造方法摘要
Document(List<Sentence> sentenceList)
           
 
方法摘要
static Document create(String param)
           
 List<List<IWord>> getComplexSentenceList()
          获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词
 List<List<Word>> getSimpleSentenceList()
          获取简单的句子列表,其中复合词会被拆分为简单词
 List<List<Word>> getSimpleSentenceList(boolean spilt)
          获取简单的句子列表
 List<List<Word>> getSimpleSentenceList(Set<String> labelSet)
          获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词
 List<Word> getSimpleWordList()
           
 List<IWord> getWordList()
          获取单词序列
 String toString()
           
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, wait, wait, wait
 

字段详细信息

sentenceList

public List<Sentence> sentenceList
构造方法详细信息

Document

public Document(List<Sentence> sentenceList)
方法详细信息

create

public static Document create(String param)

getWordList

public List<IWord> getWordList()
获取单词序列

返回:

getSimpleWordList

public List<Word> getSimpleWordList()

getSimpleSentenceList

public List<List<Word>> getSimpleSentenceList()
获取简单的句子列表,其中复合词会被拆分为简单词

返回:

getComplexSentenceList

public List<List<IWord>> getComplexSentenceList()
获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词

返回:

getSimpleSentenceList

public List<List<Word>> getSimpleSentenceList(boolean spilt)
获取简单的句子列表

参数:
spilt - 如果为真,其中复合词会被拆分为简单词
返回:

getSimpleSentenceList

public List<List<Word>> getSimpleSentenceList(Set<String> labelSet)
获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词

参数:
labelSet -
返回:

toString

public String toString()
覆盖:
Object 中的 toString


Copyright © 2014–2015 码农场. All rights reserved.