|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||
java.lang.Objectcom.hankcs.hanlp.corpus.document.Document
public class Document
| 字段摘要 | |
|---|---|
List<Sentence> |
sentenceList
|
| 构造方法摘要 | |
|---|---|
Document(List<Sentence> sentenceList)
|
|
| 方法摘要 | |
|---|---|
static Document |
create(String param)
|
List<List<IWord>> |
getComplexSentenceList()
获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词 |
List<List<Word>> |
getSimpleSentenceList()
获取简单的句子列表,其中复合词会被拆分为简单词 |
List<List<Word>> |
getSimpleSentenceList(boolean spilt)
获取简单的句子列表 |
List<List<Word>> |
getSimpleSentenceList(Set<String> labelSet)
获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词 |
List<Word> |
getSimpleWordList()
|
List<IWord> |
getWordList()
获取单词序列 |
String |
toString()
|
| 从类 java.lang.Object 继承的方法 |
|---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, wait, wait, wait |
| 字段详细信息 |
|---|
public List<Sentence> sentenceList
| 构造方法详细信息 |
|---|
public Document(List<Sentence> sentenceList)
| 方法详细信息 |
|---|
public static Document create(String param)
public List<IWord> getWordList()
public List<Word> getSimpleWordList()
public List<List<Word>> getSimpleSentenceList()
public List<List<IWord>> getComplexSentenceList()
public List<List<Word>> getSimpleSentenceList(boolean spilt)
spilt - 如果为真,其中复合词会被拆分为简单词
public List<List<Word>> getSimpleSentenceList(Set<String> labelSet)
labelSet -
public String toString()
Object 中的 toString
|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||