|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||
java.lang.Objectcom.hankcs.hanlp.tokenizer.NotionalTokenizer
public class NotionalTokenizer
实词分词器,自动移除停用词
| 构造方法摘要 | |
|---|---|
NotionalTokenizer()
|
|
| 方法摘要 | |
|---|---|
static List<List<Term>> |
seg2sentence(String text)
切分为句子形式 |
static List<List<Term>> |
seg2sentence(String text,
Filter... filterArrayChain)
切分为句子形式 |
static List<Term> |
segment(char[] text)
分词 |
static List<Term> |
segment(String text)
|
| 从类 java.lang.Object 继承的方法 |
|---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
| 构造方法详细信息 |
|---|
public NotionalTokenizer()
| 方法详细信息 |
|---|
public static List<Term> segment(String text)
public static List<Term> segment(char[] text)
text - 文本
public static List<List<Term>> seg2sentence(String text)
text -
public static List<List<Term>> seg2sentence(String text,
Filter... filterArrayChain)
text - filterArrayChain - 自定义过滤器链
|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||