|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||
java.lang.Objectcom.hankcs.hanlp.algoritm.ahocorasick.trie.Trie
public class Trie
基于 Aho-Corasick 白皮书, 贝尔实验室: ftp://163.13.200.222/assistant/bearhero/prog/%A8%E4%A5%A6/ac_bm.pdf
| 嵌套类摘要 | |
|---|---|
static interface |
Trie.IWalker
|
| 构造方法摘要 | |
|---|---|
Trie()
|
|
Trie(TrieConfig trieConfig)
构造一棵trie树 |
|
| 方法摘要 | |
|---|---|
void |
addAllKeyword(Collection<String> keywordSet)
|
void |
addKeyword(String keyword)
|
void |
dfs(Trie.IWalker walker)
|
Collection<Emit> |
parseText(String text)
模式匹配 |
Trie |
remainLongest()
只保留最长匹配 |
Trie |
removeOverlaps()
|
Collection<Token> |
tokenize(String text)
一个最长分词器 |
| 从类 java.lang.Object 继承的方法 |
|---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
| 构造方法详细信息 |
|---|
public Trie(TrieConfig trieConfig)
public Trie()
| 方法详细信息 |
|---|
public Trie removeOverlaps()
public Trie remainLongest()
public void addKeyword(String keyword)
public void addAllKeyword(Collection<String> keywordSet)
public Collection<Token> tokenize(String text)
text - 待分词文本
public Collection<Emit> parseText(String text)
text - 待匹配的文本
public void dfs(Trie.IWalker walker)
|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||