com.hankcs.hanlp.algoritm.ahocorasick.trie
类 Trie

java.lang.Object
  继承者 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie

public class Trie
extends Object

基于 Aho-Corasick 白皮书, 贝尔实验室: ftp://163.13.200.222/assistant/bearhero/prog/%A8%E4%A5%A6/ac_bm.pdf

作者:
Robert Bor

嵌套类摘要
static interface Trie.IWalker
           
 
构造方法摘要
Trie()
           
Trie(TrieConfig trieConfig)
          构造一棵trie树
 
方法摘要
 void addAllKeyword(Collection<String> keywordSet)
           
 void addKeyword(String keyword)
           
 void dfs(Trie.IWalker walker)
           
 Collection<Emit> parseText(String text)
          模式匹配
 Trie remainLongest()
          只保留最长匹配
 Trie removeOverlaps()
           
 Collection<Token> tokenize(String text)
          一个最长分词器
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

构造方法详细信息

Trie

public Trie(TrieConfig trieConfig)
构造一棵trie树


Trie

public Trie()
方法详细信息

removeOverlaps

public Trie removeOverlaps()

remainLongest

public Trie remainLongest()
只保留最长匹配

返回:

addKeyword

public void addKeyword(String keyword)

addAllKeyword

public void addAllKeyword(Collection<String> keywordSet)

tokenize

public Collection<Token> tokenize(String text)
一个最长分词器

参数:
text - 待分词文本
返回:

parseText

public Collection<Emit> parseText(String text)
模式匹配

参数:
text - 待匹配的文本
返回:
匹配到的模式串

dfs

public void dfs(Trie.IWalker walker)


Copyright © 2014–2015 码农场. All rights reserved.