|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||
java.lang.Objectcom.hankcs.hanlp.dictionary.CustomDictionary
public class CustomDictionary
用户自定义词典
| 字段摘要 | |
|---|---|
static DoubleArrayTrie<CoreDictionary.Attribute> |
dat
|
static String[] |
path
第一个是主词典,其他是副词典 |
static BinTrie<CoreDictionary.Attribute> |
trie
用于储存用户动态插入词条的二分trie树 |
| 构造方法摘要 | |
|---|---|
CustomDictionary()
|
|
| 方法摘要 | |
|---|---|
static boolean |
add(String word)
往自定义词典中插入一个新词(非覆盖模式) |
static boolean |
add(String word,
String natureWithFrequency)
往自定义词典中插入一个新词(非覆盖模式) |
static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> |
commonPrefixSearch(char[] chars,
int begin)
前缀查询 |
static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> |
commonPrefixSearch(String key)
前缀查询 |
static boolean |
contains(String key)
词典中是否含有词语 |
static CoreDictionary.Attribute |
get(String key)
查单词 |
static BaseSearcher |
getSearcher(char[] charArray)
获取一个BinTrie的查询工具 |
static BaseSearcher |
getSearcher(String text)
|
static BinTrie<CoreDictionary.Attribute> |
getTrie()
已过时。 谨慎操作,有可能废弃此接口 |
static boolean |
insert(String word)
以覆盖模式增加新词 |
static boolean |
insert(String word,
String natureWithFrequency)
往自定义词典中插入一个新词(覆盖模式) |
static boolean |
load(String path,
Nature defaultNature,
TreeMap<String,CoreDictionary.Attribute> map)
加载用户词典(追加) |
static void |
parseText(char[] text,
AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute> processor)
解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构) |
static void |
remove(String key)
删除单词 |
String |
toString()
|
| 从类 java.lang.Object 继承的方法 |
|---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, wait, wait, wait |
| 字段详细信息 |
|---|
public static BinTrie<CoreDictionary.Attribute> trie
public static DoubleArrayTrie<CoreDictionary.Attribute> dat
public static final String[] path
| 构造方法详细信息 |
|---|
public CustomDictionary()
| 方法详细信息 |
|---|
public static boolean load(String path,
Nature defaultNature,
TreeMap<String,CoreDictionary.Attribute> map)
path - 词典路径defaultNature - 默认词性
public static boolean add(String word,
String natureWithFrequency)
word - 新词 如“裸婚”natureWithFrequency - 词性和其对应的频次,比如“nz 1 v 2”,null时表示“nz 1”
public static boolean add(String word)
word - 新词 如“裸婚”
public static boolean insert(String word,
String natureWithFrequency)
word - 新词 如“裸婚”natureWithFrequency - 词性和其对应的频次,比如“nz 1 v 2”,null时表示“nz 1”。
public static boolean insert(String word)
word -
public static CoreDictionary.Attribute get(String key)
key -
public static void remove(String key)
key - public static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> commonPrefixSearch(String key)
key -
public static LinkedList<Map.Entry<String,CoreDictionary.Attribute>> commonPrefixSearch(char[] chars,
int begin)
chars - begin -
public static BaseSearcher getSearcher(String text)
public String toString()
Object 中的 toStringpublic static boolean contains(String key)
key - 词语
public static BaseSearcher getSearcher(char[] charArray)
charArray - 文本
public static BinTrie<CoreDictionary.Attribute> getTrie()
public static void parseText(char[] text,
AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute> processor)
text - 文本processor - 处理器
|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||