跳过导航链接
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z _ 

A

A - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
bad case
AbstractDependencyParser - com.hankcs.hanlp.dependency中的类
 
AbstractDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.AbstractDependencyParser
 
AbstractInexactAction - com.hankcs.hanlp.dependency.nnparser.action中的类
 
AbstractInexactAction() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
 
Action - com.hankcs.hanlp.dependency.nnparser.action中的类
 
Action() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.Action
 
Action(int, int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.Action
创建动作
ActionFactory - com.hankcs.hanlp.dependency.nnparser.action中的类
 
ActionFactory() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
 
ActionType - com.hankcs.hanlp.dependency.nnparser.action中的接口
arc-standard system (Nivre, 2004) 用到的动作,类似于 Yamada 和 Matsumoto 提出的分析动作
ActionUtils - com.hankcs.hanlp.dependency.nnparser.action中的类
 
ActionUtils() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.ActionUtils
 
ada_alpha - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
ada_eps - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
AdaOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
AdaOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.AdaOption
 
add(E) - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
添加一个元素
add(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
add(SString) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
add(String) - 类 中的方法com.hankcs.hanlp.collection.set.UnEmptyStringSet
 
add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
 
add(IWord) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
向词典中加入一个词语
add(String, String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
add(Item) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
插入条目
add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
add(String, V) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
向中加入单词
add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
添加一个词语
add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
 
add(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermOccurrence
 
add(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
往自定义词典中插入一个新词(非覆盖模式)
动态增删不会持久化到词典文件
add(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
往自定义词典中插入一个新词(非覆盖模式)
动态增删不会持久化到词典文件
add(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
加入停用词到停用词词典中
add(int, char[]...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
add(int, Collection<char[]>) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
add(int, Vertex) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
添加顶点
add(int, List<AtomNode>) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
添加顶点,由原子分词顶点添加
addAll(Collection<E>) - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
添加许多元素
addAll(Collection<? extends String>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
addAll(List<Item>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
插入全部条目
addAll(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
 
addAll(String[]) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
 
addAll(String[]) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
addAll(List<Term>) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
addAll(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
addAll(List<String>) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermOccurrence
 
addAll(List<Vertex>) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
全自动添加顶点
addAllKeyword(Collection<String>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
 
addAllNotCombine(List<Item>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
插入新条目,不执行合并
addByValue(E) - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
This method adds the given enum into the array inside the enum class.
addChild(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
添加子节点
addChild(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
addChild(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.Node
 
addEmit(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
添加一个匹配到的模式串(这个状态对应着这个模式串)
addEmit(Collection<String>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
添加一些匹配到的模式串
addEmit(int) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
添加一个匹配到的模式串(这个状态对应着这个模式串)
addEmit(Collection<Integer>) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
添加一些匹配到的模式串
addKeyword(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
 
addLabel(E) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
addLabel(E, Integer) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
addLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
addLabel(String, Integer) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
添加一个标签和频次
addNature(String) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CustomNatureUtility
增加词性
addNotCombine(Item) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
插入条目,但是不合并,如果已有则忽略
addOutgoingTransition(char, boolean) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
新建一个转移目标
Creates an outgoing _transition labeled with a given char that has a new node as its target.
addOutgoingTransition(char, MDAGNode) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
建立一条边(起点是自己)
addPair(IWord, IWord) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
 
addPair(String, String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
添加一个转移例子,会在内部完成统计
addPair(String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
添加一个共现
addSentence(String) - 接口 中的方法com.hankcs.hanlp.suggest.ISuggester
 
addSentence(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
 
addSentence(String) - 接口 中的方法com.hankcs.hanlp.suggest.scorer.IScorer
输入一个候选句子
addSentence(String) - 类 中的方法com.hankcs.hanlp.suggest.Suggester
 
addState(Character) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
 
addState(Character) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
 
addString(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
Adds a string to the MDAG.
addStrings(Collection<String>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
Adds a Collection of Strings to the MDAG.
addTerm(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
统计词频
addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
加入到词典中,允许子类自定义过滤等等,这样比较灵活
addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker
 
addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker
 
addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker
 
addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker
 
addToOverlaps(Intervalable, List<Intervalable>, List<Intervalable>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
添加到重叠区间列表中
addTria(String, String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
AhoCorasickDoubleArrayTrie<V> - com.hankcs.hanlp.collection.AhoCorasick中的类
基于双数组Trie树的AhoCorasick自动机
AhoCorasickDoubleArrayTrie() - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
 
AhoCorasickDoubleArrayTrie.Hit<V> - com.hankcs.hanlp.collection.AhoCorasick中的类
一个命中结果
AhoCorasickDoubleArrayTrie.IHit<V> - com.hankcs.hanlp.collection.AhoCorasick中的接口
命中一个模式串的处理方法
AhoCorasickDoubleArrayTrie.IHitFull<V> - com.hankcs.hanlp.collection.AhoCorasick中的接口
 
AhoCorasickDoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other中的类
使用AhoCorasickDoubleArrayTrie实现的最长分词器
需要用户调用setTrie()提供一个AhoCorasickDoubleArrayTrie
AhoCorasickDoubleArrayTrieSegment() - 类 的构造器com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
 
Alphabet - com.hankcs.hanlp.dependency.nnparser中的类
int 到 String 的双向map
Alphabet() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Alphabet
 
apply(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
对分词结果应用过滤
ArrayCompare - com.hankcs.hanlp.algorithm中的类
比较两个数组
ArrayCompare() - 类 的构造器com.hankcs.hanlp.algorithm.ArrayCompare
 
ArrayDistance - com.hankcs.hanlp.algorithm中的类
求两个集合中最相近的两个数
ArrayDistance() - 类 的构造器com.hankcs.hanlp.algorithm.ArrayDistance
 
arrayLeftDivide(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Element-by-element left division, C = A.
arrayLeftDivideEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Element-by-element left division in place, A = A.
arrayRightDivide(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Element-by-element right division, C = A.
arrayRightDivideEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Element-by-element right division in place, A = A.
arrayTimes(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Element-by-element multiplication, C = A.
arrayTimesEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Element-by-element multiplication in place, A = A.
ArrayTool - com.hankcs.hanlp.collection.trie.bintrie.util中的类
 
ArrayTool() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool
 
AtomNode - com.hankcs.hanlp.seg.NShort.Path中的类
原子分词节点
AtomNode(String, int) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.AtomNode
 
AtomNode(char, int) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.AtomNode
 
atomSegment(char[]) - 类 中的静态方法com.hankcs.hanlp.seg.CRF.CRFSegment
 
atomSegment(char[], int, int) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
原子分词
atomSegmentToTable(char[]) - 类 中的静态方法com.hankcs.hanlp.seg.CRF.CRFSegment
 
Attribute(int) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
 
Attribute(Nature[], int[]) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
 
Attribute(Nature, int) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
 
Attribute(Nature) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
使用单个词性,默认词频1000构造
Attribute(int) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
Attribute(Nature[], int[]) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
Attribute(Nature, int) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
Attribute(Nature[], int[], int) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
Attribute(Nature) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
使用单个词性,默认词频1000构造
ATTRIBUTE - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.NRConstant
本词典专注的词的属性
ATTRIBUTE - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
 
attribute - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
词的属性,谨慎修改属性内部的数据,因为会影响到字典
如果要修改,应当new一个Attribute

B

b - 类 中的变量com.hankcs.hanlp.collection.sequence.SString
开始位置,包含
B - 类 中的静态变量com.hankcs.hanlp.seg.common.Vertex
始##始
base - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
双数组之base
base - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
BaseChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
 
BaseChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
 
BaseChineseDictionary.Searcher - com.hankcs.hanlp.dictionary.ts中的类
最长分词
baseName(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
BaseNode<V> - com.hankcs.hanlp.collection.trie.bintrie中的类
节点,统一Trie树根和其他节点的基类
BaseNode() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
BaseNode.Status - com.hankcs.hanlp.collection.trie.bintrie中的枚举
 
BaseNode.TrieEntry - com.hankcs.hanlp.collection.trie.bintrie中的类
 
BaseScorer<T extends ISentenceKey> - com.hankcs.hanlp.suggest.scorer中的类
基本打分器
BaseScorer() - 类 的构造器com.hankcs.hanlp.suggest.scorer.BaseScorer
 
BaseSearcher<V> - com.hankcs.hanlp.dictionary中的类
查询字典者
BaseSearcher(char[]) - 类 的构造器com.hankcs.hanlp.dictionary.BaseSearcher
 
BaseSearcher(String) - 类 的构造器com.hankcs.hanlp.dictionary.BaseSearcher
 
BasicOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
BasicOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.BasicOption
 
BasicTokenizer - com.hankcs.hanlp.tokenizer中的类
基础分词器,只做基本NGram分词,不识别命名实体,不使用用户词典
BasicTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.BasicTokenizer
 
batch_size - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
begin - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
模式串在母文本中的起始位置
begin - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
key的起点
BigramDependencyModel - com.hankcs.hanlp.model.bigram中的类
2-gram依存模型,根据两个词的词和词性猜测它们最可能的依存关系
BigramDependencyModel() - 类 的构造器com.hankcs.hanlp.model.bigram.BigramDependencyModel
 
BiGramDictionary - com.hankcs.hanlp.dictionary中的类
已过时。
现在基于DoubleArrayTrie的BiGramDictionary已经由CoreBiGramTableDictionary替代,可以显著降低内存
BiGramDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
 
BiGramDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
2元语法词典路径
BIN_EXT - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
二进制文件后缀
binarySearch(BaseNode[], BaseNode) - 类 中的静态方法com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool
二分查找
binarySearch(BaseNode[], char) - 类 中的静态方法com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool
 
binned_1_2_3_4_5_6_10 - 类 中的静态变量com.hankcs.hanlp.dependency.nnparser.util.math
对距离的度量(距离越大,返回的值越大,但总是限制在10以内)
BinTrie<V> - com.hankcs.hanlp.collection.trie.bintrie中的类
首字直接分配内存,之后二分动态数组的Trie树,能够平衡时间和空间
BinTrie() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
BiSegment(char[], int, WordNet, WordNet) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
二元语言模型分词
block(int, int, int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
 
BM25 - com.hankcs.hanlp.summary中的类
搜索相关性评分算法
BM25(List<List<String>>) - 类 的构造器com.hankcs.hanlp.summary.BM25
 
boost - 类 中的变量com.hankcs.hanlp.suggest.scorer.BaseScorer
权重
bufferSize - 类 中的变量com.hankcs.hanlp.corpus.io.ByteArrayStream
每次读取1mb
build(TreeMap<String, V>) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
由一个排序好的map创建
build(TreeMap<String, V>) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
build(Keyset) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder
构建
build(byte[][], int[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
构建
build(List<String>, int[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
 
build(TreeMap<String, V>) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
build(List<String>, List<V>) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
build(List<String>, V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
build(Set<Map.Entry<String, V>>) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
构建DAT
build(TreeMap<String, V>) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
方便地构造一个双数组trie树
build(List<String>, int[], int[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
唯一的构建方法
build(TreeMap<String, V>) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
build(TreeMap<String, Integer>) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
 
ByteArray - com.hankcs.hanlp.corpus.io中的类
对字节数组进行封装,提供方便的读取操作
ByteArray(byte[]) - 类 的构造器com.hankcs.hanlp.corpus.io.ByteArray
 
ByteArrayFileStream - com.hankcs.hanlp.corpus.io中的类
流式的字节数组,降低读取时的内存峰值
ByteArrayFileStream(byte[], int, FileChannel) - 类 的构造器com.hankcs.hanlp.corpus.io.ByteArrayFileStream
 
ByteArrayOtherStream - com.hankcs.hanlp.corpus.io中的类
 
ByteArrayOtherStream(byte[], int) - 类 的构造器com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
 
ByteArrayOtherStream(byte[], int, InputStream) - 类 的构造器com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
 
ByteArrayStream - com.hankcs.hanlp.corpus.io中的类
 
ByteArrayStream(byte[], int) - 类 的构造器com.hankcs.hanlp.corpus.io.ByteArrayStream
 
bytesHighFirstToChar(byte[], int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
字节数组转char,高位在前,适用于读取writeChar的数据
bytesHighFirstToDouble(byte[], int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
读取double,高位在前
bytesHighFirstToFloat(byte[], int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
读取float,高位在前
bytesHighFirstToInt(byte[], int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
字节数组和整型的转换,高位在前,适用于读取writeInt的数据
bytesHighFirstToLong(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
 
bytesToChar(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个2位字节数组转换为char字符。
bytesToDouble(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个8位字节数组转换为双精度浮点数。
bytesToFloat(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个4位字节数组转换为浮点数。
bytesToInt(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个4位字节数组转换为4整数。
bytesToInt(byte[], int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
字节数组和整型的转换
bytesToLong(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个8位字节数组转换为长整数。
ByteUtil - com.hankcs.hanlp.utility中的类
对数字和字节进行转换。
ByteUtil() - 类 的构造器com.hankcs.hanlp.utility.ByteUtil
 

C

c - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
节点代表的字符
c - 类 中的变量com.hankcs.hanlp.dictionary.BaseSearcher
待分词文本的char
calculateWeight(Vertex, Vertex) - 类 中的静态方法com.hankcs.hanlp.utility.MathTools
从一个词到另一个词的词的花费
CanGetNext() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
是否仍然有下一个元素可供读取
CC_NUM - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CharacterBasedGenerativeModel - com.hankcs.hanlp.model.trigram中的类
基于字符的生成模型(其实就是一个TriGram文法模型,或称2阶隐马模型)
CharacterBasedGenerativeModel() - 类 的构造器com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
 
CharacterBasedGenerativeModelSegment - com.hankcs.hanlp.seg中的类
基于字构词的生成式模型分词器基类
CharacterBasedGenerativeModelSegment() - 类 的构造器com.hankcs.hanlp.seg.CharacterBasedGenerativeModelSegment
 
CharacterHelper - com.hankcs.hanlp.utility中的类
字符集识别辅助工具类
CharacterHelper() - 类 的构造器com.hankcs.hanlp.utility.CharacterHelper
 
charArray - 类 中的变量com.hankcs.hanlp.seg.common.WordNet
原始句子对应的数组
CharArray - com.hankcs.hanlp.suggest.scorer.editdistance中的类
对字符数组的封装,可以代替String
CharArray(char[]) - 类 的构造器com.hankcs.hanlp.suggest.scorer.editdistance.CharArray
 
charAt(int) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
CharTable - com.hankcs.hanlp.dictionary.other中的类
字符正规化表
CharTable() - 类 的构造器com.hankcs.hanlp.dictionary.other.CharTable
 
CharTablePath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
字符正规化表(全角转半角,繁体转简体)
charToBytes(char) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个char字符转换位字节数组(2个字节),b[0]存储高位字符,大端
charTreeSet - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
字母表
CharType - com.hankcs.hanlp.dictionary.other中的类
字符类型
CharType() - 类 的构造器com.hankcs.hanlp.dictionary.other.CharType
 
charType(char) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
 
charType(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断字符类型
CharTypePath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
字符类型对应表
check - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
双数组值check
check - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
checkForOverlaps(Intervalable, IntervalNode.Direction) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
寻找重叠
checkForOverlapsToTheLeft(Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
往左边寻找重叠
checkForOverlapsToTheRight(Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
往右边寻找重叠
child - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
子节点
cint(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
把表示数字含义的字符串转成整形
clear() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
clear() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
clear() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
清空词图
clear() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
清除所有元素
clear() - 类 中的静态方法com.hankcs.hanlp.utility.GlobalObjectPool
清空全局变量
clearStoredHashCode() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Clears this node's stored hash value
clone() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
克隆一个状态
Creates an MDAGNode possessing the same accept state status and outgoing transitions as this node.
clone(MDAGNode, char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
克隆一个状态
原来soleParentNode转移到本状态,现在转移到克隆后的状态 Creates an MDAGNode possessing the same accept state status ant _transition set (incoming & outgoing) as this node. outgoing transitions as this node.
clone() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Clone the Matrix object.
close() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
通知执行关闭/销毁操作
close() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
 
close() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
 
close() - 类 中的方法com.hankcs.hanlp.corpus.io.IOUtil.LineIterator
 
col(int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
取出第j列作为一个列向量
cols() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
 
com.hankcs.hanlp - 程序包 com.hankcs.hanlp
 
com.hankcs.hanlp.algorithm - 程序包 com.hankcs.hanlp.algorithm
 
com.hankcs.hanlp.algorithm.ahocorasick.interval - 程序包 com.hankcs.hanlp.algorithm.ahocorasick.interval
 
com.hankcs.hanlp.algorithm.ahocorasick.trie - 程序包 com.hankcs.hanlp.algorithm.ahocorasick.trie
 
com.hankcs.hanlp.collection.AhoCorasick - 程序包 com.hankcs.hanlp.collection.AhoCorasick
 
com.hankcs.hanlp.collection.dartsclone - 程序包 com.hankcs.hanlp.collection.dartsclone
 
com.hankcs.hanlp.collection.dartsclone.details - 程序包 com.hankcs.hanlp.collection.dartsclone.details
 
com.hankcs.hanlp.collection.MDAG - 程序包 com.hankcs.hanlp.collection.MDAG
 
com.hankcs.hanlp.collection.sequence - 程序包 com.hankcs.hanlp.collection.sequence
 
com.hankcs.hanlp.collection.set - 程序包 com.hankcs.hanlp.collection.set
 
com.hankcs.hanlp.collection.trie - 程序包 com.hankcs.hanlp.collection.trie
 
com.hankcs.hanlp.collection.trie.bintrie - 程序包 com.hankcs.hanlp.collection.trie.bintrie
 
com.hankcs.hanlp.collection.trie.bintrie.util - 程序包 com.hankcs.hanlp.collection.trie.bintrie.util
 
com.hankcs.hanlp.corpus.dependency.CoNll - 程序包 com.hankcs.hanlp.corpus.dependency.CoNll
 
com.hankcs.hanlp.corpus.dependency.model - 程序包 com.hankcs.hanlp.corpus.dependency.model
 
com.hankcs.hanlp.corpus.dictionary - 程序包 com.hankcs.hanlp.corpus.dictionary
 
com.hankcs.hanlp.corpus.dictionary.item - 程序包 com.hankcs.hanlp.corpus.dictionary.item
 
com.hankcs.hanlp.corpus.document - 程序包 com.hankcs.hanlp.corpus.document
 
com.hankcs.hanlp.corpus.document.sentence - 程序包 com.hankcs.hanlp.corpus.document.sentence
 
com.hankcs.hanlp.corpus.document.sentence.word - 程序包 com.hankcs.hanlp.corpus.document.sentence.word
 
com.hankcs.hanlp.corpus.io - 程序包 com.hankcs.hanlp.corpus.io
 
com.hankcs.hanlp.corpus.nr - 程序包 com.hankcs.hanlp.corpus.nr
 
com.hankcs.hanlp.corpus.occurrence - 程序包 com.hankcs.hanlp.corpus.occurrence
 
com.hankcs.hanlp.corpus.synonym - 程序包 com.hankcs.hanlp.corpus.synonym
 
com.hankcs.hanlp.corpus.tag - 程序包 com.hankcs.hanlp.corpus.tag
 
com.hankcs.hanlp.corpus.util - 程序包 com.hankcs.hanlp.corpus.util
 
com.hankcs.hanlp.dependency - 程序包 com.hankcs.hanlp.dependency
 
com.hankcs.hanlp.dependency.common - 程序包 com.hankcs.hanlp.dependency.common
 
com.hankcs.hanlp.dependency.nnparser - 程序包 com.hankcs.hanlp.dependency.nnparser
 
com.hankcs.hanlp.dependency.nnparser.action - 程序包 com.hankcs.hanlp.dependency.nnparser.action
 
com.hankcs.hanlp.dependency.nnparser.option - 程序包 com.hankcs.hanlp.dependency.nnparser.option
 
com.hankcs.hanlp.dependency.nnparser.util - 程序包 com.hankcs.hanlp.dependency.nnparser.util
 
com.hankcs.hanlp.dictionary - 程序包 com.hankcs.hanlp.dictionary
 
com.hankcs.hanlp.dictionary.common - 程序包 com.hankcs.hanlp.dictionary.common
 
com.hankcs.hanlp.dictionary.nr - 程序包 com.hankcs.hanlp.dictionary.nr
 
com.hankcs.hanlp.dictionary.ns - 程序包 com.hankcs.hanlp.dictionary.ns
 
com.hankcs.hanlp.dictionary.nt - 程序包 com.hankcs.hanlp.dictionary.nt
 
com.hankcs.hanlp.dictionary.other - 程序包 com.hankcs.hanlp.dictionary.other
 
com.hankcs.hanlp.dictionary.py - 程序包 com.hankcs.hanlp.dictionary.py
 
com.hankcs.hanlp.dictionary.stopword - 程序包 com.hankcs.hanlp.dictionary.stopword
 
com.hankcs.hanlp.dictionary.ts - 程序包 com.hankcs.hanlp.dictionary.ts
 
com.hankcs.hanlp.model - 程序包 com.hankcs.hanlp.model
 
com.hankcs.hanlp.model.bigram - 程序包 com.hankcs.hanlp.model.bigram
 
com.hankcs.hanlp.model.crf - 程序包 com.hankcs.hanlp.model.crf
 
com.hankcs.hanlp.model.maxent - 程序包 com.hankcs.hanlp.model.maxent
 
com.hankcs.hanlp.model.trigram - 程序包 com.hankcs.hanlp.model.trigram
 
com.hankcs.hanlp.model.trigram.frequency - 程序包 com.hankcs.hanlp.model.trigram.frequency
 
com.hankcs.hanlp.phrase - 程序包 com.hankcs.hanlp.phrase
 
com.hankcs.hanlp.recognition.nr - 程序包 com.hankcs.hanlp.recognition.nr
 
com.hankcs.hanlp.recognition.ns - 程序包 com.hankcs.hanlp.recognition.ns
 
com.hankcs.hanlp.recognition.nt - 程序包 com.hankcs.hanlp.recognition.nt
 
com.hankcs.hanlp.seg - 程序包 com.hankcs.hanlp.seg
 
com.hankcs.hanlp.seg.common - 程序包 com.hankcs.hanlp.seg.common
 
com.hankcs.hanlp.seg.common.wrapper - 程序包 com.hankcs.hanlp.seg.common.wrapper
 
com.hankcs.hanlp.seg.CRF - 程序包 com.hankcs.hanlp.seg.CRF
 
com.hankcs.hanlp.seg.Dijkstra - 程序包 com.hankcs.hanlp.seg.Dijkstra
 
com.hankcs.hanlp.seg.Dijkstra.Path - 程序包 com.hankcs.hanlp.seg.Dijkstra.Path
 
com.hankcs.hanlp.seg.HMM - 程序包 com.hankcs.hanlp.seg.HMM
 
com.hankcs.hanlp.seg.NShort - 程序包 com.hankcs.hanlp.seg.NShort
 
com.hankcs.hanlp.seg.NShort.Path - 程序包 com.hankcs.hanlp.seg.NShort.Path
 
com.hankcs.hanlp.seg.Other - 程序包 com.hankcs.hanlp.seg.Other
 
com.hankcs.hanlp.seg.Viterbi - 程序包 com.hankcs.hanlp.seg.Viterbi
 
com.hankcs.hanlp.seg.Viterbi.Path - 程序包 com.hankcs.hanlp.seg.Viterbi.Path
 
com.hankcs.hanlp.suggest - 程序包 com.hankcs.hanlp.suggest
 
com.hankcs.hanlp.suggest.scorer - 程序包 com.hankcs.hanlp.suggest.scorer
 
com.hankcs.hanlp.suggest.scorer.editdistance - 程序包 com.hankcs.hanlp.suggest.scorer.editdistance
 
com.hankcs.hanlp.suggest.scorer.lexeme - 程序包 com.hankcs.hanlp.suggest.scorer.lexeme
 
com.hankcs.hanlp.suggest.scorer.pinyin - 程序包 com.hankcs.hanlp.suggest.scorer.pinyin
 
com.hankcs.hanlp.summary - 程序包 com.hankcs.hanlp.summary
 
com.hankcs.hanlp.tokenizer - 程序包 com.hankcs.hanlp.tokenizer
一些常用的配置好的静态分词器,其中一些具备特殊的预处理功能
可供用户参考以实现自己的预处理逻辑.
com.hankcs.hanlp.utility - 程序包 com.hankcs.hanlp.utility
 
combine(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
合并两部词典
combine(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
合并多部词典
combine(SimpleItem) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
合并两个条目,两者的标签map会合并
combine(SimpleDictionary<V>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
以我为主词典,合并一个副词典,我有的词条不会被副词典覆盖
combine(StringDictionary...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
合并词典,第一个为主词典
combine(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
 
combine(TFDictionary, int, boolean) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
合并自己(主词典)和某个词频词典
combine(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
合并多个词典
combine() - 类 中的静态方法com.hankcs.hanlp.corpus.nr.NRCorpusLoader
 
combineByCustomDictionary(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
使用用户词典合并粗分结果
combineByCustomDictionary(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
使用用户词典合并粗分结果,并将用户词语收集到全词图中
combineWhenNotInclude(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
合并,只补充除第一个词典外其他词典的新词
combineWithNormalization(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
对除第一个之外的词典执行标准化,并且合并
CommonAhoCorasickSegmentUtil - com.hankcs.hanlp.seg.Other中的类
一个通用的使用AhoCorasickDoubleArrayTrie实现的最长分词器
CommonAhoCorasickSegmentUtil() - 类 的构造器com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
 
CommonDictionary<V> - com.hankcs.hanlp.dictionary.common中的类
通用的词典,对应固定格式的词典,但是标签可以泛型化
CommonDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonDictionary
 
CommonDictionary.Searcher - com.hankcs.hanlp.dictionary.common中的类
前缀搜索,长短都可匹配
CommonDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
 
CommonDictionaryMaker(EasyDictionary) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
 
commonPrefixSearch(String, int, int) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
前缀查询
commonPrefixSearch(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
commonPrefixSearch(byte[], int, int) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
Returns the keys that begins with the given key and its corresponding values.
commonPrefixSearch(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
commonPrefixSearch(String, int, int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
前缀查询
commonPrefixSearch(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
前缀查询
commonPrefixSearch(char[], int) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
前缀查询
commonPrefixSearchWithValue(char[], int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
前缀查询
commonPrefixSearchWithValue(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
前缀查询
commonPrefixSearchWithValue(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
前缀查询,包含值
commonPrefixSearchWithValue(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
前缀查询,通过字符数组来表示字符串可以优化运行速度
commonPrefixSearchWithValue(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
已过时。
最好用优化版的
commonPrefixSearchWithValue(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
优化的前缀查询,可以复用字符数组
CommonStringDictionary - com.hankcs.hanlp.dictionary.common中的类
最简单的词典,每一行只有一个词,没别的
CommonStringDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonStringDictionary
 
CommonSuffixExtractor - com.hankcs.hanlp.corpus.dictionary中的类
公共后缀提取工具
CommonSuffixExtractor() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
 
CommonSynonymDictionary - com.hankcs.hanlp.dictionary.common中的类
一个没有指定资源位置的通用同义词词典
CommonSynonymDictionary.SynonymItem - com.hankcs.hanlp.dictionary.common中的类
词典中的一个条目
CommonSynonymDictionaryEx - com.hankcs.hanlp.dictionary.common中的类
一个没有指定资源位置的通用同义词词典
CommonSynonymDictionaryEx.SynonymItem - com.hankcs.hanlp.dictionary.common中的类
词典中的一个条目
compare(Intervalable, Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalableComparatorByPosition
 
compare(Intervalable, Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalableComparatorBySize
 
compare(Long[], Long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayCompare
比较数组A与B的大小关系
compareTo(Object) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
compareTo(SString) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
compareTo(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
compareTo(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
重载,与字符的比较
compareTo(BaseNode<V>.TrieEntry) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry
 
compareTo(TermFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
 
compareTo(State) - 类 中的方法com.hankcs.hanlp.dependency.common.State
 
compareTo(AbstractInexactAction) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
 
compareTo(State) - 类 中的方法com.hankcs.hanlp.seg.Dijkstra.Path.State
 
compareTo(QueueElement) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.QueueElement
 
compareTo(CharArray) - 类 中的方法com.hankcs.hanlp.suggest.scorer.editdistance.CharArray
 
compareTo(IdVector) - 类 中的方法com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
 
compareTo(PinyinKey) - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
 
compile(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler
编译,比如将词性为数词的转为##数##
compile(IWord) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CorpusUtil
编译单词
compile(Word) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
将一个单词编译为等效字串
compile(IWord) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
 
compiledWord - 类 中的变量com.hankcs.hanlp.dependency.common.Node
 
compilePOS(Nature) - 类 中的静态方法com.hankcs.hanlp.dependency.common.POSUtil
 
compileWithoutNS(List<IWord>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
在忽略ns的前提下预编译
compileWithoutNT(List<IWord>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
在忽略ns的前提下预编译
CompoundWord - com.hankcs.hanlp.corpus.document.sentence.word中的类
复合词,由两个或以上的word构成
CompoundWord(List<Word>, String) - 类 的构造器com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
compute(Graph) - 类 中的静态方法com.hankcs.hanlp.algorithm.Dijkstra
 
compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
 
compute(long[], long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
 
compute(int[], int[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
 
compute(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
编辑距离
compute(char[], char[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
编辑距离
compute(char[], char[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubsequence
 
compute(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubsequence
 
compute(char[], char[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubstring
 
compute(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubstring
 
compute(long[], long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.VectorDistance
 
compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.algorithm.VectorDistance
 
compute(int[], int[], double[], double[][], double[][]) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
求解HMM模型,所有概率请提前取对数
compute(List<Vertex>, TransformMatrixDictionary<Nature>) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
特化版的求解HMM模型
compute(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
处理语料,准备词典
compute() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
输入数据完毕,执行计算
compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.CRFDependencyParser
分析句子的依存句法
compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.CRFDependencyParser
分析句子的依存句法
compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.MaxEntDependencyParser
分析句子的依存句法
compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.MaxEntDependencyParser
分析句子的依存句法
compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkDependencyParser
分析句子的依存句法
compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkDependencyParser
分析句子的依存句法
compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.WordNatureDependencyParser
分析句子的依存句法
compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.WordNatureDependencyParser
分析句子的依存句法
computeAverageDistance(Long[], Long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayDistance
 
computeEnum(List<EnumItem<E>>, TransformMatrixDictionary<E>) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
标准版的Viterbi算法,查准率高,效率稍低
computeEnumSimply(List<EnumItem<E>>, TransformMatrixDictionary<E>) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
仅仅利用了转移矩阵的“维特比”算法
computeLeftEntropy(PairFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
计算左熵
computeMinimumDistance(TreeSet<Long>, TreeSet<Long>) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayDistance
 
computeMinimumDistance(Long[], Long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayDistance
 
computeMutualInformation(String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
computeMutualInformation(PairFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
computeRightEntropy(PairFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
计算右熵
computeScore(LinkedList<double[]>, int) - 类 中的静态方法com.hankcs.hanlp.model.crf.CRFModel
给一系列特征函数结合tag打分
computeScore(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
 
computeScore(String) - 接口 中的方法com.hankcs.hanlp.suggest.scorer.IScorer
计算分值
computeScoreList(Table, int) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
根据特征函数计算输出
Config() - 类 的构造器com.hankcs.hanlp.HanLP.Config
 
Config - com.hankcs.hanlp.seg中的类
分词器配置项
Config() - 类 的构造器com.hankcs.hanlp.seg.Config
 
config - 类 中的变量com.hankcs.hanlp.seg.Segment
分词器配置
ConfigOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
ConfigOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.ConfigOption
 
confirmNature(Nature) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
将属性的词性锁定为nature
confirmNature(Nature, boolean) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
将属性的词性锁定为nature,此重载会降低性能
CoNLLFixer - com.hankcs.hanlp.corpus.dependency.CoNll中的类
修正一些非10行的依存语料
CoNLLFixer() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer
 
CoNllLine - com.hankcs.hanlp.corpus.dependency.CoNll中的类
CoNLL语料中的一行
CoNllLine(String...) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
 
CoNLLLoader - com.hankcs.hanlp.corpus.dependency.CoNll中的类
CoNLL格式依存语料加载
CoNLLLoader() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader
 
CoNLLSentence - com.hankcs.hanlp.corpus.dependency.CoNll中的类
CoNLL中的一个句子
CoNLLSentence(List<CoNllLine>) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
构造一个句子
CoNLLSentence(CoNLLWord[]) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
 
CoNLLWord - com.hankcs.hanlp.corpus.dependency.CoNll中的类
 
CoNLLWord(int, String, String) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
 
CoNLLWord(int, String, String, String) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
 
CoNLLWord(CoNllLine) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
 
CoNLLWord(CoNllLine[], int) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
 
connect(int, int, double) - 类 中的方法com.hankcs.hanlp.seg.common.Graph
连接两个节点
constructWithCopy(double[][]) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.Matrix
Construct a matrix from a copy of a 2-D array.
contains(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
是否包含
Determines whether a String is present in the MDAG.
contains(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
contains(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
 
contains(char) - 类 中的静态方法com.hankcs.hanlp.corpus.nr.FamilyName
 
contains(String) - 类 中的静态方法com.hankcs.hanlp.corpus.nr.FamilyName
 
contains(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
是否含有键
contains(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
是否包含词语
contains(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
词典中是否含有词语
contains(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
 
containsAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
containsKey(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
是否包含key
containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
containsKey(String) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
containsKey(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
是否包含key
containsKey(String, int) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
包含key,且key至少长length
containsKey(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary
是否包含key
containsKey(String, int) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary
时报包含key,且key至少长length
containsLabel(E) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
containsLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
containsValue(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
Context - com.hankcs.hanlp.dependency.nnparser中的类
上下文
Context() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Context
 
Context - com.hankcs.hanlp.model.maxent中的类
将参数与特征关联起来的类,用来储存最大熵的参数,也用来储存模型和经验分布
Context(int[], double[]) - 类 的构造器com.hankcs.hanlp.model.maxent.Context
构建一个新的上下文
convert(List<Term>, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
将分词结果转换为同义词列表
convert(List<Term>, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
将分词结果转换为同义词列表
CONVERT - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharTable
正规化使用的对应表
convert(char) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
将一个字符正规化
convert(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
 
convert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
 
convert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
文本转拼音
convert(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
文本转拼音
convert(String[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
 
convert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
 
convert(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
 
convert(String) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
 
convert(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.NShort.Path.AtomNode
 
convert(List<Vertex>, boolean) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
将一条路径转为最终结果
convert(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
将一条路径转为最终结果
convert2Array(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
将拼音文本转化为完整的拼音,支持汉英混合的杂乱文本,注意如果混用拼音和输入法头的话,并不会有多高的准确率,声调也不会准的
convert2CompatibleList(List<List<Word>>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CorpusUtil
将word列表转为兼容的IWord列表
convert2Document(File) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
convert2DocumentList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
convert2Pair(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
将混合文本转为拼音
convert2SentenceList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
convert2SimpleSentenceList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
convert2Tone5(Pinyin) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
将拼音的音调统统转为5调或者最大的音调
convertFromToneNumber(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
 
convertFromToneNumber(String[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
 
convertId2String(long) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
 
convertId2StringWithIndex(long) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
 
convertIntToTwoChar(int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
 
convertList2Array(List<Pinyin>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
将列表转为数组
convertPinyinList2TonePinyinList(List<Pinyin>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
转换List pinyinList到List,其中的String为带声调符号形式
convertSingle(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
将单个音节转为拼音
convertString2Id(String) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
 
convertString2IdWithIndex(String, long) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
 
convertString2IdWithIndex(String, int) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
 
convertStringToNature(String, LinkedHashSet<Nature>) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
将字符串词性转为Enum词性
convertToHongKongTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToHongKongChineseDictionary
 
convertToHongKongTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToHongKongChineseDictionary
 
convertToneNumber2ToneMark(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
Convert tone numbers to tone marks using Unicode

Algorithm for determining location of tone mark

A simple algorithm for determining the vowel on which the tone mark appears is as follows:

First, look for an "a" or an "e".

convertToPinyin(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
转为拼音
convertToPinyin(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
 
convertToPinyinArray(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
转为拼音
convertToPinyinFirstCharString(String, String, boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP
转化为拼音(首字母)
convertToPinyinList(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
转化为拼音
convertToPinyinString(String, String, boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP
转化为拼音
convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToSimplifiedChineseDictionary
 
convertToSimplifiedChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToSimplifiedChineseDictionary
 
convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToSimplifiedChineseDictionary
 
convertToSimplifiedChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToSimplifiedChineseDictionary
 
convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
 
convertToSimplifiedChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
 
convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
繁转简
convertToTaiwanChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToTaiwanChineseDictionary
 
convertToTaiwanChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToTaiwanChineseDictionary
 
convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTraditionalChineseDictionary
 
convertToTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTraditionalChineseDictionary
 
convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
 
convertToTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
 
convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToTraditionalChineseDictionary
 
convertToTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToTraditionalChineseDictionary
 
convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
简转繁
convertToTraditionalHongKongChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToHongKongChineseDictionary
 
convertToTraditionalHongKongChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToHongKongChineseDictionary
 
convertToTraditionalHongKongChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToHongKongChineseDictionary
 
convertToTraditionalHongKongChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToHongKongChineseDictionary
 
convertToTraditionalTaiwanChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTaiwanChineseDictionary
 
convertToTraditionalTaiwanChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTaiwanChineseDictionary
 
convertToTraditionalTaiwanChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToTaiwanChineseDictionary
 
convertToTraditionalTaiwanChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToTaiwanChineseDictionary
 
convertTwoCharToInt(char, char) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
 
copy() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder
 
copy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Make a deep copy of a matrix
copy() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
复制自己
CoreBiGramMixDictionary - com.hankcs.hanlp.dictionary中的类
核心词典的二元接续词典,混合采用词ID和词本身储存
CoreBiGramMixDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary
 
CoreBiGramTableDictionary - com.hankcs.hanlp.dictionary中的类
核心词典的二元接续词典,采用整型储存,高性能
CoreBiGramTableDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
 
CoreDictionary - com.hankcs.hanlp.dictionary中的类
使用DoubleArrayTrie实现的核心词典
CoreDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary
 
CoreDictionary.Attribute - com.hankcs.hanlp.dictionary中的类
核心词典中的词属性
CoreDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
核心词典路径
CoreDictionaryTransformMatrixDictionary - com.hankcs.hanlp.dictionary中的类
核心词典词性转移矩阵
CoreDictionaryTransformMatrixDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary
 
CoreDictionaryTransformMatrixDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
核心词典词性转移矩阵路径
CoreStopWordDictionary - com.hankcs.hanlp.dictionary.stopword中的类
核心停用词词典
CoreStopWordDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
 
CoreStopWordDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
停用词词典路径
CoreSynonymDictionary - com.hankcs.hanlp.dictionary中的类
核心同义词词典
CoreSynonymDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreSynonymDictionary
 
CoreSynonymDictionaryDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
同义词词典路径
CoreSynonymDictionaryEx - com.hankcs.hanlp.dictionary中的类
核心同义词词典(使用语义id作为value)
CoreSynonymDictionaryEx() - 类 的构造器com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
 
CorpusLoader - com.hankcs.hanlp.corpus.document中的类
 
CorpusLoader() - 类 的构造器com.hankcs.hanlp.corpus.document.CorpusLoader
 
CorpusLoader.Handler - com.hankcs.hanlp.corpus.document中的接口
 
CorpusLoader.HandlerThread - com.hankcs.hanlp.corpus.document中的类
多线程任务
CorpusUtil - com.hankcs.hanlp.corpus.util中的类
 
CorpusUtil() - 类 的构造器com.hankcs.hanlp.corpus.util.CorpusUtil
 
cost - 类 中的变量com.hankcs.hanlp.dependency.common.Edge
 
cost - 类 中的变量com.hankcs.hanlp.dependency.common.State
 
cost - 类 中的变量com.hankcs.hanlp.seg.Dijkstra.Path.State
路径花费
count(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
统计 keyword 在 srcText 中的出现次数
CPOSTAG - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
当前词语的词性(粗粒度)
CQueue - com.hankcs.hanlp.seg.NShort.Path中的类
一个维护了上次访问位置的优先级队列(最小堆)
CQueue() - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.CQueue
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.Item
 
create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.Item
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.Document
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.Sentence
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.word.Word
通过参数构造一个单词
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.word.WordFactory
根据参数字符串产生对应的词语
create(String) - 类 中的方法com.hankcs.hanlp.corpus.io.FileIOAdapter
 
create(String) - 接口 中的方法com.hankcs.hanlp.corpus.io.IIOAdapter
创建一个新文件以供输出
create(String) - 类 中的方法com.hankcs.hanlp.corpus.io.ResourceIOAdapter
 
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.nr.NameDictionaryMaker
 
create(String, char, String) - 类 中的静态方法com.hankcs.hanlp.corpus.occurrence.PairFrequency
构造一个pf
create(String, char, String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.occurrence.TriaFrequency
构造一个三阶接续,正向
create(String, String, char, String) - 类 中的静态方法com.hankcs.hanlp.corpus.occurrence.TriaFrequency
构造一个三阶接续,逆向
create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym
通过类似 Bh06A32= 番茄 西红柿 的字符串构造一系列同义词
create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym
 
create(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.Nature
创建自定义词性,如果已有该对应词性,则直接返回已有的词性
create(int, E) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.std
 
create(InputStream) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
 
create(InputStream) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx
 
create(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
create(ByteArray, Nature[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
从字节流中加载
create(String) - 类 中的静态方法com.hankcs.hanlp.model.crf.FeatureTemplate
 
create(String) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
从文件加载,同时缓存为二进制文件
create(ByteArray) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
从字节流快速加载
createByteArray(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArray
从文件读取一个字节数组
createByteArrayFileStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
 
createByteArrayFileStream(FileInputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
 
createByteArrayOtherStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
 
createByteArrayOtherStream(InputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
 
createByteArrayStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
createUndefined(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
创建一个@类型的词典之外的条目
CRFDependencyModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
CRF依存模型
CRFDependencyParser - com.hankcs.hanlp.dependency中的类
基于随机条件场的依存句法分析器
CRFDependencyParser(String) - 类 的构造器com.hankcs.hanlp.dependency.CRFDependencyParser
 
CRFDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.CRFDependencyParser
 
CRFModel - com.hankcs.hanlp.model.crf中的类
 
CRFModel() - 类 的构造器com.hankcs.hanlp.model.crf.CRFModel
 
CRFModel(ITrie<FeatureFunction>) - 类 的构造器com.hankcs.hanlp.model.crf.CRFModel
以指定的trie树结构储存内部特征函数
CRFSegment - com.hankcs.hanlp.seg.CRF中的类
基于CRF的分词器
CRFSegment(CRFSegmentModel) - 类 的构造器com.hankcs.hanlp.seg.CRF.CRFSegment
 
CRFSegment(String) - 类 的构造器com.hankcs.hanlp.seg.CRF.CRFSegment
 
CRFSegment() - 类 的构造器com.hankcs.hanlp.seg.CRF.CRFSegment
 
CRFSegmentModel - com.hankcs.hanlp.model中的类
静态CRF分词模型
CRFSegmentModel(ITrie<FeatureFunction>) - 类 的构造器com.hankcs.hanlp.model.CRFSegmentModel
以指定的trie树结构储存内部特征函数
CRFSegmentModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
CRF分词模型
CT_CHINESE - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
中文字符
CT_CHINESE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_CHINESE - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
中文字符
CT_DELIMITER - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
分隔符"!
CT_DELIMITER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_DELIMITER - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
分隔符"!
CT_INDEX - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
序号
CT_INDEX - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_INDEX - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
序号
CT_LETTER - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
字母
CT_LETTER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_LETTER - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
字母
CT_NUM - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
数字
CT_NUM - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_NUM - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
数字
CT_OTHER - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
其他
CT_OTHER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_OTHER - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
其他
CT_SENTENCE_BEGIN - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_SENTENCE_END - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_SINGLE - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
单字节
CT_SINGLE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
CT_SINGLE - 类 中的静态变量com.hankcs.hanlp.utility.TextUtility
单字节
cube() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
返回矩阵的立方(以数组形式)
CustomDictionary - com.hankcs.hanlp.dictionary中的类
用户自定义词典
CustomDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CustomDictionary
 
CustomDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
用户自定义词典路径
CustomNatureUtility - com.hankcs.hanlp.corpus.util中的类
运行时动态增加词性工具
CustomNatureUtility() - 类 的构造器com.hankcs.hanlp.corpus.util.CustomNatureUtility
 

D

d - 类 中的变量com.hankcs.hanlp.model.trigram.frequency.Probability
 
DartMap<V> - com.hankcs.hanlp.collection.dartsclone中的类
双数组trie树map,更省内存,原本希望代替DoubleArrayTrie,后来发现效率不够
DartMap(List<String>, V[]) - 类 的构造器com.hankcs.hanlp.collection.dartsclone.DartMap
 
DartMap(TreeMap<String, V>) - 类 的构造器com.hankcs.hanlp.collection.dartsclone.DartMap
 
DartMap() - 类 的构造器com.hankcs.hanlp.collection.dartsclone.DartMap
 
dat - 类 中的静态变量com.hankcs.hanlp.dictionary.CustomDictionary
 
DEBUG - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
开发模式
decorateResultForIndexMode(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
为了索引模式修饰结果
decrementTargetIncomingTransitionCounts() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
本状态的目标状态们的入度减一 Decrements (by 1) the incoming _transition counts of all of the nodes that are targets of outgoing transitions from this node.
deleteByValue(E) - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
We delete the enum from the values array and set the constant pointer to null.
delimiter - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
 
Dependency - com.hankcs.hanlp.dependency.nnparser中的类
 
Dependency() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Dependency
 
DEPREL - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
当前词语与中心词的依存关系
deprels - 类 中的变量com.hankcs.hanlp.dependency.nnparser.Dependency
 
DEPRL_DESCRIPTION_PATH - 类 中的静态变量com.hankcs.hanlp.dependency.nnparser.option.ConfigOption
 
depth - 类 中的变量com.hankcs.hanlp.algorithm.ahocorasick.trie.State
模式串的长度,也是这个状态的深度
depth - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.State
模式串的长度,也是这个状态的深度
deQueue() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
从队列中取出前面的一个元素
descendingIterator(int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
获取某一行的逆序迭代器
determineMedian(List<Intervalable>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
计算中点
dfs(Trie.IWalker) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
 
dictionary - 类 中的静态变量com.hankcs.hanlp.corpus.dictionary.PlaceSuffixDictionary
 
dictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
人名词典
dictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.ns.PlaceDictionary
地名词典
dictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
机构名词典
DictionaryBasedSegment - com.hankcs.hanlp.seg中的类
基于词典的机械分词器基类
DictionaryBasedSegment() - 类 的构造器com.hankcs.hanlp.seg.DictionaryBasedSegment
 
DictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
一个通用的词典制作工具,词条格式:词 标签 频次
DictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
DictionaryMaker.Filter - com.hankcs.hanlp.corpus.dictionary中的接口
 
DictionaryUtil - com.hankcs.hanlp.corpus.util中的类
 
DictionaryUtil() - 类 的构造器com.hankcs.hanlp.corpus.util.DictionaryUtil
 
Dijkstra - com.hankcs.hanlp.algorithm中的类
最短路径
Dijkstra() - 类 的构造器com.hankcs.hanlp.algorithm.Dijkstra
 
DijkstraSegment - com.hankcs.hanlp.seg.Dijkstra中的类
最短路径分词
DijkstraSegment() - 类 的构造器com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment
 
dirname(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
获取文件所在目录的路径
distance(Synonym) - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
语义距离
distance(String, String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
语义距离
distance(CommonSynonymDictionary.SynonymItem) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
语义距离
distance(String, String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx
语义距离
distance(CommonSynonymDictionary.SynonymItem, CommonSynonymDictionary.SynonymItem) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
语义距离
distance(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
判断两个单词之间的语义距离
distance(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 中的方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
 
distance(long[], long[]) - 类 中的方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
 
distance(CommonSynonymDictionary.SynonymItem, CommonSynonymDictionary.SynonymItem) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
语义距离
distance(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 中的方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
 
distance(long[], long[]) - 类 中的方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
 
Document - com.hankcs.hanlp.corpus.document中的类
 
Document(List<Sentence>) - 类 的构造器com.hankcs.hanlp.corpus.document.Document
 
done() - 类 中的方法com.hankcs.hanlp.corpus.io.LineHandler
 
DoubleArray - com.hankcs.hanlp.collection.dartsclone中的类
双数组DAWG
DoubleArray() - 类 的构造器com.hankcs.hanlp.collection.dartsclone.DoubleArray
 
DoubleArrayBuilder - com.hankcs.hanlp.collection.dartsclone.details中的类
双数组构建者
DoubleArrayBuilder() - 类 的构造器com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder
 
DoubleArrayTrie<V> - com.hankcs.hanlp.collection.trie中的类
双数组Trie树
DoubleArrayTrie() - 类 的构造器com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
DoubleArrayTrie.Searcher - com.hankcs.hanlp.collection.trie中的类
一个搜索工具(注意,当调用next()返回false后不应该继续调用next(),除非reset状态)
DoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other中的类
使用DoubleArrayTrie实现的最长分词器
DoubleArrayTrieSegment() - 类 的构造器com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment
 
doubleToBytes(double) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个双精度浮点数转换位字节数组(8个字节),b[0]存储高位字符,大端
dropout_probability - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
dSmoothingPara - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
平滑参数
dTemp - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
Smoothing 平滑因子
dumpEnum(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.SYTDictionary
导出声母表等等

E

e - 类 中的变量com.hankcs.hanlp.collection.sequence.SString
结束位置,不包含
e(CoNLLSentence, CoNLLSentence) - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
 
E - 类 中的静态变量com.hankcs.hanlp.seg.common.Vertex
末##末
EasyDictionary - com.hankcs.hanlp.corpus.dictionary中的类
一个通用的、满足特定格式的双数组词典
EasyDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary
 
EasyDictionary.Attribute - com.hankcs.hanlp.corpus.dictionary中的类
通用词典中的词属性
EasyDictionary.Searcher - com.hankcs.hanlp.corpus.dictionary中的类
 
EasyReader - com.hankcs.hanlp.corpus.io中的类
文本读取工具
EasyReader(String) - 类 的构造器com.hankcs.hanlp.corpus.io.EasyReader
构造
EasyReader(String, boolean) - 类 的构造器com.hankcs.hanlp.corpus.io.EasyReader
构造
ed(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
编辑距离
Edge - com.hankcs.hanlp.dependency.common中的类
一条边
Edge(int, int, String, float) - 类 的构造器com.hankcs.hanlp.dependency.common.Edge
 
edge - 类 中的变量com.hankcs.hanlp.dependency.common.State
 
Edge - com.hankcs.hanlp.seg.common中的类
基础边,不允许构造
Edge(double, String) - 类 的构造器com.hankcs.hanlp.seg.common.Edge
 
EdgeFrom - com.hankcs.hanlp.seg.common中的类
记录了起点的边
EdgeFrom(int, double, String) - 类 的构造器com.hankcs.hanlp.seg.common.EdgeFrom
 
edgesTo - 类 中的变量com.hankcs.hanlp.seg.common.Graph
边,到达下标i
EditDistance - com.hankcs.hanlp.algorithm中的类
基于语义距离的编辑距离实现
EditDistance() - 类 的构造器com.hankcs.hanlp.algorithm.EditDistance
 
EditDistanceScorer - com.hankcs.hanlp.suggest.scorer.editdistance中的类
编辑距离打分器
EditDistanceScorer() - 类 的构造器com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer
 
embedding_size - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
Emit - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
一个模式串匹配结果
Emit(int, int, String) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Emit
构造一个模式串匹配结果
emit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
获取这个节点代表的模式串(们)
emit() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
获取这个节点代表的模式串(们)
enableAllNamedEntityRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
 
enableAllNamedEntityRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
是否启用所有的命名实体识别
enableCustomDictionary(boolean) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
 
enableCustomDictionary(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
是否启用用户词典
enableDebug() - 类 中的静态方法com.hankcs.hanlp.HanLP.Config
开启调试模式(会降低性能)
enableDebug(boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP.Config
开启调试模式(会降低性能)
enableDeprelTranslator(boolean) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
 
enableDeprelTranslator(boolean) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
依存关系自动转换开关
enableIndexMode(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
设为索引模式
enableJapaneseNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
是否启用日本人名识别
enableJapaneseNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
是否启用日本人名识别
enableMultithreading(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
开启多线程
enableMultithreading(int) - 类 中的方法com.hankcs.hanlp.seg.Segment
开启多线程
enableNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
开启人名识别
enableNumberQuantifierRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.CRF.CRFSegment
 
enableNumberQuantifierRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
是否启用数词和数量词识别
即[二, 十, 一] => [二十一],[十, 九, 元] => [十九元]
enableOffset(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
是否启用偏移量计算(开启后Term.offset才会被计算)
enableOffset(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
是否启用偏移量计算(开启后Term.offset才会被计算)
enableOrganizationRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
开启机构名识别
enableOrganizationRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
开启机构名识别
enablePartOfSpeechTagging(boolean) - 类 中的方法com.hankcs.hanlp.seg.DictionaryBasedSegment
开启数词和英文识别(与标准意义上的词性标注不同,只是借用这个配置方法,不是真的开启了词性标注。
enablePartOfSpeechTagging(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
开启词性标注
enablePartOfSpeechTagging(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
开启词性标注
enablePlaceRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
开启地名识别
enablePlaceRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
开启地名识别
enableTranslatedNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
是否启用音译人名识别
enableTranslatedNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
是否启用音译人名识别
end - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
模式串在母文本中的终止位置
endsWith(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
词语是否以该词典中的某个单词结尾
enQueue(QueueElement) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
将QueueElement根据eWeight由小到大的顺序插入队列
ensureAvailableBytes(int) - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
确保buffer数组余有size个字节
ensureAvailableBytes(int) - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
 
ensureAvailableBytes(int) - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
entry - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
条目的key
entrySet() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
entrySet() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
 
entrySet() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
获取键值对集合
entrySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
浏览所有词条
entrySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
获取键值对集合
entrySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
键值对
EnumBuster<E extends Enum<E>> - com.hankcs.hanlp.corpus.util中的类
动态修改Enum的对象
EnumBuster(Class<E>, Class...) - 类 的构造器com.hankcs.hanlp.corpus.util.EnumBuster
Construct an EnumBuster for the given enum class and keep the switch statements of the classes specified in switchUsers in sync with the enum values.
EnumItem<E extends Enum<E>> - com.hankcs.hanlp.corpus.dictionary.item中的类
对标签-频次的封装
EnumItem() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
EnumItem(E, Integer) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.EnumItem
创建只有一个标签的条目
EnumItem(E...) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.EnumItem
创建一个条目,其标签频次都是1,各标签由参数指定
equals(Object) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
equals(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
两个状态是否等价,只有状态转移函数完全一致才算相等
Evaluates the equality of this node with another object.
equals(Object) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
equals(Object) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
 
equivalenceClassMDAGNodeHashMap - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
等价类集合,相当于论文中的register
ERROR_LOG(String, Object...) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.Log
 
eval(String[]) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
预测分布
eval(String[], double[]) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
预测分布
eval(int[], double[], EvalParameters) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
预测
EvalParameters - com.hankcs.hanlp.model.maxent中的类
封装了模型用来计算概率的一些参数
EvalParameters(Context[], double, double, int) - 类 的构造器com.hankcs.hanlp.model.maxent.EvalParameters
创建一个参数,可被用于预测
EvalParameters(Context[], int) - 类 的构造器com.hankcs.hanlp.model.maxent.EvalParameters
 
Evaluator - com.hankcs.hanlp.corpus.dependency.CoNll中的类
测试工具
Evaluator() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
 
exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
精确匹配
exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
Returns the corresponding value if the key is found.
exactMatchSearch(byte[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
Returns the corresponding value if the key is found.
exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
精确匹配
exactMatchSearch(String, int, int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
exactMatchSearch(char[], int, int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
精确查询
exceptionToString(Exception) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
将异常转为字符串
exists(String) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
extendSize() - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
拓展内部矩阵,仅用于通过反射新增了枚举实例之后的兼容措施
extract(String, int) - 类 中的静态方法com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor
一句话提取
extractKeyword(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
提取关键词
extractPhrase(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
提取短语
extractPhrase(String, int) - 接口 中的方法com.hankcs.hanlp.phrase.IPhraseExtractor
提取短语
extractPhrase(String, int) - 类 中的方法com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor
 
extractSuffix(int, int, boolean) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
提取公共后缀
extractSuffixByWords(int, int, boolean) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
此方法认为后缀一定是整个的词语,所以length是以词语为单位的
extractSuffixExtended(int, int) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
 
extractSummary(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
自动摘要

F

failure() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
获取failure状态
failure() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
获取failure状态
FamilyName - com.hankcs.hanlp.corpus.nr中的类
 
FamilyName() - 类 的构造器com.hankcs.hanlp.corpus.nr.FamilyName
 
FeatureFunction - com.hankcs.hanlp.model.crf中的类
特征函数,其实是tag.size个特征函数的集合
FeatureFunction(char[], int) - 类 的构造器com.hankcs.hanlp.model.crf.FeatureFunction
 
FeatureFunction() - 类 的构造器com.hankcs.hanlp.model.crf.FeatureFunction
 
FeatureTemplate - com.hankcs.hanlp.model.crf中的类
特征模板
FeatureTemplate() - 类 的构造器com.hankcs.hanlp.model.crf.FeatureTemplate
 
FileIOAdapter - com.hankcs.hanlp.corpus.io中的类
基于普通文件系统的IO适配器
FileIOAdapter() - 类 的构造器com.hankcs.hanlp.corpus.io.FileIOAdapter
 
fileList - 类 中的变量com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread
这个线程负责处理这些事情
fill(List<E>, E) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.std
 
FILTER - 类 中的静态变量com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
核心停用词典的核心过滤器,词性属于名词、动词、副词、形容词,并且不在停用词表中才不会被过滤
Filter - com.hankcs.hanlp.dictionary.stopword中的接口
停用词词典过滤器
finalize() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
 
findOverlappingRanges(IntervalNode, Intervalable) - 类 中的静态方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
是对IntervalNode.findOverlaps(Intervalable)的一个包装,防止NPE
findOverlaps(Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
寻找与interval有重叠的区间
findOverlaps(Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalTree
寻找重叠区间
first - 类 中的变量com.hankcs.hanlp.collection.dartsclone.Pair
 
first - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
 
firstChar() - 枚举 中的方法com.hankcs.hanlp.corpus.tag.Nature
词性的首字母
词性根据开头的几个字母可以判断大的类别
firstLabel() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.Item
获取首个label
fix(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer
 
fix_embeddings - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
fixResultByRule(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
通过规则修正一些结果
floatToBytes(float) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个浮点数转换为字节数组(4个字节),b[0]存储高位字符,大端
FolderWalker - com.hankcs.hanlp.corpus.io中的类
遍历目录工具类
FolderWalker() - 类 的构造器com.hankcs.hanlp.corpus.io.FolderWalker
 
forms - 类 中的变量com.hankcs.hanlp.dependency.nnparser.Dependency
 
FragmentToken - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
 
FragmentToken(String) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.FragmentToken
 
freq(String) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
freq(char[]...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
freq(char...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
frequency - 类 中的变量com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
词性对应的词频
frequency - 类 中的变量com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
词性对应的词频
from - 类 中的变量com.hankcs.hanlp.dependency.common.Edge
 
from - 类 中的变量com.hankcs.hanlp.seg.common.EdgeFrom
 
from - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
到该节点的最短路径的前驱节点
from - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.PathNode
节点前驱
from - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.QueueElement
边的起点
fromString(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.Nature
安全地将字符串类型的词性转为Enum类型,如果未定义该词性,则返回null

G

GenerateBiGraph(WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
生成二元词图
generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
生成能够代表这个句子的键
generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer
 
generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer
 
generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer
 
generateParameter(Table, int) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
 
generateSingleWordContext(CoNLLWord[], int, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
 
generateUniContext(CoNLLWord[], int, int) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
 
GenerateWord(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
对粗分结果执行一些规则上的合并拆分等等,同时合成新词网
GenerateWordNet(WordNet) - 类 中的方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
生成一元词网
get(String) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
获取值
get(int) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
get(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
get(char[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
get(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
get(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
 
get(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
 
get(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
get(char[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
get(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
精确查询
get(char[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
get(int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
get(char[]) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
get(String) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
get(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
get(IWord) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
get(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
查询一个单词
get(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
查找是否有该后缀
get(int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get a single element.
get(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
查询一个单词
get(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
 
get(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx
 
get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
获取条目
get(int) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
获取条目
get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
获取一个词的同义词(意义完全相同的,即CommonSynonymDictionary.SynonymItem.type == Synonym.Type.EQUAL的)列表
get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
 
get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
查单词
get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
 
get(char) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharType
获取字符的类型
get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
 
get(String) - 类 中的静态方法com.hankcs.hanlp.model.bigram.BigramDependencyModel
 
get(String, String, String, String) - 类 中的静态方法com.hankcs.hanlp.model.bigram.BigramDependencyModel
获取一个词和另一个词最可能的依存关系
get(String) - 类 中的方法com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
 
get(String, String) - 类 中的方法com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
 
get(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.Table
获取表中某一个元素
get(char[]...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
get(char...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
get(int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
获取某一行的所有节点
get(int, int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
获取某一行长度为length的节点
get(Object) - 类 中的静态方法com.hankcs.hanlp.utility.GlobalObjectPool
获取对象
getAllStrings() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
取出所有key
Retrieves all the valid Strings that have been inserted in to the MDAG.
getArray() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Access the internal two-dimensional array.
getArrayCopy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Copy the internal two-dimensional array.
getAttribute() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
获取词的属性
getAttribute(String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
从HanLP的词库中提取某个单词的属性(包括核心词典和用户词典)
getAttribute(Term) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
从HanLP的词库中提取某个单词的属性(包括核心词典和用户词典)
getBase() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
获取base数组引用,不要修改base
getBestPath() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
获取唯一一条最短路径,当然最短路径可能不只一条
getBiFrequency(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
获取共现频次
getBiFrequency(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
获取共现频次
getBiFrequency(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
获取共现频次
getBiFrequency(int, int) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
获取共现频次
getBiGram() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
获取二阶共现
getBytes() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
获取全部字节
getBytes(InputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
getChar() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
getChar() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
getCharCount(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
得到字符集的字符在字符串中出现的次数
getCheck() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
获取check数组引用,不要修改check
getChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
获取子节点
getChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
getChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.Node
 
getColumnDimension() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get column dimension.
getColumnPackedCopy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Make a one-dimensional column packed copy of the internal array.
getComplexSentenceList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词
getConstantInverse() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
 
getCorrectionConstant() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
 
getCorrectionParam() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
 
getDA() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
 
getDeprelTranslator() - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
 
getDeprelTranslator() - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
获取依存关系映射表
getDepth() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
获取节点深度
getDepth() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
获取节点深度
getEdge(Node, Node) - 类 中的方法com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
打分
getEdgeArray() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
获取边的列表,edge[i][j]表示id为i的词语与j存在一条依存关系为该值的边,否则为null
getEdgeListTo(int) - 类 中的方法com.hankcs.hanlp.seg.common.Graph
获取到达顶点to的边列表
getEdgesTo() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
 
getEmit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.FragmentToken
 
getEmit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.MatchToken
 
getEmit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
 
getEnd() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
getEnd() - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Intervalable
终点
getEntrySet() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermOccurrence
 
getFirst() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
 
getFirst(int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
获取某一行的第一个节点
GetFirst() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
读取第一个元素,但不执行DeQueue操作
getFirstChar() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取首字母
getFirstCharArray() - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
 
getFragment() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
 
getFrequency(E) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
getFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
getFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
获取频次
getFrequency() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
 
getFrequency(String, String) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
获取转移频次
getFrequency(E, E) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
获取转移频次
getFrequency() - 类 中的方法com.hankcs.hanlp.seg.common.Term
获取本词语在HanLP词库中的频次
getFrequency(String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
获取某个单词的词频
getHead() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取输入法头
getHeadString() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取输入法头
getId() - 接口 中的方法com.hankcs.hanlp.corpus.synonym.ISynonym
获取ID
getId() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
 
getIdString() - 接口 中的方法com.hankcs.hanlp.corpus.synonym.ISynonym
获取字符类型的ID
getIdString() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
 
getIncomingTransitionCount() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Retrieves this node's incoming _transition count
getIndex() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
 
getKey() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
 
getKeyword() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Emit
获取对应的模式串
getKeyword(String) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
提取关键词
getKeywordList(String, int) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankKeyword
提取关键词
getLA() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
 
getLabel() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
getLabel() - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
 
getLabel() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
 
getLargestValueId() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
获取最大的值
getLength() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
 
getLetter() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Retrieves the character representing the _transition laben leading up to this node.
getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
获取语义标签
getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
获取语义标签
getLongestSuffixLength(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
获取最长的后缀
getMatrix(int, int, int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get a submatrix.
getMatrix(int[], int[]) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get a submatrix.
getMatrix(int, int, int[]) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get a submatrix.
getMatrix(int[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get a submatrix.
getMaxSynonymItemIdDistance() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
获取最大id
getMostLikelyLabel() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
getNature() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
获取该节点的词性,如果词性还未确定,则返回null
getNature() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.AtomNode
原子的词性
getNatureFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
已过时。
推荐使用Nature参数!
getNatureFrequency(Nature) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
获取词性的词频
getNatureFrequency(String) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
已过时。
推荐使用Nature参数!
getNatureFrequency(Nature) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
获取词性的词频
GetNext() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
读取上次读取后的下一个元素,不执行DeQueue操作
getNonzeroSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getNPaths(int) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
从短到长获取至多 n 条路径
getNPaths() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
获取前10条最短路径
getNumOutcomes() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
 
getOffset() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
 
getOffset() - 类 中的方法com.hankcs.hanlp.dictionary.BaseSearcher
获取当前偏移
getOffset() - 类 中的方法com.hankcs.hanlp.seg.Other.LongestBinSegmentToy
获取当前偏移,如果想要知道next分出的词string的起始偏移,那么用 getOffset() - string.length 就行了。
getOutcomes() - 类 中的方法com.hankcs.hanlp.model.maxent.Context
获取输出
getOutgoingTransitionCount() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Retrieves this node's outgoing _transition count.
getOutgoingTransitions() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Retrieves this node's outgoing transitions.
getOutgoingTransitionSetSize() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Retrieves the size of this node's outgoing _transition set.
getPairFrequency(String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
getParameters() - 类 中的方法com.hankcs.hanlp.model.maxent.Context
获取参数
getParams() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
 
getPaths(int) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
获取前index+1短的路径
getPhraseByLe() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
getPhraseByMi() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
getPhraseByRe() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
getPhraseByScore() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
getPinyin(int) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter
 
getPinyinWithoutTone() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取纯字母的拼音
getPinyinWithToneMark() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取带音调的拼音
getRank(List<Term>) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
使用已经分好的词来计算rank
getRealWord() - 接口 中的方法com.hankcs.hanlp.corpus.synonym.ISynonym
获取原本的词语
getRealWord() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
 
getRealWord() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
获取真实词
getResourceAsStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
class.getResourceAsStream的wrapper,在资源不存在的情况下抛出IOException,
getRowDimension() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Get row dimension.
getRowPackedCopy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Make a one-dimensional row packed copy of the internal array.
getSearcher(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getSearcher(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getSearcher(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
 
getSearcher(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
 
getSearcher(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
 
getSearcher(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
获取一个BinTrie的查询工具
getSearcher(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
 
getSearcher(char[], DoubleArrayTrie<Pinyin[]>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
 
getSearcher(char[], DoubleArrayTrie<String>) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
 
getSecond() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
 
getSegment() - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
 
getSegment() - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
获取Parser使用的分词器
getShengmu() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取声母
getSimpleMDAGArray() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
获取简化后的状态Array
Returns the array of SimpleMDAGNodes collectively containing the data of this MDAG, or null if it hasn't been simplified yet.
getSimpleSentenceList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
获取简单的句子列表,其中复合词会被拆分为简单词
getSimpleSentenceList(boolean) - 类 中的方法com.hankcs.hanlp.corpus.document.Document
获取简单的句子列表
getSimpleSentenceList(Set<String>) - 类 中的方法com.hankcs.hanlp.corpus.document.Document
获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词
getSimpleWordList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
 
getSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getStart() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
getStart() - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Intervalable
起点
getStates() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
 
getStates() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
 
getStatus() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
获取节点的成词状态
getStringsEndingWith(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
后缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
getStringsStartingWith(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
前缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
getStringsWithSubstring(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
返回包含字串的key
Retrieves all the Strings in the MDAG that contain a given String.
getSuccess() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
获取goto表
getSuffix(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
获取最后一个分隔符的后缀
getsum() - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
getSummary(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
自动摘要
getSummary(String, int) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankSentence
一句话调用接口
getTagId(String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
获取某个tag的ID
getTerm() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
 
getTermAndRank(String) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
返回全部分词结果和对应的rank
getTermAndRank(String, Integer) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
返回分数最高的前size个分词结果和对应的rank
getTermFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
获取词频
getTermFrequency(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
获取词频
getTone() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取声调
getTopSentence(int) - 类 中的方法com.hankcs.hanlp.summary.TextRankSentence
获取前几个关键句子
getTopSentenceList(String, int) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankSentence
一句话调用接口
getTotalFrequency() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
获取全部频次
getTotalFrequency(E) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
获取e的总频次
getTotalFrequency() - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
获取所有标签的总频次
getTotalSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
 
getTransitionPathNodes(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
获取一个字符串路径上经过的节点
Retrieves the nodes in the _transition path starting from this node corresponding to a given String .
getTransitions() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
 
getTransitions() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
 
getTransitionSetBeginIndex() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Retrieves the index in a simplified mdag data array that the SimpleMDAGNode representation of this node's outgoing _transition set begins at.
getTransitionSetBeginIndex() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Retrieves the index in this node's containing array that its _transition set begins at.
getTrie() - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
已过时。
谨慎操作,有可能废弃此接口
getTrie() - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
 
getTriGram() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
获取三阶共现
getUA() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
 
getUniGram() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
获取一阶共现,其实就是词频统计
getUnitSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getUnsigned(byte) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
获取字节对应的无符号整型数
getValue() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
 
getValue() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
获取节点对应的值
getValue() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
getValue() - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
 
getValue() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
 
getValueArray(V[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
getValueArray(V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
getValueArray(V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
getValueArray(V[]) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
getValueAt(int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
获取index对应的值
getVertexes() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
 
getVertexes() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
获取内部顶点表格,谨慎操作!
getWordArray() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
 
getWordArrayWithRoot() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
获取包含根节点在内的单词数组
getWordID(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary
获取词语的ID
getWordID(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
获取词语的ID
getWordID(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
获取词语的ID
GetWordInfo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
 
getWordList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
获取单词序列
getYunmu() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
获取韵母
GlobalObjectPool - com.hankcs.hanlp.utility中的类
全局对象缓存池
用于储存那些体积庞当的模型,如果该模型已经被加载过一次,那么就不需要重新加载。
GlobalObjectPool() - 类 的构造器com.hankcs.hanlp.utility.GlobalObjectPool
 
Graph - com.hankcs.hanlp.seg.common中的类
 
Graph(Vertex[]) - 类 的构造器com.hankcs.hanlp.seg.common.Graph
将一个词网转为词图
Graph - com.hankcs.hanlp.seg.Viterbi.Path中的类
 
Graph(List<Vertex>[]) - 类 的构造器com.hankcs.hanlp.seg.Viterbi.Path.Graph
 
guessNature() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
猜测最可能的词性,也就是这个节点的词性中出现频率最大的那一个词性

H

handle(Document) - 接口 中的方法com.hankcs.hanlp.corpus.document.CorpusLoader.Handler
 
handle(String) - 类 中的方法com.hankcs.hanlp.corpus.io.LineHandler
 
handle(String[]) - 类 中的方法com.hankcs.hanlp.corpus.io.LineHandler
 
HandlerThread(String) - 类 的构造器com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread
 
HanLP - com.hankcs.hanlp中的类
HanLP: Han Language Processing
汉语言处理包
常用接口工具类
HanLP.Config - com.hankcs.hanlp中的类
库的全局配置,既可以用代码修改,也可以通过hanlp.properties配置(按照 变量名=值 的形式)
HANLP_PROPERTIES_PATH - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
hanlp.properties的路径,一般情况下位于classpath目录中。
hasChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
是否含有子节点
hashCode() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
hashCode() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Hashes this node using its accept state status and set of outgoing _transition paths.
hasMore() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
 
hasMore() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
 
hasNature(Nature) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
是否有某个词性
hasNature(Nature) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
 
hasNature(List<Term>, Nature) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
句子中是否含有词性
hasNatureStartsWith(String) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
是否有以某个前缀开头的词性
hasNext() - 类 中的方法com.hankcs.hanlp.corpus.io.IOUtil.LineIterator
 
hasOutgoingTransition(char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Determines whether this node has an outgoing _transition with a given label.
hasTransitions() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Determines whether this node has any outgoing transitions.
haveSameTransitions(MDAGNode, MDAGNode) - 类 中的静态方法com.hankcs.hanlp.collection.MDAG.MDAGNode
是否含有相同的转移函数
HEAD - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
当前词语的中心词
Head - com.hankcs.hanlp.dictionary.py中的枚举
拼音输入法头
heads - 类 中的变量com.hankcs.hanlp.dependency.nnparser.Dependency
 
hidden_layer_size - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
Hit(int, int, V) - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
 
hit(int, int, V) - 接口 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.IHit
命中一个模式串
hit(int, int, V, int) - 接口 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.IHitFull
命中一个模式串
hk2s(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
香港繁體到簡體
hk2t(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
香港繁體到繁體
hk2tw(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
香港繁體到臺灣正體
HMMSegment - com.hankcs.hanlp.seg.HMM中的类
基于2阶HMM(A Second-Order Hidden Markov Model, TriGram3阶文法模型)+ BMES序列标注的分词器
HMMSegment() - 类 的构造器com.hankcs.hanlp.seg.HMM.HMMSegment
 
HMMSegment(String) - 类 的构造器com.hankcs.hanlp.seg.HMM.HMMSegment
 
HMMSegmentModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
HMM分词模型
HongKongToSimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
香港繁体转简体
HongKongToSimplifiedChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.HongKongToSimplifiedChineseDictionary
 
HongKongToTaiwanChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
香港繁体转台湾繁体
HongKongToTaiwanChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.HongKongToTaiwanChineseDictionary
 
HongKongToTraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
香港繁体转繁体
HongKongToTraditionalChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.HongKongToTraditionalChineseDictionary
 

I

ICacheAble - com.hankcs.hanlp.corpus.io中的接口
可写入或读取二进制
id - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
第一个值化为id
ID - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
ID 当前词在句子中的序号,1开始.
id - 类 中的变量com.hankcs.hanlp.corpus.synonym.Synonym
 
id - 类 中的变量com.hankcs.hanlp.dependency.common.Node
 
id - 类 中的变量com.hankcs.hanlp.dependency.common.State
 
id2tag - 类 中的变量com.hankcs.hanlp.model.crf.CRFModel
id转标签
idArrayList - 类 中的变量com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
 
identity(int, int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.Matrix
Generate identity matrix
IDependencyParser - com.hankcs.hanlp.dependency中的接口
依存句法分析器接口
idOf(char[]) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
label转id
idOf(String) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
label转id
IdVector - com.hankcs.hanlp.suggest.scorer.lexeme中的类
一个同义词有多个id,多个同义词用这个封装做key
IdVector(String) - 类 的构造器com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
 
IdVector(List<Long[]>) - 类 的构造器com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
 
IdVectorScorer - com.hankcs.hanlp.suggest.scorer.lexeme中的类
单词语义向量打分器
IdVectorScorer() - 类 的构造器com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer
 
IIOAdapter - com.hankcs.hanlp.corpus.io中的接口
IO适配器接口
实现该接口以移植HanLP到不同的平台
increase(int) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
频次增加若干
increase() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
频次加一
index - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
key的字典序坐标
index - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
在一维顶点数组中的下标,可以视作这个顶点的id
index - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.PathNode
节点在顶点数组中的下标
index - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.QueueElement
边的终点在顶点数组中的下标
indexMode - 类 中的变量com.hankcs.hanlp.seg.Config
是否是索引分词(合理地最小分割)
IndexTokenizer - com.hankcs.hanlp.tokenizer中的类
索引分词器
IndexTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.IndexTokenizer
 
INFO_LOG(String, Object...) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.Log
 
init_range - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
innerList - 类 中的变量com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
由这些词复合而来
insert(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
往自定义词典中插入一个新词(覆盖模式)
动态增删不会持久化到词典文件
insert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
以覆盖模式增加新词
动态增删不会持久化到词典文件
insert(int, Vertex, WordNet) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
添加顶点,同时检查此顶点是否悬孤,如果悬孤则自动补全
Instance - com.hankcs.hanlp.dependency.nnparser中的类
 
Instance() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Instance
 
Integer2PinyinConverter - com.hankcs.hanlp.dictionary.py中的类
将整型转为拼音
Integer2PinyinConverter() - 类 的构造器com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter
 
Interval - com.hankcs.hanlp.algorithm.ahocorasick.interval中的类
区间
Interval(int, int) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
构造一个区间
Intervalable - com.hankcs.hanlp.algorithm.ahocorasick.interval中的接口
区间接口
IntervalableComparatorByPosition - com.hankcs.hanlp.algorithm.ahocorasick.interval中的类
按起点比较区间
IntervalableComparatorByPosition() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalableComparatorByPosition
 
IntervalableComparatorBySize - com.hankcs.hanlp.algorithm.ahocorasick.interval中的类
按照长度比较区间,如果长度相同,则比较起点
IntervalableComparatorBySize() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalableComparatorBySize
 
IntervalNode - com.hankcs.hanlp.algorithm.ahocorasick.interval中的类
线段树上面的节点,实际上是一些区间的集合,并且按中点维护了两个节点
IntervalNode(List<Intervalable>) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
构造一个节点
IntervalTree - com.hankcs.hanlp.algorithm.ahocorasick.interval中的类
线段树,用于检查区间重叠
IntervalTree(List<Intervalable>) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalTree
构造线段树
intToBytes(int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个整数转换位字节数组(4个字节),b[0]存储高位字符,大端
IOAdapter - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
IO适配器(默认null,表示从本地文件系统读取),实现com.hankcs.hanlp.corpus.io.IIOAdapter接口 以在不同的平台(Hadoop、Redis等)上运行HanLP
IOUtil - com.hankcs.hanlp.corpus.io中的类
一些常用的IO操作
IOUtil() - 类 的构造器com.hankcs.hanlp.corpus.io.IOUtil
 
IOUtil.LineIterator - com.hankcs.hanlp.corpus.io中的类
方便读取按行读取大文件
IPhraseExtractor - com.hankcs.hanlp.phrase中的接口
从一篇文章中自动识别出最可能的短语
is_left_arc(Action, int[]) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionUtils
 
is_right_arc(Action, int[]) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionUtils
 
is_shift(Action) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionUtils
 
isAcceptable() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
是否是终止状态
isAcceptNode() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Retrieves the accept state status of this node.
isAcceptNode() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Retrieves the accept state status of this node.
isAllChinese(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全是中文
isAllChineseNum(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全是中国数字
isAllDelimiter(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全是分隔符
isAllIndex(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全是序号
isAllLetter(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全为英文
isAllLetterOrNum(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全为英文或字母
isAllNonChinese(byte[]) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全部不是中文
isAllNum(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全是数字
isAllowOverlaps() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.TrieConfig
是否允许重叠
isAllSingleByte(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
是否全是单字节
isArabicNumber(char) - 类 中的静态方法com.hankcs.hanlp.utility.CharacterHelper
 
ISaveAble - com.hankcs.hanlp.corpus.dictionary中的接口
 
isBadCase(String) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition
是否是bad case
isBlank(CharSequence) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断字符串是否为空(null和空格)
isChinese(char) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断某个字符是否为汉字
isCJKCharacter(char) - 类 中的静态方法com.hankcs.hanlp.utility.CharacterHelper
 
isConfluenceNode() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Determines if this node is a confluence node (defined as a node with two or more incoming transitions
IScorer - com.hankcs.hanlp.suggest.scorer中的接口
打分接口
isDBCCase(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断该字符串是否是半角字符
isDelimiter(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断是否是一个连字符(分隔符)
isEmpty() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
isEmpty() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
isEnglishLetter(char) - 类 中的静态方法com.hankcs.hanlp.utility.CharacterHelper
 
ISentenceKey<T> - com.hankcs.hanlp.suggest.scorer中的接口
可以唯一代表一个句子的键,可以与其他句子区别开来
isFileExists(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
判断文件是否存在
isInAggregate(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断一个字符串的所有字符是否在另一个字符串集合中
isMatch() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.FragmentToken
 
isMatch() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.MatchToken
 
isMatch() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
 
isResource(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
判断资源是否位于jar中
isRight() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.PairFrequency
该共现是否统计的是否是从左到右的顺序
isSBCCase(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断该字符串是否是全角字符
isSpaceLetter(char) - 类 中的静态方法com.hankcs.hanlp.utility.CharacterHelper
 
ISuggester - com.hankcs.hanlp.suggest中的接口
 
isUnknownWord(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
 
isYearTime(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
判断字符串是否是年份
ISynonym - com.hankcs.hanlp.corpus.synonym中的接口
同义词接口
Item - com.hankcs.hanlp.corpus.dictionary.item中的类
词典中的一个条目,比如“希望 v 7685 vn 616”
Item(String, String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.Item
 
Item(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.Item
 
iterator() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
iterator() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
 
ITrie<V> - com.hankcs.hanlp.collection.trie中的接口
trie树接口
IWord - com.hankcs.hanlp.corpus.document.sentence.word中的接口
词语接口

J

japaneseNameRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
是否识别日本人名
JapanesePersonDictionary - com.hankcs.hanlp.dictionary.nr中的类
 
JapanesePersonDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
 
JapanesePersonDictionary.Searcher - com.hankcs.hanlp.dictionary.nr中的类
最长分词
JapanesePersonDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
日本人名词典路径
JapanesePersonRecognition - com.hankcs.hanlp.recognition.nr中的类
日本人名识别
JapanesePersonRecognition() - 类 的构造器com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition
 
join(String, Collection<String>) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
 

K

key - 类 中的变量com.hankcs.hanlp.corpus.dictionary.item.Item
该条目的索引,比如“啊”
keySet() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
Keyset - com.hankcs.hanlp.collection.dartsclone.details中的类
key set,其实也包含值(每个key都有一个整型数)
Keyset(byte[][], int[]) - 类 的构造器com.hankcs.hanlp.collection.dartsclone.details.Keyset
构造一个KeySet
keySet() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
 
keySet() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
键集合
keySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
keySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
键集合
keySet() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonStringDictionary
 
KeywordExtractor - com.hankcs.hanlp.summary中的类
提取关键词的基类
KeywordExtractor() - 类 的构造器com.hankcs.hanlp.summary.KeywordExtractor
 
kLeftArc - 接口 中的静态变量com.hankcs.hanlp.dependency.nnparser.action.ActionType
建立右焦点词依存于左焦点词的依存关系
kNone - 接口 中的静态变量com.hankcs.hanlp.dependency.nnparser.action.ActionType
无效动作,正常情况下不会用到
kRightArc - 接口 中的静态变量com.hankcs.hanlp.dependency.nnparser.action.ActionType
建立左焦点词依存于右焦点词的依存关系
kShift - 接口 中的静态变量com.hankcs.hanlp.dependency.nnparser.action.ActionType
不建立依存关系,只转移句法分析的焦点,即新的左焦点词是原来的右焦点词,依此类推。

L

l - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
每个key的长度
label - 类 中的变量com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
label - 类 中的变量com.hankcs.hanlp.corpus.document.sentence.word.Word
单词的标签,比如“n”
label - 类 中的变量com.hankcs.hanlp.dependency.common.Edge
 
label - 类 中的变量com.hankcs.hanlp.dependency.common.Node
 
label - 类 中的变量com.hankcs.hanlp.seg.common.ResultTerm
 
labelMap - 类 中的变量com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
labelMap - 类 中的变量com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
该条目的标签
labelOf(int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
id转label
labelSet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
lambda - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
le - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
左信息熵
learn(List<Word>) - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
让模型观测一个句子
LearnOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
LearnOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.LearnOption
 
LEMMA - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
当前词语(或标点)的原型或词干,在中文中,此列与FORM相同
length() - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
length - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
key的长度
length() - 类 中的方法com.hankcs.hanlp.seg.common.Term
长度
LexiconUtility - com.hankcs.hanlp.utility中的类
跟词语与词性有关的工具类,可以全局动态修改HanLP内部词库
LexiconUtility() - 类 的构造器com.hankcs.hanlp.utility.LexiconUtility
 
LineHandler - com.hankcs.hanlp.corpus.io中的类
 
LineHandler(String) - 类 的构造器com.hankcs.hanlp.corpus.io.LineHandler
 
LineHandler() - 类 的构造器com.hankcs.hanlp.corpus.io.LineHandler
 
LineIterator(String) - 类 的构造器com.hankcs.hanlp.corpus.io.IOUtil.LineIterator
 
load(ObjectInputStream, V[]) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
载入
load(ByteArray, V[]) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
载入
load(ByteArray, V[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
 
load(String, V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
从磁盘加载二分数组树
load(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
只加载值,此时相当于一个set
load(ByteArray, _ValueArray) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
load(ByteArray, V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
load(String, List<V>) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
从磁盘加载,需要额外提供值
load(String, V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
从磁盘加载,需要额外提供值
load(ByteArray, V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
load(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
载入双数组,但是不提供值,此时本trie相当于一个set
load(ByteArray, V[]) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
load(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
从磁盘加载
load(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
 
load(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
加载词典
load(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
加载词典
load(ByteArray) - 接口 中的方法com.hankcs.hanlp.corpus.io.ICacheAble
载入
load(String) - 类 中的静态方法com.hankcs.hanlp.corpus.nr.NRCorpusLoader
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
 
load(String) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkParser
加载parser模型
load(ByteArray) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkParser
从bin加载
load(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
 
load(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
 
load(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonStringDictionary
 
load(InputStream) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
 
load(InputStream) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx
 
load(String, Nature, TreeMap<String, CoreDictionary.Attribute>, LinkedHashSet<Nature>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
加载用户词典(追加)
load(String) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
 
load(String) - 类 中的静态方法com.hankcs.hanlp.model.crf.CRFModel
加载CRF++模型
如果存在缓存的话,优先读取缓存,否则读取txt,并且建立缓存
load(ByteArray) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureFunction
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.model.CRFSegmentModel
 
load(String) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
加载最大熵模型
如果存在缓存的话,优先读取缓存,否则读取txt,并且建立缓存
load(ByteArray) - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
 
load(ByteArray) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
loadAsItemList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
读取所有条目
loadBin(String) - 类 中的静态方法com.hankcs.hanlp.model.crf.CRFModel
加载Bin形式的CRF++模型
注意该Bin形式不是CRF++的二进制模型,而是HanLP由CRF++的文本模型转换过来的私有格式
loadCorpus(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
loadDictionary(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
加载词典,词典必须遵守HanLP核心词典格式
loadDictionary(BufferedReader, TreeMap<String, CoreDictionary.Attribute>) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
将一个BufferedReader中的词条加载到词典
loadDictionary(String...) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
 
loadSentenceList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader
 
loadSentenceList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
loadTxt(String) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkParser
从txt加载
loadTxt(String, CRFModel) - 类 中的静态方法com.hankcs.hanlp.model.crf.CRFModel
加载Txt形式的CRF++模型
loadTxt(String) - 类 中的静态方法com.hankcs.hanlp.model.crf.CRFModel
加载Txt形式的CRF++模型
同时生成path.bin模型缓存
Log - com.hankcs.hanlp.dependency.nnparser.util中的类
 
Log() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.util.Log
 
logger - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
日志组件
logPrior(double[]) - 类 中的方法com.hankcs.hanlp.model.maxent.UniformPrior
获取先验概率
long2char(long) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
转换long型为char数组
long2String(long) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
转换long类型为string
LongestBinSegmentToy<V> - com.hankcs.hanlp.seg.Other中的类
最长分词玩具
LongestBinSegmentToy(BinTrie<V>) - 类 的构造器com.hankcs.hanlp.seg.Other.LongestBinSegmentToy
 
LongestCommonSubsequence - com.hankcs.hanlp.algorithm中的类
最长公共子序列(Longest Common Subsequence)指的是两个字符串中的最长公共子序列,不要求子序列连续。
LongestCommonSubsequence() - 类 的构造器com.hankcs.hanlp.algorithm.LongestCommonSubsequence
 
LongestCommonSubstring - com.hankcs.hanlp.algorithm中的类
求最长公共字串的长度
最长公共子串(Longest Common Substring)指的是两个字符串中的最长公共子串,要求子串一定连续
LongestCommonSubstring() - 类 的构造器com.hankcs.hanlp.algorithm.LongestCommonSubstring
 
longToBytes(long) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
将一个长整数转换位字节数组(8个字节),b[0]存储高位字符,大端

M

M - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
M_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
make(String) - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
Make a new enum instance, without adding it to the values array and using the default ordinal of 0.
make(String, int) - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
Make a new enum instance with the given ordinal.
make(String, int, Class[], Object[]) - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
Make a new enum instance with the given value, ordinal and additional parameters.
make_left_arc(int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
建立右焦点词依存于左焦点词的依存关系
make_right_arc(int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
建立左焦点词依存于右焦点词的依存关系
make_shift() - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
不建立依存关系,只转移句法分析的焦点,即新的左焦点词是原来的右焦点词,依此类推。
makeEdge(Node[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.MaxEntDependencyParser
 
makeEdge(Node[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.MinimumSpanningTreeParser
 
makeEdge(Node[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.WordNatureDependencyParser
 
makeModel(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
 
makeModel(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker
 
makeToneToTheSame(List<Pinyin>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
将所有音调都转为1
MatchToken - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
匹配到的片段
MatchToken(String, Emit) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.MatchToken
 
math - com.hankcs.hanlp.dependency.nnparser.util中的类
 
math() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.util.math
 
MathTools - com.hankcs.hanlp.utility中的类
 
MathTools() - 类 的构造器com.hankcs.hanlp.utility.MathTools
 
Matrix - com.hankcs.hanlp.dependency.nnparser中的类
Jama = Java Matrix class.
Matrix(int, int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
Construct an m-by-n matrix of zeros.
Matrix(int, int, double) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
Construct an m-by-n constant matrix.
Matrix(double[][]) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
Construct a matrix from a 2-D array.
Matrix(double[][], int, int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
Construct a matrix quickly without checking arguments.
Matrix(double[], int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
Construct a matrix from a one-dimensional packed array
Matrix() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
 
matrix - 类 中的变量com.hankcs.hanlp.model.crf.CRFModel
tag的二元转移矩阵,适用于BiGram Feature
MAX_FREQUENCY - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
MAX_INDEX_LENGTH - 类 中的静态变量com.hankcs.hanlp.corpus.synonym.SynonymHelper
尾数的长度,表示原子词的index
MAX_SEGMENT_NUM - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
MAX_WORDS - 类 中的静态变量com.hankcs.hanlp.corpus.synonym.SynonymHelper
同一行最多支持编码这么多个单词
MAX_WORDS - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
MaxEntDependencyModelMaker - com.hankcs.hanlp.corpus.dependency.model中的类
最大熵模型构建工具,训练暂时不使用自己的代码,借用opennlp训练。
MaxEntDependencyModelMaker() - 类 的构造器com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
 
MaxEntDependencyParser - com.hankcs.hanlp.dependency中的类
最大熵句法分析器
MaxEntDependencyParser(MaxEntModel) - 类 的构造器com.hankcs.hanlp.dependency.MaxEntDependencyParser
 
MaxEntDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.MaxEntDependencyParser
 
MaxEntModel - com.hankcs.hanlp.model.maxent中的类
最大熵模型,采用双数组Trie树加速,值得拥有
MaxEntModel() - 类 的构造器com.hankcs.hanlp.model.maxent.MaxEntModel
 
MaxEntModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
最大熵-依存关系模型
MaxHeap<E> - com.hankcs.hanlp.algorithm中的类
用固定容量的优先队列模拟的最大堆,用于解决求topN大的问题
MaxHeap(int, Comparator<E>) - 类 的构造器com.hankcs.hanlp.algorithm.MaxHeap
构造最大堆
MDAG - com.hankcs.hanlp.collection.MDAG中的类
最小环形图
A minimalistic directed acyclical graph suitable for storing a set of Strings.
MDAG(String) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
从文件路径构造
MDAG(File) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
从一个文件建立MDAG
Creates an MDAG from a newline delimited file containing the data of interest.
MDAG(BufferedReader) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
从一个打开的BufferedReader构造
MDAG(Collection<String>) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
Creates an MDAG from a collection of Strings.
MDAG() - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
空白图
mdagDataArray - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
调用simplify()后填充此空间
MDAGMap<V> - com.hankcs.hanlp.collection.MDAG中的类
最好不要把MDAG当map用,现在的实现在key后面放一个int,导致右语言全部不同,退化为bintrie
MDAGMap() - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGMap
 
MDAGNode - com.hankcs.hanlp.collection.MDAG中的类
MDAG中的一个节点
The class which represents a node in a MDAG.
MDAGNode(boolean) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGNode
建立一个节点
Constructs an MDAGNode.
MDAGSet - com.hankcs.hanlp.collection.MDAG中的类
基于MDAG(又称DAWG,Minimal Acyclic Finite-State Automata)的String Set
MDAGSet(File) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
 
MDAGSet(Collection<String>) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
 
MDAGSet() - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
 
MDAGSet(String) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
 
meet(String, State) - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie.IWalker
遇到了一个节点
mergeContinuousNsIntoOne() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
将连续的ns节点合并为一个
mergeNumberQuantifier(List<Vertex>, WordNet, Config) - 类 中的方法com.hankcs.hanlp.seg.Segment
合并数字
mi - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
互信息值
MIN_PROBABILITY - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
MinimumSpanningTreeParser - com.hankcs.hanlp.dependency中的类
 
MinimumSpanningTreeParser() - 类 的构造器com.hankcs.hanlp.dependency.MinimumSpanningTreeParser
 
minus(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
C = A - B
minusEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
A = A - B
MutualInformationEntropyPhraseExtractor - com.hankcs.hanlp.phrase中的类
利用互信息和左右熵的短语提取器
MutualInformationEntropyPhraseExtractor() - 类 的构造器com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor
 

N

NAME - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
等效字符串
name() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
 
NameDictionaryMaker - com.hankcs.hanlp.corpus.nr中的类
 
NameDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.nr.NameDictionaryMaker
 
nameRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
是否识别中国人名
nature - 类 中的变量com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
词性列表
Nature - com.hankcs.hanlp.corpus.tag中的枚举
词性
nature - 类 中的变量com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
词性列表
nature - 类 中的变量com.hankcs.hanlp.seg.common.Term
词性
NatureDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
 
NatureDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker
 
ner - 类 中的变量com.hankcs.hanlp.seg.Config
命名实体识别是否至少有一项被激活
NetworkOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
NetworkOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.NetworkOption
 
NeuralNetworkClassifier - com.hankcs.hanlp.dependency.nnparser中的类
基于神经网络模型的分类器
NeuralNetworkDependencyParser - com.hankcs.hanlp.dependency.nnparser中的类
基于神经网络分类模型arc-standard转移动作的判决式依存句法分析器
NeuralNetworkDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.NeuralNetworkDependencyParser
 
NeuralNetworkParser - com.hankcs.hanlp.dependency.nnparser中的类
 
NeuralNetworkParser() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.NeuralNetworkParser
 
newAddressInstance(String) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个地名实例
newB() - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
生成线程安全的起始节点
newBufferedReader(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
创建一个BufferedReader
newBufferedWriter(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
创建一个BufferedWriter
newBufferedWriter(String, boolean) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
newE() - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
生成线程安全的终止节点
newInputStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
创建输入流(经过IO适配器创建)
newJapanesePersonInstance(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个日本人名实例
newNumberInstance(String) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个数词实例
newOrganizationInstance(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个机构名实例
newOutputStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
创建输出流(经过IO适配器创建)
newPersonInstance(String) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个人名实例
newPersonInstance(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个人名实例
newPlaceInstance(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个地名实例
newPunctuationInstance(String) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个标点符号实例
newSegment() - 类 中的静态方法com.hankcs.hanlp.HanLP
创建一个分词器
这是一个工厂方法
与直接new一个分词器相比,使用本方法的好处是,以后HanLP升级了,总能用上最合适的分词器
newTimeInstance(String) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个时间实例
newTranslatedPersonInstance(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.common.Vertex
创建一个音译人名实例
newValueArray() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
next() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
取出下一个命中输出
next() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher
 
next() - 类 中的方法com.hankcs.hanlp.corpus.io.IOUtil.LineIterator
 
next() - 类 中的方法com.hankcs.hanlp.dictionary.BaseSearcher
分出下一个词
next() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher
 
next() - 类 中的方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher
 
next() - 类 中的方法com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher
 
next() - 类 中的方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher
 
next() - 类 中的方法com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper
 
next - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.QueueElement
下一个,这是一个链表结构的最小堆
next() - 类 中的方法com.hankcs.hanlp.seg.Other.LongestBinSegmentToy
 
nextByte() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
读取一个字节
nextByte() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
nextChar() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
读取一个char,对应于writeChar
nextChar() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
nextDouble() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
 
nextDouble() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
nextFloat() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
 
nextFloat() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
nextInt() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
读取一个int
nextInt() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
 
nextState(Character) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
按照character转移,根节点转移失败会返回自己(永远不会返回null)
nextState(Character) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
按照character转移,根节点转移失败会返回自己(永远不会返回null)
nextStateIgnoreRootState(Character) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
按照character转移,任何节点转移失败会返回null
nextStateIgnoreRootState(Character) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
按照character转移,任何节点转移失败会返回null
nextString() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
读取一个String,注意这个String是双字节版的,在字符之前有一个整型表示长度
nextUnsignedShort() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
读取一个无符号短整型
nextUTF() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
读取一个UTF字符串
nextValue() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie._EmptyValueArray
 
nextValue() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie._ValueArray
 
NGramDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
2-gram词典制作工具
NGramDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
 
NIL - 类 中的静态变量com.hankcs.hanlp.dependency.nnparser.option.SpecialOption
 
NLPTokenizer - com.hankcs.hanlp.tokenizer中的类
可供自然语言处理用的分词器
NLPTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.NLPTokenizer
 
NNParserModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
神经网络依存模型路径
Node<V> - com.hankcs.hanlp.collection.trie.bintrie中的类
深度大于等于2的子节点
Node(char, BaseNode.Status, V) - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.Node
 
Node() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.Node
 
Node - com.hankcs.hanlp.dependency.common中的类
节点
Node(Term, int) - 类 的构造器com.hankcs.hanlp.dependency.common.Node
 
Node - com.hankcs.hanlp.seg.Viterbi.Path中的类
 
Node(Vertex) - 类 的构造器com.hankcs.hanlp.seg.Viterbi.Path.Node
 
nonZero(double) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
防止频率为0发生除零错误
norm1() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
One norm
normalization(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
正规化一些字符(原地正规化)
Normalization - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
是否执行字符正规化(繁体->简体,全角->半角,大写->小写),切换配置后必须删CustomDictionary.txt.bin缓存
normalizeFrequency(List<Item>) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
调整频次,按排序后的次序给定频次
normInf() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Infinity norm
NotionalTokenizer - com.hankcs.hanlp.tokenizer中的类
实词分词器,自动移除停用词
NotionalTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.NotionalTokenizer
 
nPOS - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.AtomNode
 
NR - com.hankcs.hanlp.corpus.tag中的枚举
人名标签
NR_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
NRConstant - com.hankcs.hanlp.dictionary.nr中的类
人名识别中常用的一些常量
NRConstant() - 类 的构造器com.hankcs.hanlp.dictionary.nr.NRConstant
 
NRCorpusLoader - com.hankcs.hanlp.corpus.nr中的类
对人名语料的解析,并且生成词典
NRCorpusLoader() - 类 的构造器com.hankcs.hanlp.corpus.nr.NRCorpusLoader
 
NRDictionary - com.hankcs.hanlp.dictionary.nr中的类
一个好用的人名词典
NRDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nr.NRDictionary
 
NRDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
nr词典(词典+ngram转移+词性转移矩阵)制作工具
NRDictionaryMaker(EasyDictionary) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker
 
NRPattern - com.hankcs.hanlp.dictionary.nr中的枚举
人名识别模式串
NS - com.hankcs.hanlp.corpus.tag中的枚举
地名角色标签
NS_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
NSDictionary - com.hankcs.hanlp.dictionary.ns中的类
一个好用的地名词典
NSDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ns.NSDictionary
 
NSDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
 
NSDictionaryMaker(EasyDictionary) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker
 
NShortPath - com.hankcs.hanlp.seg.NShort.Path中的类
 
NShortPath(Graph, int) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.NShortPath
构造一个N最短路径计算器
NShortSegment - com.hankcs.hanlp.seg.NShort中的类
N最短分词器
NShortSegment() - 类 的构造器com.hankcs.hanlp.seg.NShort.NShortSegment
 
NT - com.hankcs.hanlp.corpus.tag中的枚举
 
NT_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
NTDictionary - com.hankcs.hanlp.dictionary.nt中的类
一个好用的地名词典
NTDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nt.NTDictionary
 
NTDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
 
NTDictionaryMaker(EasyDictionary) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker
 
NULL - 类 中的静态变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
空白节点,用于描述下标超出word数组的词语
NULL - 类 中的静态变量com.hankcs.hanlp.dependency.common.Node
 
numberQuantifierRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
是否识别数字和量词
NX_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 

O

Occurrence - com.hankcs.hanlp.corpus.occurrence中的类
词共现统计,最多统计到三阶共现
Occurrence() - 类 的构造器com.hankcs.hanlp.corpus.occurrence.Occurrence
 
offset - 类 中的变量com.hankcs.hanlp.dictionary.BaseSearcher
指向当前处理字串的开始位置(前面的已经分词分完了)
offset - 类 中的变量com.hankcs.hanlp.seg.common.ResultTerm
 
offset - 类 中的变量com.hankcs.hanlp.seg.common.Term
在文本中的起始位置(需开启分词器的offset选项)
offset - 类 中的变量com.hankcs.hanlp.seg.Config
是否计算偏移量
onGenerateEntry(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
由参数构造一个词条
onGenerateEntry(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.StringDictionary
 
onGenerateEntry(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
 
onLoadTxtFinished() - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
 
onLoadTxtFinished() - 类 中的方法com.hankcs.hanlp.model.CRFSegmentModel
 
onLoadValue(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
实现此方法来加载值
onLoadValue(String) - 类 中的方法com.hankcs.hanlp.dictionary.nr.NRDictionary
 
onLoadValue(String) - 类 中的方法com.hankcs.hanlp.dictionary.ns.NSDictionary
 
onLoadValue(String) - 类 中的方法com.hankcs.hanlp.dictionary.nt.NTDictionary
 
onSave(Item) - 接口 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker.Filter
是否保存这个条目
onSaveValue(V[], String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
 
onSaveValue(EnumItem<NR>[], String) - 类 中的方法com.hankcs.hanlp.dictionary.nr.NRDictionary
 
onSaveValue(EnumItem<NS>[], String) - 类 中的方法com.hankcs.hanlp.dictionary.ns.NSDictionary
 
onSaveValue(EnumItem<NT>[], String) - 类 中的方法com.hankcs.hanlp.dictionary.nt.NTDictionary
 
open(InputStream) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
Read from a stream.
open(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
open(String) - 类 中的方法com.hankcs.hanlp.corpus.io.FileIOAdapter
 
open(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.FolderWalker
打开一个目录,获取全部的文件名
open(String) - 接口 中的方法com.hankcs.hanlp.corpus.io.IIOAdapter
打开一个文件以供读取
open(String) - 类 中的方法com.hankcs.hanlp.corpus.io.ResourceIOAdapter
 
OrganizationDictionary - com.hankcs.hanlp.dictionary.nt中的类
机构名识别用的词典,实际上是对两个词典的包装
OrganizationDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
 
OrganizationDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
地名词典路径
OrganizationDictionaryTrPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
地名词典转移矩阵路径
OrganizationRecognition - com.hankcs.hanlp.recognition.nt中的类
地址识别
OrganizationRecognition() - 类 的构造器com.hankcs.hanlp.recognition.nt.OrganizationRecognition
 
organizationRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
是否识别机构
outcomeNames - 类 中的变量com.hankcs.hanlp.model.maxent.MaxEntModel
事件名
outcomes - 类 中的变量com.hankcs.hanlp.model.maxent.Context
输出(标签)
output(int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
检查状态是否对应输出
overlapsWith(Interval) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
是否与另一个区间交叉(有一部分重叠)
overlapsWith(int) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
区间是否覆盖了这个点

P

Pair<T,U> - com.hankcs.hanlp.collection.dartsclone中的类
模拟C++中的pair,也兼容JavaFX中的Pair
Pair(T, U) - 类 的构造器com.hankcs.hanlp.collection.dartsclone.Pair
 
PairFrequency - com.hankcs.hanlp.corpus.occurrence中的类
一个二元的词串的频度
PairFrequency(String, Integer) - 类 的构造器com.hankcs.hanlp.corpus.occurrence.PairFrequency
 
PairFrequency(String) - 类 的构造器com.hankcs.hanlp.corpus.occurrence.PairFrequency
 
parameters - 类 中的变量com.hankcs.hanlp.model.maxent.Context
参数
parse(String) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
 
parse(List<Term>) - 类 中的方法com.hankcs.hanlp.dependency.CRFDependencyParser
 
parse(List<Term>) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
分析句子的依存句法
parse(String) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
分析句子的依存句法
parse(List<Term>) - 类 中的方法com.hankcs.hanlp.dependency.MinimumSpanningTreeParser
 
parse(List<Term>) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkDependencyParser
 
parse(List<String>, List<String>, List<Integer>, List<String>) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.parser_dll
分析句法
parse(String) - 类 中的静态方法com.hankcs.hanlp.seg.NShort.NShortSegment
一句话分词
parseDependency(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
依存文法分析
parsePath(int[]) - 类 中的方法com.hankcs.hanlp.seg.common.Graph
根据节点下标数组解释出对应的路径
parsePattern(List<NR>, List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.PersonDictionary
模式匹配
parsePattern(List<NS>, List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.dictionary.ns.PlaceDictionary
模式匹配
parsePattern(List<NT>, List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
模式匹配
Parser - com.hankcs.hanlp.dependency.nnparser中的类
 
Parser() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Parser
 
parser_dll - com.hankcs.hanlp.dependency.nnparser中的类
静态调用的伪 Windows “dll”
parser_dll() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.parser_dll
 
parser_dll(String) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.parser_dll
 
parseResult(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.common.Graph
从一个路径中转换出空格隔开的结果
parseText(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
模式匹配
parseText(String) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
匹配母文本
parseText(String, AhoCorasickDoubleArrayTrie.IHit<V>) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
处理文本
parseText(char[], AhoCorasickDoubleArrayTrie.IHit<V>) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
处理文本
parseText(char[], AhoCorasickDoubleArrayTrie.IHitFull<V>) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
处理文本
parseText(char[], AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构)
parseText(String, AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构)
PATH - 类 中的静态变量com.hankcs.hanlp.dependency.nnparser.option.ConfigOption
 
path - 类 中的静态变量com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
 
path - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary
 
path - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
 
path - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
path - 类 中的静态变量com.hankcs.hanlp.dictionary.CustomDictionary
第一个是主词典,其他是副词典
PathNode - com.hankcs.hanlp.seg.NShort.Path中的类
路径上的节点
PathNode(int, int) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.PathNode
构造一个节点
PATTERN_FLOAT_NUMBER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
浮点数正则
PersonDictionary - com.hankcs.hanlp.dictionary.nr中的类
人名识别用的词典,实际上是对两个词典的包装
PersonDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nr.PersonDictionary
 
PersonDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
人名词典路径
PersonDictionaryTrPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
人名词典转移矩阵路径
PersonRecognition - com.hankcs.hanlp.recognition.nr中的类
人名识别
PersonRecognition() - 类 的构造器com.hankcs.hanlp.recognition.nr.PersonRecognition
 
Pinyin - com.hankcs.hanlp.dictionary.py中的枚举
拼音,组成部分=声母+韵母+声调12345
PinyinDictionary - com.hankcs.hanlp.dictionary.py中的类
 
PinyinDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.py.PinyinDictionary
 
PinyinDictionary.Searcher - com.hankcs.hanlp.dictionary.py中的类
 
PinyinDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
拼音词典路径
PinyinKey - com.hankcs.hanlp.suggest.scorer.pinyin中的类
 
PinyinKey(String) - 类 的构造器com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
 
pinyins - 类 中的静态变量com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter
 
pinyins - 类 中的静态变量com.hankcs.hanlp.dictionary.py.PinyinDictionary
 
PinyinScorer - com.hankcs.hanlp.suggest.scorer.pinyin中的类
拼音打分器
PinyinScorer() - 类 的构造器com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer
 
PinyinUtil - com.hankcs.hanlp.dictionary.py中的类
 
PinyinUtil() - 类 的构造器com.hankcs.hanlp.dictionary.py.PinyinUtil
 
PlaceDictionary - com.hankcs.hanlp.dictionary.ns中的类
地名识别用的词典,实际上是对两个词典的包装
PlaceDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ns.PlaceDictionary
 
PlaceDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
地名词典路径
PlaceDictionaryTrPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
地名词典转移矩阵路径
PlaceRecognition - com.hankcs.hanlp.recognition.ns中的类
地址识别
PlaceRecognition() - 类 的构造器com.hankcs.hanlp.recognition.ns.PlaceRecognition
 
placeRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
是否识别地名
PlaceSuffixDictionary - com.hankcs.hanlp.corpus.dictionary中的类
做一个简单的封装
PlaceSuffixDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.PlaceSuffixDictionary
 
plus(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
C = A + B
plusEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
A = A + B
pop_back(List<E>) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.std
 
POSTAG - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
当前词语的词性(细粒度)
PosTagCompiler - com.hankcs.hanlp.corpus.dependency.CoNll中的类
等效词编译器
PosTagCompiler() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler
 
postags - 类 中的变量com.hankcs.hanlp.dependency.nnparser.Dependency
 
PosTagUtil - com.hankcs.hanlp.dependency.nnparser.util中的类
 
PosTagUtil() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.util.PosTagUtil
 
POSTFIX_MUTIPLE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
POSTFIX_SINGLE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
POSUtil - com.hankcs.hanlp.dependency.common中的类
词性操作工具类
POSUtil() - 类 的构造器com.hankcs.hanlp.dependency.common.POSUtil
 
Precompiler - com.hankcs.hanlp.corpus.util中的类
预编译与反编译一些词语
Precompiler() - 类 的构造器com.hankcs.hanlp.corpus.util.Precompiler
 
Predefine - com.hankcs.hanlp.utility中的类
一些预定义的静态全局变量
Predefine() - 类 的构造器com.hankcs.hanlp.utility.Predefine
 
predict(String[]) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
预测分布
predict(Collection<String>) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
预测分布
predictBest(String[]) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
预测概率最高的分类
prefixSearch(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
前缀查询
print(int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Print the matrix to stdout.
print(PrintWriter, int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Print the matrix to the output stream.
print(NumberFormat, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Print the matrix to stdout.
print(PrintWriter, NumberFormat, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Print the matrix to the output stream.
printByTo() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
 
Probability - com.hankcs.hanlp.model.trigram.frequency中的类
概率统计工具
Probability() - 类 的构造器com.hankcs.hanlp.model.trigram.frequency.Probability
 
push(int, Vertex) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
强行添加,替换已有的顶点
put(String, V) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
put(String, V) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
 
put(String, V) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
插入一个词
put(char[], V) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
put(Object, T) - 类 中的静态方法com.hankcs.hanlp.utility.GlobalObjectPool
存放全局变量
putAll(Map<? extends String, ? extends V>) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 

Q

QueueElement - com.hankcs.hanlp.seg.NShort.Path中的类
 
QueueElement(int, int, double) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.QueueElement
构造一个边节点
quickAtomSegment(char[], int, int) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
快速原子分词,希望用这个方法替换掉原来缓慢的方法

R

random(int, int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.Matrix
Generate matrix with random elements
randomSynonym(Synonym.Type, String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
随机挑一个近义词
randomSynonym() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
 
re - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
右信息熵
read(LineHandler, int) - 类 中的方法com.hankcs.hanlp.corpus.io.EasyReader
读取
read(LineHandler) - 类 中的方法com.hankcs.hanlp.corpus.io.EasyReader
读取
read(BufferedReader) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.Matrix
Read a matrix from a stream.
readBytes(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
将整个文件读取为字节数组
readBytesFromOtherInputStream(InputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
将非FileInputStream的某InputStream中的全部数据读入到字节数组中
readBytesFromOtherInputStream(InputStream, byte[]) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
从InputStream读取指定长度的字节出来
readBytesFromResource(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
将资源中的一个资源读入byte数组
readCsv(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
readExternal(ObjectInput) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
readLine(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
readLineList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
readLineListWithLessMemory(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
用省内存的方式读取大文件
readObjectFrom(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
反序列化对象
readTxt(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
一次性读入纯文本
readTxt(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
realWord - 类 中的变量com.hankcs.hanlp.corpus.synonym.Synonym
 
realWord - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
节点对应的真实词,绝对不含##
reassignOutgoingTransition(char, MDAGNode, MDAGNode) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
重新设置转移状态函数的目标 Reassigns the target node of one of this node's outgoing transitions.
Recognition(List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition
执行识别
Recognition(List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.PersonRecognition
 
Recognition(List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition
执行识别
Recognition(List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.ns.PlaceRecognition
 
Recognition(List<Vertex>, WordNet, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.nt.OrganizationRecognition
 
ReflectionHelper - com.hankcs.hanlp.corpus.util中的类
修改final static域的反射工具
ReflectionHelper() - 类 的构造器com.hankcs.hanlp.corpus.util.ReflectionHelper
 
registerSwitchClass(Class...) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CustomNatureUtility
注册switch(nature)语句类
registerSwitchClass(Class[]) - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
 
regularize(char) - 类 中的静态方法com.hankcs.hanlp.utility.CharacterHelper
进行字符规格化(全角转半角,大写转小写处理)
rel() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
 
remainLongest() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
只保留最长匹配
remainLongest - 类 中的变量com.hankcs.hanlp.algorithm.ahocorasick.trie.TrieConfig
只保留最长匹配
remove(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
remove(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
remove(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
删除一个词
remove(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
删除一个词条
remove(Map.Entry<String, V>) - 接口 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary.Filter
 
remove(SimpleDictionary.Filter) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
过滤部分词条
remove() - 类 中的方法com.hankcs.hanlp.corpus.io.IOUtil.LineIterator
 
remove(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
删除单词
动态增删不会持久化到词典文件
remove(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
从停用词词典中删除停用词
removeAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
removeAllSentences() - 接口 中的方法com.hankcs.hanlp.suggest.ISuggester
清空该推荐器中的所有句子
removeAllSentences() - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
 
removeAllSentences() - 接口 中的方法com.hankcs.hanlp.suggest.scorer.IScorer
清空该推荐器中的所有句子
removeAllSentences() - 类 中的方法com.hankcs.hanlp.suggest.Suggester
 
removeLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
删除一个标签
removeOutgoingTransition(char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
移除一个转移目标
Removes a _transition labeled with a given char.
removeOverlaps(List<Intervalable>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalTree
从区间列表中移除重叠的区间
removeOverlaps() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
 
removeString(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
Removes a String from the MDAG.
removeTone(Pinyin) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
 
reset(BufferedReader) - 类 中的方法com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper
重置分词器
reset(String) - 类 中的方法com.hankcs.hanlp.seg.Other.LongestBinSegmentToy
将分词器复原或置为准备工作的状态
ResourceIOAdapter - com.hankcs.hanlp.corpus.io中的类
从jar包资源读取文件的适配器
ResourceIOAdapter() - 类 的构造器com.hankcs.hanlp.corpus.io.ResourceIOAdapter
 
restore() - 类 中的静态方法com.hankcs.hanlp.corpus.util.CustomNatureUtility
还原对词性的全部修改
restore() - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
Undo the state right back to the beginning when the EnumBuster was created.
ResultTerm<V> - com.hankcs.hanlp.seg.common中的类
一个通用的Term
ResultTerm(String, V, int) - 类 的构造器com.hankcs.hanlp.seg.common.ResultTerm
 
retainAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
reverse() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.StringDictionary
将自己逆转过来返回
REVERSE_EXT - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
逆转后缀名
rewrite(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
 
rewrite(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
 
rewriteQuickly(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
 
rewriteQuickly(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
不分词直接转换
RIGHT - 类 中的静态变量com.hankcs.hanlp.corpus.occurrence.Occurrence
两个词的正向连接符 中国 RIGHT 人民
roleObserve(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.PersonRecognition
角色观察(从模型中加载所有词语对应的所有角色,允许进行一些规则补充)
roleTag(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
角色标注,如果子类要进行label的调整或增加新的首尾等等,可以在此进行
roleTag(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker
 
roleTag(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker
 
roleTag(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker
 
roleTag(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker
 
roleTag(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.ns.PlaceRecognition
 
roleTag(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.recognition.nt.OrganizationRecognition
 
ROOT - 类 中的静态变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
根节点
ROOT - 类 中的静态变量com.hankcs.hanlp.dependency.nnparser.option.SpecialOption
 
row(int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
取出第i行作为一个行向量
rows() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
 
run() - 类 中的方法com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread
 

S

s2hk(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
簡體到香港繁體
s2t(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
s2tw(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
簡體到臺灣正體
Sample - com.hankcs.hanlp.dependency.nnparser中的类
 
Sample() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Sample
 
Sample(List<Integer>, List<Double>) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Sample
 
samples() - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
持久化
save(ObjectOutputStream) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
持久化
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
save(OutputStream) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
Saves the trie data into a stream.
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
 
save(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
保存到二进制输出流
save(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
将base和check保存下来
save(ObjectOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
save(DataOutputStream) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
save(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.StringDictionary
保存词典
save(DataOutputStream) - 接口 中的方法com.hankcs.hanlp.corpus.io.ICacheAble
写入
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkParser
保存到磁盘
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureFunction
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
 
save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
 
saveCollectionToTxt(Collection<T>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
saveCorpus(List<Document>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
saveEntrySetToTxt(Set<Map.Entry<Object, Object>>, String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
saveKeyTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
仅仅将值保存到文件
saveMapToTxt(Map<Object, Object>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
saveMapToTxt(Map<Object, Object>, String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
saveNGramToTxt(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
保存NGram词典
saveObjectTo(Object, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
序列化对象
saveSentenceList(List<List<IWord>>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
saveTransformMatrixToTxt(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
保存转移矩阵
saveTxt(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
快速保存
saveTxt(String, StringBuilder) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
 
saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
saveTxtTo(String, DictionaryMaker.Filter) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
允许保存之前对其做一些调整
saveTxtTo(String) - 接口 中的方法com.hankcs.hanlp.corpus.dictionary.ISaveAble
将自己以文本文档的方式保存到磁盘
saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
保存NGram词典和转移矩阵
saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker
 
saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
 
saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
 
score - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
分数
Searcher(int, char[]) - 类 的构造器com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
构造一个双数组搜索工具
Searcher(char[]) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher
 
Searcher(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher
 
Searcher(char[]) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher
 
Searcher(String) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher
 
Searcher(char[], DoubleArrayTrie<Character>) - 类 的构造器com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher
 
Searcher(String, DoubleArrayTrie<Character>) - 类 的构造器com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher
 
Searcher(char[], DoubleArrayTrie<Pinyin[]>) - 类 的构造器com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher
 
Searcher(String, DoubleArrayTrie<Pinyin[]>) - 类 的构造器com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher
 
Searcher(char[], DoubleArrayTrie<String>) - 类 的构造器com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher
 
Searcher(String, DoubleArrayTrie<String>) - 类 的构造器com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher
 
second - 类 中的变量com.hankcs.hanlp.collection.dartsclone.Pair
 
second - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
 
seg(String) - 类 中的方法com.hankcs.hanlp.seg.Other.LongestBinSegmentToy
 
seg(String) - 类 中的方法com.hankcs.hanlp.seg.Segment
分词
此方法是线程安全的
seg(char[]) - 类 中的方法com.hankcs.hanlp.seg.Segment
分词
seg2sentence(String) - 类 中的方法com.hankcs.hanlp.seg.Segment
分词断句 输出句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
切分为句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
切分为句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
切分为句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
切分为句子形式
seg2sentence(String, Filter...) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
切分为句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
切分为句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
切分为句子形式
seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
切分为句子形式
segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
用最长分词算法匹配拼音
segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
 
segLongest(char[], DoubleArrayTrie<String>) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
 
segLongest(char[], AhoCorasickDoubleArrayTrie<String>) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
 
segment(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
分词
segment(String, AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
最长分词,合并未知语素
segment(char[], AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
最长分词,合并未知语素
Segment - com.hankcs.hanlp.seg中的类
分词器(分词服务)
是所有分词器的基类(Abstract)
分词器的分词方法是线程安全的,但配置方法则不保证
Segment() - 类 的构造器com.hankcs.hanlp.seg.Segment
构造一个分词器
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.BasicTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
分词
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
分词
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.IndexTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
 
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
分词
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.NLPTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
 
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
分词
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
 
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
分词
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.SpeedTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
 
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
分词
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.StandardTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
分词
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
分词
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
 
segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
分词
SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.URLTokenizer
预置分词器
segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.URLTokenizer
分词
segmentReverseOrder(String, AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
逆向最长分词,合并未知语素
segmentReverseOrder(char[], AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
逆向最长分词,合并未知语素
SegmentWrapper - com.hankcs.hanlp.seg.common.wrapper中的类
一个将BufferedReader wrap进来的类
SegmentWrapper(BufferedReader, Segment) - 类 的构造器com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.CRF.CRFSegment
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.HMM.HMMSegment
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment
 
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Segment
给一个句子分词
segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
 
Sentence - com.hankcs.hanlp.corpus.document.sentence中的类
句子,指的是以。
Sentence(List<IWord>) - 类 的构造器com.hankcs.hanlp.corpus.document.sentence.Sentence
 
sentence - 类 中的变量com.hankcs.hanlp.seg.common.WordNet
已过时。
应当使用数组,这样比较快
sentenceList - 类 中的变量com.hankcs.hanlp.corpus.document.Document
 
SentencesUtil - com.hankcs.hanlp.utility中的类
文本断句
SentencesUtil() - 类 的构造器com.hankcs.hanlp.utility.SentencesUtil
 
separator - 类 中的变量com.hankcs.hanlp.corpus.dictionary.StringDictionary
key value之间的分隔符
SEPERATOR_C_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
SEPERATOR_C_SUB_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
SEPERATOR_E_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
SEPERATOR_E_SUB_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
SEPERATOR_LINK - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
serializeTo(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
将自己序列化到
set(String, V) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
更新某个键对应的值
set(String, V) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
设置键值对,当键不存在的时候会自动插入
set(String, V) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
更新某个键对应的值
set(int, int, double) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Set a single element.
setAcceptStateStatus(boolean) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Sets this node's accept state status.
setAllowOverlaps(boolean) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.TrieConfig
设置是否允许重叠
setAttribute(String, CoreDictionary.Attribute) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
设置某个单词的属性
setAttribute(String, Nature...) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
设置某个单词的属性
setAttribute(String, String...) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
设置某个单词的属性
setAttribute(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
设置某个单词的属性
setBoost(double) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
设置权重
setCorrectionParam(double) - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
 
setDeprelTranslater(String) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
设置映射表
setDeprelTranslator(Map<String, String>) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
 
setDeprelTranslator(Map<String, String>) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
设置依存关系映射表
setFailure(State) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
设置failure状态
setFailure(State, int[]) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
设置failure状态
setIndex(int) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
 
setLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
setLabel(String) - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
 
setLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
 
setLabels(String[]) - 类 中的方法com.hankcs.hanlp.model.maxent.UniformPrior
初始化
setLast(int, String) - 类 中的方法com.hankcs.hanlp.model.crf.Table
 
setMatrix(int, int, int, int, Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Set a submatrix.
setMatrix(int[], int[], Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Set a submatrix.
setMatrix(int[], int, int, Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Set a submatrix.
setMatrix(int, int, int[], Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Set a submatrix.
setRealWord(String) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
 
setSegment(Segment) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
 
setSegment(Segment) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
设置Parser使用的分词器
setSegment(Segment) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
设置关键词提取器使用的分词器
setStaticFinalField(Field, Object) - 类 中的静态方法com.hankcs.hanlp.corpus.util.ReflectionHelper
 
setTransitionSetBeginIndex(int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
转移状态在数组中的起始下标
Records the index that this node's _transition set starts at in an array containing this node's containing MDAG data (simplified MDAG).
setTransitionSetBeginIndex(int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Records the index in this node's containing array that its _transition set begins at.
setTrie(AhoCorasickDoubleArrayTrie<CoreDictionary.Attribute>) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
 
setValue(V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie._ValueArray
 
setValue(V) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
设置节点对应的值
setValue(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
setValue(String) - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
 
setValue(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
 
setWord(String) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
 
setZero() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
 
Shengmu - com.hankcs.hanlp.dictionary.py中的枚举
声母
shouldInclude(Term) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
是否应当将这个term纳入计算
shouldInclude(Term) - 接口 中的方法com.hankcs.hanlp.dictionary.stopword.Filter
是否应当将这个term纳入计算
shouldInclude(Term) - 类 中的方法com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
 
shouldInclude(Term) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
是否应当将这个term纳入计算,词性属于名词、动词、副词、形容词
shouldRemove(Term) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
是否应当去掉这个词
ShowTermNature - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
分词结果是否展示词性
sim(List<String>, int) - 类 中的方法com.hankcs.hanlp.summary.BM25
 
simAll(List<String>) - 类 中的方法com.hankcs.hanlp.summary.BM25
 
similarity(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
计算两个单词之间的相似度,0表示不相似,1表示完全相似
similarity(CharArray) - 类 中的方法com.hankcs.hanlp.suggest.scorer.editdistance.CharArray
 
similarity(T) - 接口 中的方法com.hankcs.hanlp.suggest.scorer.ISentenceKey
 
similarity(IdVector) - 类 中的方法com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
 
similarity(PinyinKey) - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
 
simpleAtomSegment(char[], int, int) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
简易原子分词,将所有字放到一起作为一个词
SimpleDictionary<V> - com.hankcs.hanlp.corpus.dictionary中的类
可以调整大小的词典
SimpleDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
 
SimpleDictionary.Filter<V> - com.hankcs.hanlp.corpus.dictionary中的接口
 
SimpleGraph - com.hankcs.hanlp.seg.Viterbi.Path中的类
 
SimpleGraph(LinkedList<Vertex>[]) - 类 的构造器com.hankcs.hanlp.seg.Viterbi.Path.SimpleGraph
 
SimpleItem - com.hankcs.hanlp.corpus.dictionary.item中的类
 
SimpleItem() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
SimpleMDAGNode - com.hankcs.hanlp.collection.MDAG中的类
The class capable of representing a MDAG node, its _transition set, and one of its incoming transitions; objects of this class are used to represent a MDAG after its been simplified in order to save space.
SimpleMDAGNode(char, boolean, int) - 类 的构造器com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Constructs a SimpleMDAGNode.
SimpleMDAGNode() - 类 的构造器com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
 
SimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
简体=繁体词典
SimplifiedChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
 
simplifiedSourceNode - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
简化后的根节点(简化指的是用数组简化,而不是最小化,这个结构永远是最小化的)
SimplifiedToHongKongChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
简体转香港繁体繁体
SimplifiedToHongKongChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.SimplifiedToHongKongChineseDictionary
 
SimplifiedToTaiwanChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
简体转台湾繁体
SimplifiedToTaiwanChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.SimplifiedToTaiwanChineseDictionary
 
simplify() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
固化自己
Creates a space-saving version of the MDAG in the form of an array.
simplify() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
进一步降低内存,提高查询速度
副作用是下次插入速度会变慢
size() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
size() - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Intervalable
长度
size - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
base 和 check 的大小
size() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
大小,即包含多少个模式串
size() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
大小
size() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
size() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
size - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
base 和 check 的大小
size() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
树叶子节点个数
size() - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
 
size() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
 
size() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
字母表大小
size() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
词典大小
size() - 类 中的方法com.hankcs.hanlp.model.crf.Table
 
size() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
 
size() - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
拼音的个数
sort(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonDictionary
排序这个词典
sortDictionary(String) - 类 中的静态方法com.hankcs.hanlp.corpus.util.DictionaryUtil
给某个字典排序
sourceNode - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
根节点
SpecialOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
SpecialOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.SpecialOption
 
speechTagging - 类 中的变量com.hankcs.hanlp.seg.Config
词性标注
speechTagging(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
词性标注
SpeedTokenizer - com.hankcs.hanlp.tokenizer中的类
极速分词,基于Double Array Trie实现的词典分词,适用于“高吞吐量”“精度一般”的场合
SpeedTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.SpeedTokenizer
 
spilt(List<IWord>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CorpusUtil
 
SString - com.hankcs.hanlp.collection.sequence中的类
(SimpleString)字符串,为了公用内存,避免值传递,优化运行效率而设置的String的替代品
SString(char[], int, int) - 类 的构造器com.hankcs.hanlp.collection.sequence.SString
建立一个字符串
SString(String) - 类 的构造器com.hankcs.hanlp.collection.sequence.SString
 
StandardTokenizer - com.hankcs.hanlp.tokenizer中的类
标准分词器
StandardTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.StandardTokenizer
 
start_probability - 类 中的变量com.hankcs.hanlp.dictionary.TransformMatrixDictionary
初始概率
startsWith(String) - 枚举 中的方法com.hankcs.hanlp.corpus.tag.Nature
词性是否以该前缀开头
词性根据开头的几个字母可以判断大的类别
startsWith(char) - 枚举 中的方法com.hankcs.hanlp.corpus.tag.Nature
词性是否以该前缀开头
词性根据开头的几个字母可以判断大的类别
State - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
一个状态有如下几个功能

success; 成功转移到另一个状态 failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点 emits; 命中一个模式串

根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。

State() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.State
构造深度为0的节点
State(int) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.State
构造深度为depth的节点
State - com.hankcs.hanlp.collection.AhoCorasick中的类
一个状态有如下几个功能
success; 成功转移到另一个状态 failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点 emits; 命中一个模式串
根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。
State() - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.State
构造深度为0的节点
State(int) - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.State
构造深度为depth的节点
State - com.hankcs.hanlp.dependency.common中的类
 
State(float, int, Edge) - 类 的构造器com.hankcs.hanlp.dependency.common.State
 
State - com.hankcs.hanlp.dependency.nnparser中的类
 
State() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.State
 
State(Dependency) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.State
 
State - com.hankcs.hanlp.seg.Dijkstra.Path中的类
 
State(double, int) - 类 的构造器com.hankcs.hanlp.seg.Dijkstra.Path.State
 
states - 类 中的变量com.hankcs.hanlp.dictionary.TransformMatrixDictionary
隐状态
status - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
节点状态
std - com.hankcs.hanlp.dependency.nnparser.util中的类
 
std() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.util.std
 
StopWordDictionary - com.hankcs.hanlp.dictionary.stopword中的类
 
StopWordDictionary(File) - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
 
StopWordDictionary(Collection<String>) - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
 
StopWordDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
 
StopWordDictionary(String) - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
 
storage - 类 中的变量com.hankcs.hanlp.suggest.scorer.BaseScorer
储存
String2PinyinConverter - com.hankcs.hanlp.dictionary.py中的类
汉字转拼音,提供拼音字符串转拼音,支持汉英混合的杂乱文本
String2PinyinConverter() - 类 的构造器com.hankcs.hanlp.dictionary.py.String2PinyinConverter
 
StringDictionary - com.hankcs.hanlp.corpus.dictionary中的类
满足 key=value 格式的词典,其中“=”可以自定义
StringDictionary(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.StringDictionary
 
StringDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.StringDictionary
 
StringDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
方便的工厂类
StringDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
 
subSequence(int, int) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
SuffixDictionary - com.hankcs.hanlp.corpus.dictionary中的类
后缀树词典
SuffixDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
 
suggest(String, int) - 接口 中的方法com.hankcs.hanlp.suggest.ISuggester
根据一个输入的句子推荐相似的句子
suggest(String, int) - 类 中的方法com.hankcs.hanlp.suggest.Suggester
 
Suggester - com.hankcs.hanlp.suggest中的类
文本推荐器
Suggester() - 类 的构造器com.hankcs.hanlp.suggest.Suggester
 
Suggester(List<BaseScorer>) - 类 的构造器com.hankcs.hanlp.suggest.Suggester
 
Suggester(BaseScorer...) - 类 的构造器com.hankcs.hanlp.suggest.Suggester
构造一个推荐器
sWord - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.AtomNode
 
Synonym - com.hankcs.hanlp.corpus.synonym中的类
同义词
Synonym(String, String) - 类 的构造器com.hankcs.hanlp.corpus.synonym.Synonym
已过时。
Synonym(String, long) - 类 的构造器com.hankcs.hanlp.corpus.synonym.Synonym
已过时。
Synonym(String, long, Synonym.Type) - 类 的构造器com.hankcs.hanlp.corpus.synonym.Synonym
 
Synonym.Type - com.hankcs.hanlp.corpus.synonym中的枚举
 
SynonymHelper - com.hankcs.hanlp.corpus.synonym中的类
一个Util
SynonymHelper() - 类 的构造器com.hankcs.hanlp.corpus.synonym.SynonymHelper
 
SynonymItem(Synonym, List<Synonym>, Synonym.Type) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
 
SynonymItem(Synonym, List<Synonym>, char) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
 
SynonymItem(Synonym, Map<String, Synonym>) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem
 
synonymList - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
条目的value,是key的同义词列表
synonymMap - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem
条目的value,是key的同义词近义词列表
SYTDictionary - com.hankcs.hanlp.dictionary.py中的类
声母韵母音调词典
SYTDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.py.SYTDictionary
 
SYTDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
声母韵母语调词典

T

t2hk(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
繁體到香港繁體
t2s(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
t2tw(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
繁體到臺灣正體
T_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
Table - com.hankcs.hanlp.model.crf中的类
给一个实例生成一个元素表
Table() - 类 的构造器com.hankcs.hanlp.model.crf.Table
 
tag(Table) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
维特比后向算法标注
tag(Table) - 类 中的方法com.hankcs.hanlp.model.CRFSegmentModel
 
tag(char[]) - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
序列标注
TAG_BIGIN - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_BIGIN - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
句子的开始 begin
TAG_CLUSTER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_CLUSTER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
字符串 x
TAG_END - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_END - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
结束 end
TAG_GROUP - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_GROUP - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
团体名词 nt
TAG_NUMBER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_NUMBER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
数词 m
TAG_OTHER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_OTHER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
其它
TAG_PEOPLE - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_PEOPLE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
人名 nr
TAG_PLACE - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_PLACE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
地址 ns
TAG_PROPER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_PROPER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
专有名词 nx
TAG_QUANTIFIER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
数量词 mq (现在觉得应该和数词同等处理,比如一个人和一人都是合理的)
TAG_TIME - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
 
TAG_TIME - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
时间 t
TaiwanToHongKongChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
台湾繁体转香港繁体
TaiwanToHongKongChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TaiwanToHongKongChineseDictionary
 
TaiwanToSimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
台湾繁体转简体
TaiwanToSimplifiedChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TaiwanToSimplifiedChineseDictionary
 
TaiwanToTraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
台湾繁体转繁体
TaiwanToTraditionalChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TaiwanToTraditionalChineseDictionary
 
tcDictionaryRoot - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
简繁转换词典根目录
Term - com.hankcs.hanlp.seg.common中的类
一个单词,用户可以直接访问此单词的全部属性
Term(String, Nature) - 类 的构造器com.hankcs.hanlp.seg.common.Term
构造一个单词
TermFrequency - com.hankcs.hanlp.corpus.occurrence中的类
词与词频的简单封装
TermFrequency(String, Integer) - 类 的构造器com.hankcs.hanlp.corpus.occurrence.TermFrequency
 
TermFrequency(String) - 类 的构造器com.hankcs.hanlp.corpus.occurrence.TermFrequency
 
TermOccurrence - com.hankcs.hanlp.corpus.occurrence中的类
词频统计
TermOccurrence() - 类 的构造器com.hankcs.hanlp.corpus.occurrence.TermOccurrence
 
TestOption - com.hankcs.hanlp.dependency.nnparser.option中的类
 
TestOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.TestOption
 
TextRankKeyword - com.hankcs.hanlp.summary中的类
基于TextRank算法的关键字提取,适用于单文档
TextRankKeyword() - 类 的构造器com.hankcs.hanlp.summary.TextRankKeyword
 
TextRankSentence - com.hankcs.hanlp.summary中的类
TextRank 自动摘要
TextRankSentence(List<List<String>>) - 类 的构造器com.hankcs.hanlp.summary.TextRankSentence
 
TextUtility - com.hankcs.hanlp.utility中的类
文本工具类
TextUtility() - 类 的构造器com.hankcs.hanlp.utility.TextUtility
 
TFDictionary - com.hankcs.hanlp.corpus.dictionary中的类
词频词典
TFDictionary(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.TFDictionary
 
TFDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.TFDictionary
 
third - 类 中的变量com.hankcs.hanlp.corpus.occurrence.TriaFrequency
 
threadNumber - 类 中的变量com.hankcs.hanlp.seg.Config
并行分词的线程数
times(double) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Multiply a matrix by a scalar, C = s*A
times(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Linear algebraic matrix multiplication, A * B
timesEquals(double) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Multiply a matrix by a scalar in place, A = s*A
TMDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
转移矩阵词典制作工具
TMDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
 
to - 类 中的变量com.hankcs.hanlp.dependency.common.Edge
 
to863(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.PosTagUtil
转为863标注集
863词性标注集,其各个词性含义如下表: Tag Description Example Tag Description Example a adjective 美丽 ni organization name 保险公司 b other noun-modifier 大型, 西式 nl location noun 城郊 c conjunction 和, 虽然 ns geographical name 北京 d adverb 很 nt temporal noun 近日, 明代 e exclamation 哎 nz other proper noun 诺贝尔奖 g morpheme 茨, 甥 o onomatopoeia 哗啦 h prefix 阿, 伪 p preposition 在, 把 i idiom 百花齐放 q quantity 个 j abbreviation 公检法 r pronoun 我们 k suffix 界, 率 u auxiliary 的, 地 m number 一, 第一 v verb 跑, 学习 n general noun 苹果 wp punctuation ,。!
toArray() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
toArray(T[]) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
 
toCharArray() - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
toGraph() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
词网转词图
Token - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
一个片段
Token(String) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
 
tokenize(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
一个最长分词器
toList() - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
转为有序列表,自毁性操作
tone2tone5 - 类 中的静态变量com.hankcs.hanlp.dictionary.py.String2PinyinConverter
将音调统一换为轻声,下标为拼音的ordinal,值为音调5或最大值
TonePinyinString2PinyinConverter - com.hankcs.hanlp.dictionary.py中的类
将类似āiyā的词语转为拼音的转换器
TonePinyinString2PinyinConverter() - 类 的构造器com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
 
toSentenceList(String) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
将文本切割为句子
toSentenceList(char[]) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
 
toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
 
toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Emit
 
toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
 
toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
 
toString() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
 
toString() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
 
toString() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
 
toString() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
 
toString() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
 
toString() - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
 
toString() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
toString() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.Item
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.PairFrequency
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TriaFrequency
 
toString() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
 
toString() - 类 中的方法com.hankcs.hanlp.dependency.common.Node
 
toString() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
 
toString() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem
 
toString() - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
toString() - 类 中的方法com.hankcs.hanlp.dictionary.CustomDictionary
 
toString() - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
 
toString() - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
 
toString() - 类 中的方法com.hankcs.hanlp.model.crf.Table
 
toString() - 类 中的方法com.hankcs.hanlp.seg.common.EdgeFrom
 
toString() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
 
toString() - 类 中的方法com.hankcs.hanlp.seg.common.ResultTerm
 
toString() - 类 中的方法com.hankcs.hanlp.seg.common.Term
 
toString() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
 
toString() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
 
toString() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.AtomNode
 
toString() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.PathNode
 
toString() - 类 中的方法com.hankcs.hanlp.seg.Viterbi.Path.Node
 
toString() - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
 
totalFrequency - 类 中的变量com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
 
totalFrequency - 类 中的静态变量com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
 
totalFrequency - 类 中的变量com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
 
totalFrequency - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
toTermList(List<Vertex>, boolean) - 类 中的静态方法com.hankcs.hanlp.seg.CRF.CRFSegment
将一条路径转为最终结果
toWord() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
转换为一个简单词
trace() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Matrix trace.
TraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
繁简词典,提供简繁转换
TraditionalChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
 
TraditionalChineseTokenizer - com.hankcs.hanlp.tokenizer中的类
繁体中文分词器
TraditionalChineseTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
 
TraditionalToHongKongChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
繁体转香港繁体
TraditionalToHongKongChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TraditionalToHongKongChineseDictionary
 
TraditionalToTaiwanChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
繁体转台湾繁体
TraditionalToTaiwanChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TraditionalToTaiwanChineseDictionary
 
train() - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
观测结束,开始训练
transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary
 
transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
转移矩阵词典
transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.ns.PlaceDictionary
转移矩阵词典
transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
转移矩阵词典
TransformMatrixDictionary<E extends Enum<E>> - com.hankcs.hanlp.dictionary中的类
转移矩阵词典
TransformMatrixDictionary(Class<E>) - 类 的构造器com.hankcs.hanlp.dictionary.TransformMatrixDictionary
 
transition(int, char) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
转移状态
transition(char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
Follows an outgoing _transition of this node labeled with a given char.
transition(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
沿着一个路径转移
Follows a _transition path starting from this node.
transition(char[]) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
 
transition(char[], int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
 
transition(SimpleMDAGNode[], char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Follows an outgoing _transition from this node.
transition(SimpleMDAGNode[], String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Follows a _transition path starting from this node.
transition(SimpleMDAGNode[], char[]) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
 
transition(SimpleMDAGNode[], char[], int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
 
transition(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
transition(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
沿着路径转移状态
transition(char[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
沿着节点转移状态
transition(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
沿着路径转移状态
transition(char, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
转移状态
transition(int, char) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
转移状态
transitionCount - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
所有边的数量
TransitionSystem - com.hankcs.hanlp.dependency.nnparser中的类
动作转移系统
TransitionSystem() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.TransitionSystem
 
transitionWithRoot(int, char) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
c转移,如果是根节点则返回自己
transititon_probability - 类 中的变量com.hankcs.hanlp.dictionary.TransformMatrixDictionary
转移概率
translatedNameRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
是否识别音译人名
TranslatedPersonDictionary - com.hankcs.hanlp.dictionary.nr中的类
翻译人名词典,储存和识别翻译人名
TranslatedPersonDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary
 
TranslatedPersonDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
音译人名词典
TranslatedPersonRecognition - com.hankcs.hanlp.recognition.nr中的类
音译人名识别
TranslatedPersonRecognition() - 类 的构造器com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition
 
transpose() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Matrix transpose.
traverseMDAG(SimpleMDAGNode[], SimpleMDAGNode, String) - 类 中的静态方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
Follows a _transition path starting from the source node of a MDAG.
TriaFrequency - com.hankcs.hanlp.corpus.occurrence中的类
一个二元的词串的频度
Trie - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
基于 Aho-Corasick 白皮书, 贝尔实验室: ftp://163.13.200.222/assistant/bearhero/prog/%A8%E4%A5%A6/ac_bm.pdf
Trie(TrieConfig) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
构造一棵trie树
Trie() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
 
trie - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 
trie - 类 中的静态变量com.hankcs.hanlp.dictionary.CustomDictionary
用于储存用户动态插入词条的二分trie树
trie - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
AC算法用到的Trie树
trie - 类 中的静态变量com.hankcs.hanlp.dictionary.ns.PlaceDictionary
AC算法用到的Trie树
trie - 类 中的静态变量com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
AC算法用到的Trie树
trie - 类 中的静态变量com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
繁体=简体
Trie.IWalker - com.hankcs.hanlp.algorithm.ahocorasick.trie中的接口
 
TRIE_EXT - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
trie树文件后缀名
TrieConfig - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
配置
TrieConfig() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.TrieConfig
 
TrieEntry(String, V) - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry
 
TT_ENGLISH - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
TT_JAPANESE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
TT_RUSSIAN - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
tw2hk(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
臺灣正體到香港繁體
tw2s(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
臺灣正體到簡體
tw2t(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
臺灣正體到繁體
type - 类 中的变量com.hankcs.hanlp.corpus.synonym.Synonym
 
type - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
这个条目的类型,同义词或同类词或封闭词
type - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
 

U

uminus() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
Unary minus
undo() - 类 中的方法com.hankcs.hanlp.corpus.util.EnumBuster
Undo the previous operation.
UnEmptyStringSet - com.hankcs.hanlp.collection.set中的类
一个不接受空白的字符串set
UnEmptyStringSet() - 类 的构造器com.hankcs.hanlp.collection.set.UnEmptyStringSet
 
UniformPrior - com.hankcs.hanlp.model.maxent中的类
先验概率计算工具
UniformPrior() - 类 的构造器com.hankcs.hanlp.model.maxent.UniformPrior
 
UNKNOWN - 类 中的静态变量com.hankcs.hanlp.dependency.nnparser.option.SpecialOption
 
unSerialize(String) - 类 中的静态方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
unSimplify() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
解压缩
unSimplify() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
 
updateFrom(Vertex) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
 
updateFrom(Node) - 类 中的方法com.hankcs.hanlp.seg.Viterbi.Path.Node
 
updateNerConfig() - 类 中的方法com.hankcs.hanlp.seg.Config
更新命名实体识别总开关
URLTokenizer - com.hankcs.hanlp.tokenizer中的类
可以识别URL的分词器
URLTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.URLTokenizer
 
useCustomDictionary - 类 中的变量com.hankcs.hanlp.seg.Config
是否加载用户词典

V

v - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
保存value
v - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
 
v - 类 中的变量com.hankcs.hanlp.model.crf.Table
真实值,请不要直接读取
valid(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
这个拼音是否合格
valid(String[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
这些拼音是否全部合格
value - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
模式串对应的值
value - 类 中的变量com.hankcs.hanlp.collection.sequence.SString
 
value - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
节点代表的值
value - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
key对应的value
value - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
十个值
value - 类 中的变量com.hankcs.hanlp.corpus.document.sentence.word.Word
单词的真实值,比如“程序”
VALUE_EXT - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
值文件后缀名
valueOf(char) - 类 中的静态方法com.hankcs.hanlp.collection.sequence.SString
 
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym.Type
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.Nature
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NR
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NS
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NT
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.nr.NRPattern
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Head
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Pinyin
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Shengmu
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Yunmu
返回带有指定名称的该类型的枚举常量。
values() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
 
values() - 枚举 中的静态方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
按照频率从高到低排序的条目
values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym.Type
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.Nature
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NR
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NS
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NT
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.nr.NRPattern
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Head
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Pinyin
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Shengmu
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Yunmu
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。
VectorDistance - com.hankcs.hanlp.algorithm中的类
词向量距离计算
VectorDistance() - 类 的构造器com.hankcs.hanlp.algorithm.VectorDistance
 
Vertex - com.hankcs.hanlp.seg.common中的类
顶点
Vertex(String, String, CoreDictionary.Attribute) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
最复杂的构造函数
Vertex(String, String, CoreDictionary.Attribute, int) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
 
Vertex(String, CoreDictionary.Attribute) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
真实词与编译词相同时候的构造函数
Vertex(String, CoreDictionary.Attribute, int) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
 
Vertex(Map.Entry<String, CoreDictionary.Attribute>) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
通过一个键值对方便地构造节点
Vertex(String) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
自动构造一个合理的顶点
Vertex(char, CoreDictionary.Attribute) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
 
vertex - 类 中的变量com.hankcs.hanlp.seg.Dijkstra.Path.State
当前位置
vertexes - 类 中的变量com.hankcs.hanlp.seg.common.Graph
顶点
Viterbi - com.hankcs.hanlp.algorithm中的类
维特比算法
Viterbi() - 类 的构造器com.hankcs.hanlp.algorithm.Viterbi
 
viterbi() - 类 中的方法com.hankcs.hanlp.seg.Viterbi.Path.Graph
 
viterbi() - 类 中的方法com.hankcs.hanlp.seg.Viterbi.Path.SimpleGraph
 
viterbiCompute(List<EnumItem<NR>>) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.PersonRecognition
维特比算法求解最优标签
viterbiComputeSimply(List<EnumItem<NR>>) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.PersonRecognition
简化的"维特比算法"求解最优标签
viterbiExCompute(List<EnumItem<NS>>) - 类 中的静态方法com.hankcs.hanlp.recognition.ns.PlaceRecognition
维特比算法求解最优标签
viterbiExCompute(List<EnumItem<NT>>) - 类 中的静态方法com.hankcs.hanlp.recognition.nt.OrganizationRecognition
维特比算法求解最优标签
ViterbiSegment - com.hankcs.hanlp.seg.Viterbi中的类
Viterbi分词器
也是最短路分词,最短路求解采用Viterbi算法
ViterbiSegment() - 类 的构造器com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
 

W

walk(StringBuilder, Set<Map.Entry<String, V>>) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
walk(String, CorpusLoader.Handler) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
walk(String, CorpusLoader.HandlerThread[]) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
 
walkToLoad(ByteArray, _ValueArray<V>) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
walkToLoad(ObjectInput) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
walkToSave(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
walkToSave(ObjectOutput) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
 
weight - 类 中的变量com.hankcs.hanlp.seg.common.Edge
花费
weight - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
最短路径对应的权重
weight - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.QueueElement
权重
word - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
有许多行,每行是一个单词
Word - com.hankcs.hanlp.corpus.document.sentence.word中的类
一个单词
Word(String, String) - 类 的构造器com.hankcs.hanlp.corpus.document.sentence.word.Word
 
word - 类 中的变量com.hankcs.hanlp.dependency.common.Node
 
word - 类 中的变量com.hankcs.hanlp.seg.common.ResultTerm
 
word - 类 中的变量com.hankcs.hanlp.seg.common.Term
词语
word - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
节点对应的词或等效词(如未##数)
WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.NRConstant
本词典专注的词的ID
WORD_MAXLENGTH - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
WORD_SEGMENTER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
WordBasedGenerativeModelSegment - com.hankcs.hanlp.seg中的类
基于词语NGram模型的分词器基类
WordBasedGenerativeModelSegment() - 类 的构造器com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment
 
WordFactory - com.hankcs.hanlp.corpus.document.sentence.word中的类
一个很方便的工厂类,能够自动生成不同类型的词语
WordFactory() - 类 的构造器com.hankcs.hanlp.corpus.document.sentence.word.WordFactory
 
wordID - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
等效词ID,也是Attribute的下标
wordList - 类 中的变量com.hankcs.hanlp.corpus.document.sentence.Sentence
 
WordNatureDependencyModel - com.hankcs.hanlp.model.bigram中的类
词、词性相互构成依存关系的统计句法分析模型
WordNatureDependencyModel(String) - 类 的构造器com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
 
WordNatureDependencyParser - com.hankcs.hanlp.dependency中的类
一个简单的句法分析器
WordNatureDependencyParser(WordNatureDependencyModel) - 类 的构造器com.hankcs.hanlp.dependency.WordNatureDependencyParser
 
WordNatureDependencyParser(String) - 类 的构造器com.hankcs.hanlp.dependency.WordNatureDependencyParser
 
WordNatureDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.WordNatureDependencyParser
 
WordNatureModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
词-词性-依存关系模型
WordNatureWeightModelMaker - com.hankcs.hanlp.corpus.dependency.model中的类
生成模型打分器模型构建工具
WordNatureWeightModelMaker() - 类 的构造器com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker
 
WordNatureWeightScorer - com.hankcs.hanlp.corpus.dependency.model中的类
生成模型打分器,衡量一个边的权值,仅仅利用〈词,词〉,数据稀疏则回退为〈词,词性〉、〈词性,词〉、〈词性,词性〉
WordNatureWeightScorer() - 类 的构造器com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightScorer
 
WordNet - com.hankcs.hanlp.seg.common中的类
 
WordNet(String) - 类 的构造器com.hankcs.hanlp.seg.common.WordNet
为一个句子生成空白词网
WordNet(char[]) - 类 的构造器com.hankcs.hanlp.seg.common.WordNet
 
WordNet(char[], List<Vertex>) - 类 的构造器com.hankcs.hanlp.seg.common.WordNet
 
wrapTag(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker
用尖括号将标签包起来
writeCustomNature(DataOutputStream, LinkedHashSet<Nature>) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
 
writeExternal(ObjectOutput) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
 
writeLine(BufferedWriter, String...) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
写数组,用制表符分割
writeString(String, DataOutputStream) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
简单好用的写String方式
writeUnsignedInt(DataOutputStream, int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
无符号整型输出
WT_CHINESE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
WT_DELIMITER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 
WT_OTHER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
 

X

X - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
X_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
 

Y

Yunmu - com.hankcs.hanlp.dictionary.py中的枚举
 

Z

zero(int, int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.Matrix
 

_

_EmptyValueArray<V> - com.hankcs.hanlp.collection.trie.bintrie中的类
 
_EmptyValueArray() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie._EmptyValueArray
 
_findSpecialString() - 类 中的静态方法com.hankcs.hanlp.dictionary.BiGramDictionary
已过时。
没事就不要用了
_getEquivalenceClassMDAGNodeHashMap() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
调试用
_ValueArray<V> - com.hankcs.hanlp.collection.trie.bintrie中的类
对值数组的包装,可以方便地取下一个
_ValueArray(V[]) - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie._ValueArray
 
_ValueArray() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie._ValueArray
仅仅给子类用,不要用
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z _ 
跳过导航链接

Copyright © 2014–2017 码农场. All rights reserved.