5187 lionsoul 1578914315
2.2K
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
1年前
5187 lionsoul 1578914315
371
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C
1年前
5460443 baidu 1578992824
240
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
436788 rockyzheng 1578923827
240
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
Python
接近5年前
8919053 indexea 1673024392
206
基于 NLP 技术 ( HanLP ) 实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java
3个月前
127
Go 语言高效分词, 支持英文、中文、日文等
Go
3年前
59466 lizhengxian 1578915844
48
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
12 mirrors 1578989292
27
中文词法分析(LAC) 中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程
C++
4年前
27
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1020595 jianggujin 1731898115
23
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
5年前
18
elasticsearch的ik分词器动态扩展词库
Java
10年多前
7122 ysc 1578914462
13
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java
7年多前
971 zacker330 1578913918
9
Chinese analysis plugin which using IK analysis for Elasticsearch
Java
暂未更新
12 mirrors 1578989292
8
首先感谢jieba分词原作者fxsjy,没有他的无私贡献,我们也不会结识到结巴 分词,更不会有现在的java版本
Java
4年前
812591 tenlee 1578933525
7
可能是东半球hao用的elasticsearch(es)中文分词器插件
Java
1年多前

搜索帮助