534 zhzhenqin 1652695725
55
Paoding分词器基于Lucene4.x
Java
接近11年前
59466 lizhengxian 1578915844
48
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
372841 lishilei0523 1599393053
41
盘古分词组件,Forked from Eaglet
C#
1年多前
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
Java
5年前
12 mirrors 1578989292
35
pkuseg-python:一个高准确度的中文分词工具包 pkuseg-python 简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率
16979 ijz 1578915129
27
梁博在线分词pullword的perl客户端,支持直接结果以及返回一个分词词频的hash。
Perl
6年多前
12 mirrors 1578989292
27
中文词法分析(LAC) 中文分词(Word Segmentation)是将连续的自然语言文本,切分出具有语义合理性和完整性的词汇序列的过程
C++
4年前
27
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
1020595 jianggujin 1731898115
23
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
5年前
No enterprise avatar
21
仿照Sphinx for Chinese,基于sphinx 2.2.9版本,结合cppJieba分词系统,让sphinx支持中文
C++
5年多前
18
elasticsearch的ik分词器动态扩展词库
Java
10年多前
143034 yanyiwu 1578919348
17
"结巴"中文分词的C++版本
C++
暂未更新
16
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java
8年多前
438805 eavnfor 1578923885
16
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java
接近5年前
1646371 tyoui 1578956781
13
拆分词语
Python
接近6年前

搜索帮助