Java版按键精灵
SnowNLP 只处理的unicode编码,所以使用时请自行decode成unicode。来源:https://github.com/isnowfy/snownlp 以下功能都是笔者比较感兴趣的: 情感分析(现在训练数据主要是买卖东西时的评价,所以对其他的一些可能效果不是很好,待解决) 文本分类(Naive Bayes) 转换成拼音(Trie树实现的最大匹配) 繁体转简体(Trie树实现的最大匹配) 提取文本关键词(TextRank算法) 提取文本摘要(TextRank算法) Tokenization(分割成句子) 文本相似(BM25)
清华大学THULAC:目前已经有Java、Python和C++版本,并且代码开源。 清华大学THULAC https://github.com/thunlp/THULAC
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。