1 Star 0 Fork 0

伊拉克肥灵/NewN

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
3.1.5.py 943 Bytes
一键复制 编辑 原始数据 按行查看 历史
伊拉克肥灵 提交于 2020-07-06 20:26 . 2.5
import spacy
from spacy import displacy
nlp=spacy.load('en_core_web_sm')
def helper(s,p):
s_split=s.split()
p_split=p.split()
ans=[]
i=0
while i<len(s_split):
tmp_i=i
j=0
while tmp_i < len(s_split) and j <len(p_split) and s_split[tmp_i]==p_split[j]:
tmp_i+=1
j+=1
if j==len(p_split):
for p in p_split:
ans.append(p+"/B")
i=tmp_i
else:
ans.append(s_split[i]+"/I")
i+=1
return ans
doc=nlp('good my night my son son. i love you my son son really. it is ture really. my favourit apple is big apple son.')
list=[]
list2=[]
aa='my son'
for token in doc.sents:
if aa in str(token):
list2.extend(helper(str(token),aa))
list.extend(list2+["./O"] )
list2.clear()
else:
for res in token:
list.append(res.text+"/O")
print(doc)
print(" ".join(list))
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/estaryjl/NewN.git
git@gitee.com:estaryjl/NewN.git
estaryjl
NewN
NewN
master

搜索帮助

0d507c66 1850385 C8b1a773 1850385