@swner_admin
闫广庆 暂无简介
一、项目背景 随着数字化办公的普及,PDF文档已成为日常工作、学习和生活中常见的文件格式。然而,在处理PDF文档时,我们常常需要对文档中的内容进行拆分、整理和提取。针对这一需求,本项目旨在开发一款基于大纲的PDF文本拆分工具,帮助用户高效地处理PDF文档。 二、项目目标 实现PDF文档的快速加载与解析; 根据PDF文档的大纲结构,自动拆分文本内容;
基于事件因果关系抽取数据集构建企业发展事件因果关系抽取可视化图谱能力
探索企业、企业董监高、事件抽取体系。
利用kashgari框架实现在医学场景中的命名实体识别,基于kashgari 1.0版本。
金融领域法律相关文本信息命名实体识别工作。
在FlyAI环境中训练基于p-tuning数据处理方案医学导诊分类
match for 智能医疗决策,病理“金数据”赋能医学诊断
一个面向政策和企业工商信息场景的自然语言处理技术探索结合工作。
在医学场景中利用GPT2模型进行生成魔改。参数是小于GPT2开源版本的。源代码来源于刘聪的。改动主要是模型输入由地址转换为集合。
中文姓名命名实体识别
面向于公开数据的企业知识图谱