877
一个基于 Java 的 LLM 应用开发及编排框架。
Java
1天前
13128775 iflytekopensource 1706589882
595
讯飞星火开源-13B(iFlytekSpark-13B)拥有130亿参数,新一代认知大模型,一经发布,众多科研院所和高校便期待科大讯飞能够开源。 为了让大家使用的更加方便,科大讯飞增加了更多的数据,并针对工具链进行了优化。此次正式开源拥有130亿参数的iFlytekSpark-13B模型(讯飞星火开源-13B),也是首个基于全国产化算力平台“飞星一号”的大模型,正式开源!
Python
9个月前
8375569 charent 1703476813
179
中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。
Python
8个月前
5704348 sulv0302 1719467039
131
基于java实现的onnx模型推理识别可视化窗口
Java
2个月前
87
本项目是一个开源的 AI 智能助手,专为软件开发的全生命周期而设计,涵盖设计、编码、测试、部署和运维等阶段。
7个月前
73
Bisheng (毕昇大模型平台) 是一款领先的开源大模型应用开发平台,赋能和加速大模型应用开发落地,帮助用户以最佳体验进入下一代应用开发模式。
5个月前
14233130 aixcoder model 1712808031
72
aiXcoder 7B 代码大型语言模型的官方仓库
8个月前
1350936 grt1228 1676872126
57
讯飞星火大模型Java SDK 易开发,更灵活. Xun fei SparkDesk Java SDK. SparkDesk. xfyun SDK. xinghuo.星火.
Java
1年多前
56
CodeFuse-MFTCoder: Multitask Fine-Tuned Code LLMs
7个月前
45
简单、高效且低成本的预训练、微调与服务,惠及大众
13683957 jiutian ai 1719886881
42
九天-139MoE-Chat是中国移动自主研发的语言大模型,实现数据构建、预训练、微调、部署全链路核心技术自主创新;行业定向增强,数据上融合通信、能源等8大行业专业知识,提供定制化行业大模型;安全可靠,建立数据质量评估体系,加强数据处理和清洗,优化DPO算法,加强人类价值观对齐,实现指令安全响应。该模型在主流公开测试集测评结果上,已达GPT-4的90%水平,适配国产算力生态,助力企业实现智能化产业
4个月前
12 mirrors 1578989292
32
ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型
Python
1年前
9090342 chairc 1646386758
29
IDDM(工业,景观,动画…),diffusion model,支持DDPM, DDIM, PLMS, web和多gpu分布式训练。Pytorch实现、生成模型、扩散模型、分布式训练
Python
5天前
5635863 ascend 1586517030
28
此仓库已转移,新仓见:https://gitee.com/ascend/mindxdl.git
10597042 deep spark 1664386531
24
本仓库为天数智芯Iluvatar Corex IxRT高性能推理引擎的开源代码部分,提供IxRT相关插件、部署工具和演示IxRT平台用法和能力的应用示例。
3个月前

搜索帮助