之江天枢人工智能开源平台是由之江实验室牵头,联合国内顶尖科研力量共同打造的国产化自主可控的人工智能开源平台。平台面向人工智能研究中的数据处理、算法开发、模型训练、算力管理和推理应用等各个流程的技术难点,研发了包括一站式算法开发平台、高性能分布式深度学习框架、先进算法模型库、视觉模型炼知平台、数据可视化分析平台等一系列平台及工具,在模型高效分布式训练、数据处理和可视分析、模型炼知和轻量化等技术上形成
上个时代的小模型训练练习 seq2seq用的GRU门控神经网络,刚学完这个,就过时了,之后是AGI通用大模型的时代了... 大致流程 1. Embedding。把文字转为向量 2. DataSet。按批次加载数据 3. yourModel。encoder,decoder,再合为总模型seq2seq 4. Train。 加载数据,计算损失,更新参数,保存模型/参数 4. eval。使用测试集测试模型