代码拉取完成,页面将自动刷新
同步操作将从 东方佑/chinese_chatbot_corpus 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
import os
class Config(object):
encoding = "utf-8"
clean_chat_corpus_root = "clean_chat_corpus"
raw_chat_corpus_root = "raw_chat_corpus"
raw_chatterbot_corpus_root = os.path.join(raw_chat_corpus_root, "chatterbot-1k", "chinese")
raw_douban_corpus_root = os.path.join(raw_chat_corpus_root, "douban-multiturn-100w")
raw_ptt_corpus_path = os.path.join(raw_chat_corpus_root, "ptt-42w", "Gossiping-QA-Dataset.txt")
raw_qingyun_corpus_path = os.path.join(raw_chat_corpus_root, "qingyun-11w", "12万对话语料青云库.csv")
raw_subtitle_corpus_path = os.path.join(raw_chat_corpus_root, "subtitle-useless", "dgk_shooter_min.conv")
raw_tieba_corpus_path = os.path.join(raw_chat_corpus_root, "tieba-305w", "tieba.dialogues")
raw_weibo_post_corpus_path = os.path.join(raw_chat_corpus_root, "weibo-400w", "stc_weibo_train_post")
raw_weibo_response_corpus_path = os.path.join(raw_chat_corpus_root, "weibo-400w", "stc_weibo_train_response")
raw_xiaohuangji_corpus_path = os.path.join(raw_chat_corpus_root, "xiaohuangji-40w", "xiaohuangji50w_nofenci.conv")
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。