代码拉取完成,页面将自动刷新
import pathlib
import numpy as np
import pickle as pkl
original = pathlib.Path("/srv/local1/estengel/gr_data")
out_dir = pathlib.Path("/srv/local1/estengel/gr_subsets")
for perc in [10, 20, 30, 40, 50, 60, 70, 80, 90]:
for pkl_name in original.glob("*/*.pkl"):
with open(pkl_name, 'rb') as f1:
data = pkl.load(f1)
data_len = len(data)
perc_float = perc/100
subset_n = int(data_len * perc_float)
subset_idxs = np.random.choice(data_len, size = subset_n, replace=False)
subset_data = [data[idx] for idx in subset_idxs]
out_name = out_dir.joinpath(f"{perc}")
parent_name = pkl_name.parent.name
out_name = out_name.joinpath(parent_name).joinpath("with_actions.pkl")
out_name.parent.mkdir(parents=True)
with open(out_name, "wb") as f1:
pkl.dump(subset_data, f1)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。