1 Star 0 Fork 0

codesman/discuss

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
data_access.py 985 Bytes
一键复制 编辑 原始数据 按行查看 历史
zzz 提交于 2020-06-02 12:27 . add sleep logic
# encoding: utf-8
# Datetime  : 2020/5/29 6:10 PM
# User      : zzz
# File      : data_access.py.py
import os
import pandas as pd
# machine number
total_machine = 2
def get_url_list():
# get path of current directory
curr_path = os.path.dirname(os.path.abspath(__file__))
fname = os.path.join(curr_path, 'source/data.xlsx')
df = pd.read_excel(fname, sheet_name='Sheet2', usecols='A')
pd.set_option('max_colwidth', 200)
return df.values.tolist()
def get_range_url(page=1):
url_list = get_url_list()
total = len(url_list)
page_size = total // total_machine
remainder = total % total_machine
from_idx = (page - 1) * page_size
end_idx = from_idx + remainder + page_size if page == total_machine else from_idx + page_size
print(f"url size: {end_idx - from_idx}")
return url_list[from_idx:end_idx]
if __name__ == '__main__':
# list = get_url_list()
# for url in list:
# print(url)
get_range_url(6)
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/zzserver/discuss.git
git@gitee.com:zzserver/discuss.git
zzserver
discuss
discuss
master

搜索帮助

0d507c66 1850385 C8b1a773 1850385