1 Star 0 Fork 0

Joyamon/datacheck

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
read_table.py 1.54 KB
一键复制 编辑 原始数据 按行查看 历史
zhouyanming 提交于 2024-10-23 11:00 . 优化:读取对比文件
# -*- coding: utf-8 -*-
# @Time : 2024/08/13
# @Author : 半只程序员
# @Email : 18152007693@163.com
# @File : read_table.py
# @Software: PyCharm
from typing import Any
import pandas as pd
from pandas import DataFrame
def get_data_from_file(file: Any, encoding='utf-8', errors='replace', header=None) -> DataFrame:
"""
get datas from file(excel or csv)
:param header:
:param errors:
:param encoding: file‘s encoding
:param file: Excel objects
:return: Excel datas
"""
if file is None:
raise ValueError("文件名不能为空")
if file.split('.')[-1] in ['xlsx', 'xls']:
data = pd.read_excel(file, header=header)
data[data.columns] = data[data.columns].str.strip()
if '\t' in data.columns:
data[data.columns] = data[data.columns].str.strip('\t')
data.dropna()
return data
elif file.split('.')[-1] == 'csv':
if encoding == 'utf-16':
data = pd.read_csv(file, sep='\t', index_col=False, encoding=encoding, low_memory=False)
data.dropna()
if '\t' in data.columns:
data[data.columns] = data[data.columns].str.strip('\t') # 去掉结算ID尾部的tab键
else:
return data
else:
data = pd.read_csv(file, index_col=False, encoding=encoding, low_memory=False)
data.dropna()
if '\t' in data.columns:
data[data.columns] = data[data.columns].str.strip('\t') # 去掉结算ID尾部的tab键
return data
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/joyamon/datacheck.git
git@gitee.com:joyamon/datacheck.git
joyamon
datacheck
datacheck
master

搜索帮助