发布网友 发布时间:2022-05-05 01:18
共3个回答
懂视网 时间:2022-05-10 11:10
这次给大家带来python怎么批量读取txt文件为DataFrame格式,python批量读取txt文件为DataFrame格式的注意事项有哪些,下面就是实战案例,一起来看一下。我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作。比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢?
首先我们要用到glob模块,这个python内置的模块可以说是非常的好用。
glob.glob('*.txt')
得到如下结果:
all.txt是我最后得到的结果文件。可以见返回的是一个包含txt文件名称的列表,当然如果你的文件夹下面只有txt文件,那么你用os.listdir()可以得到一个一样的列表
然后读取的时候只要注意txt文件的编码格式(可以用notepad++打开记事本查看)和间隔符的形式就好了,完整的代码如下:
import os import pandas import codecs import glob import pandas as pd os.getcwd() os.chdir('D:AAAASXQpython studydata preprocessing') def txtcombine(): files = glob.glob('*.txt') all = codecs.open('all.txt','a') for filename in flist: print(filename) fopen=codecs.open(filename,'r',encoding='utf-8') lines=[] lines=fopen.readlines() fopen.close() i=0 for line in lines: for x in line: all.write(x) #读取为DataFrame格式 all1 = pd.read_csv('all.txt',sep=' ',encoding='GB2312') #保存为csv格式 all1.to_csv('all.csv',encoding='GB2312') if name == 'main': txtcombine()
相信看了本文案例你已经掌握了方法,更多精彩请关注Gxl网其它相关文章!
推荐阅读:
python字符串如何转为二维数组
JS的EventEmitter使用步奏详解
热心网友 时间:2022-05-10 08:18
import glob
files = glob.glob("dir/*.txt") #dir表示文件所在的目录,代码意思为获取该目录下所有以txt作为后缀的文件
newFile = open("newFile.txt",'w') #新建文件,默认在你运行的目录下生成
for file in files:
with open(file,'r') as FA:
for line in FA:
line = line.strip().split("\t") #默认你文件里的分割符为\t,其他的话可以替换。
newFile.write(line[2]+'\t'+ file +'\n') #填写文件的第三列信息,和文件名称
newFile.close()
有问题可以联系我。
热心网友 时间:2022-05-10 09:36
这只是业务逻辑,最好按逻辑写一下代码,遇到问题给你说怎么解决