今天又帮女朋友处理了一下,她的实验数据,因为python是一年前经常用,最近找工作,用的是c,c++,python的有些东西忘记了,然后就一直催我,说我弄的慢,弄的慢,你自己弄啊,烦不烦啊,逼逼叨叨的,最后还不是我给弄好的?呵呵

好的,数据是这样的,我截个图

我用红括号括起来的,就是我所要提取的数据


其中lossstotal.txt是我要提取的原始数据,考虑两种方法去提取,前期以为所要提取行的数据是有一定规律的,后来发现,并不是,所以,我考虑用正则来提取,经过思考以后,完成了数据的提取,如下午所示,数据变的非常好看


代码如下:
#coding:utf-8 #__author__ ='dell' import re f1=file('losstotal.txt','r')
data1=f1.readlines()# print data1 f1.close() results = [] f2 = open('loss2.txt',
'w') # # 按照特定行提取,发现后面的行并无规律 # i = 0 # for line in data1: # i+=1 # # print line
# if((i-1)%3==0): # f2.write(line) # print line # 利用正则表达式 for line in data1:
data2=line.split() # print data2 for i in data2: n = re.findall(r"Iteration", i)
# m=re.findall(r"loss", i) if n: # print line f2.writelines(line) f2.close() f3=
file('loss2.txt','r') data3=f3.readlines() # print data1 f3.close() f4 = open(
'loss3.txt', 'w') for line in data3: data4=line.split() # print data2 for i in
data4: n = re.findall(r"loss", i) # m=re.findall(r"loss", i) if n: print line
f4.writelines(line) f4.close() # 去掉逗号 f5=open('loss3.txt','r') data5=f5.read()
f5=data5.replace(',',' ') f6=file('lossfinal.txt','w') f6.write(f5) f6.close()
# # 去掉等号= f7=open('lossfinal.txt','r') data7=f7.read() f7=data7.replace('=',' '
) f8=file('lossfinal.txt','w') f8.write(f7) f8.close() # data3=lin.split() #
for j in data3: # m=re.findall(r"loss",i) # if m: # print lin # #
m=re.findall(r"sgd_solver.cpp",i) # n=re.findall(r"Iteration",i)
我在同样的目录下,还建立了

这几个txt文件,要不然,代码跑不通的哟。

解释:我连续用了两个正则,各自把含有特定字符串的行进行提取,两个写一起,发现还是不太会,所以分开写了,但是结果还是完成的不错