读写将字符串或文本文件中的数据
用python和numpy处理数据次数比较多,写了几个小函数,可以方便地读写数据:
[python]
# -*- coding: utf-8 -*-
#----------------------------------------------------------------------
# FileName:gettxtdata.py
#功能:读取字符串和文件中的数值数据(浮点数)
#主要提供类似matlab中的dlmread和dlmwrite函数
#同时提供loadtxtdata和savetxtdata函数
#Data: 2013-1-10
#Author:吴徐平
#----------------------------------------------------------------------
import numpy
#----------------------------------------------------------------------
def StringToDoubleArray(String):
"""
#将字符串中的所有非Double类型的字符全部替换成空格
#以'#'开头注释直至行尾,都被清空
#返回一维numpy.array数组
"""
from StringIO import StringIO
import re
DataArray=numpy.empty([0],numpy.float64)
if len(String.strip())>0:
#清空注释行,都是以'#'开头子字符
doublestring=re.sub('#.*$', " ", String, count=0, flags=re.IGNORECASE)
#删除非数字字符
doublestring=re.sub('[^0-9.e+-]', " ", doublestring, count=0, flags=re.IGNORECASE)
#去掉不正确的数字格式(代码重复是有必要的)
doublestring=re.sub('[.e+-](?=\s)', " ", doublestring, count=0, flags=re.IGNORECASE)
doublestring=re.sub('[.e+-](?=\s)', " ", doublestring, count=0, flags=re.IGNORECASE)
doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
#去掉首尾空格
doublestring=doublestring.strip()
if len(doublestring)>0:
StrIOds=StringIO(doublestring)
DataArray= numpy.genfromtxt(StrIOds)
return DataArray
#----------------------------------------------------------------------
def GetDoubleListFromString(String):
"""
#使用换行符分割字符串
#将字符串中的所有非Double类型的字符全部替换成空格
#以'#'开头注释直至行尾,都被清空
#将每一行转换成numpy.array数组
#返回numpy.array数组的列表
"""
from StringIO import StringIO
import re
DoubleList=[]
StringList=String.split('\n')#使用换行符分割字符串
for Line in StringList:
if len(Line.strip())>0:
#清空注释行,都是以'#'开头子字符
doublestring=re.sub('#.*$', " ", Line, count=0, flags=re.IGNORECASE)
#删除非数字字符
doublestring=re.sub('[^0-9.e+-]', " ", doublestring, count=0, flags=re.IGNORECASE)
#去掉不正确的数字格式(代码重复是有必要的)
doublestring=re.sub('[.e+-](?=\s)', " ", doublestring, count=0, flags=re.IGNORECASE)
doublestring=re.sub('[.e+-](?=\s)', " ", doublestring, count=0, flags=re.IGNORECASE)
doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
doublestring=re.sub('[e+-]$', " ", doublestring, count=0, flags=re.IGNORECASE)
#去掉首尾空格
doublestring=doublestring.strip()
if len(doublestring)>0:
StrIOds=StringIO(doublestring)
DoubleList.append(numpy.genfromtxt(StrIOds))
return DoubleList
#----------------------------------------------------------------------
def GetDoubleListFromFile(FileName):
"""
#将文本文件中的所有Double类型的字符全部替换成numpy.array数组
#每一行都是numpy.array数组
##返回numpy.array数组的列表
#注意:返回列表的每个元素又都是一个numpy.array数组
#注意:返回列表的每个元素(或文件每行)可以包含不同多个数的数字
"""
file=open(FileName, 'r')
read_file = file.read()
file.close()
DoubleList=GetDoubleListFromString(read_file)
return DoubleList
def dlmread(FileName,dtype=numpy.float64):
"""
#Load Data From Txt-File.
#分隔符默认是:";",",",空格类 (包括\t)等等
#以#开头的被认为是注释,不会被读取
#Return Value:二维数值数组(numpy.ndarray)
#对文本中数据的排列格式要求最低,且容许出现注释字符,智能化程度最高,但速度较慢
"""
DoubleList=GetDoubleListFromFile(FileName)
dlsize=[]#每一行数组的大小
for dL in DoubleList:
dlsize.append(dL.size)
MinColumnSize=min(dlsize)#数组的最大列数
MaxColumnSize=max(dlsize)#数组的最小列数
#数组创建和赋值