csv文件可以删除吗其实就是逗号分隔的文本文件最简单的方法就是当成文本解析就行了。
站长用Python写了一个可以提取csv任一列嘚代码欢迎使用。
csv是Comma-Separated Values的缩写是用文本文件形式储存的表格数据,比如如下的表格:
就可以存储为csv文件可以删除吗文件内容是:
第二種方法是使用DictReader,和reader函数类似接收一个可迭代的对象,能返回一个生成器但是返回的每一个单元格都放在一个字典的值内,而这个字典嘚键则是这个单元格的标题(即列头)用下面的代码可以看到DictReader的结构:
,即逗号分隔值(也称字符分隔值因为分隔符可以不是逗号),是一种常用的文本
格式用以存储表格数据,包括数字或者字符很多程序在处理数据时都会碰到csv这种格式的文件,它的使用是比
较广泛的(Kaggle上一些题目提供的数据就是csv格式)csv虽然使用广泛,但却没有通用的标准所以在处理csv
格式时常常会碰到麻烦,幸好内置了csv模块丅面简单介绍csv模块中最常用的一些函数。
csvfile必须是支持迭代(Iterator)的对象,可以是文件(file)对象或者列表(list)对象如果是文件对
象,打開时需要加"b"标志参数
dialect,编码风格默认为excel的风格,也就是用逗号(,)分隔dialect方式也支持自定义,通过调用register_dialect方法来注册下文会提到。fmtparam格式化参数,用来覆盖之前dialect对象指定的编码风格
'test.csv'是文件名,‘rb’中的r表示“读”模式因为是文件对象,所以加‘b’open()返回了一个文件對象
myFile,reader(myFile)只传入了第一个参数另外两个参数采用缺省值,即以excel风格读入reader()返回一个
文件中的文本按行打印,每一行的元素都是以逗号分隔苻','分隔得来
在我的test.csv文件可以删除吗中,存储的数据如图:
参数的意义同上这里不赘述,直接上例程:
首先open()函数打开当前路径下的名字為't.csv'的文件如果不存在这个文件,则创建它返回myFile文件对象。
writerow()方法是一行一行写入writerows方法是一次写入多行。
注意:如果文件't.csv'事先存在调鼡writer函数会先清空原文件中的文本,再执行writerow/writerows方法
这个函数是用来自定义dialect的。
上面一行程序自定义了一个命名为mydialect的dialect参数只设置了delimiter和quoting这两个,其他的仍然采用
默认值其中以'|'为分隔符。接下来我们就可以像使用'excel'一样来使用'mydialect'了我们来看看效果:
在我test.csv中存储如下数据:
可以看到,现在是以'|'为分隔符1和2合成了一个字符串(因为1和2之间的分隔符是逗号,而mydialect风格的分隔
符是'|')3单独一个字符串。
对于writer()函数同样可以傳入mydialect作为参数,这里不赘述
这个函数用于注销自定义的dialect
简单,可以自己试试比如list_dialects()函数会列出当前csv模块里所有的dialect:
只不过它以tab为分隔符。
先写到这其他的以后用到再更新。