重返回一个适应新索引的新对象将缺失值填充为fill_value 返回适应新索引的新对象,填充方式为method |
应用元素级函数 |
根据索引返回已排序的新对象 |
根据值返回已排序的对象NaN值在末尾 |
为各组分配一个平均排名 |
返回含有最大值的索引位置 返回含有最小值的索引位置 |
Series是一种类似于一维数组的对潒由下面两个部分组成:
(1)由列表或numpy数组创建
? 默认索引为0到N-1的整数型索引
# name属性比较类似于表名
#series用于创建一维数据
# 字典的方式在实际的应用中比较适合series
使用index中的元素作为索引值
#如果Series想同时获得两个及以上的索引的值,name属性索引必须是一个list
#这种无规律的关联索引是依赖枚举索引的
#显式索引即使超出了范围也不会报错,会显示到最大的
可以把Series看成一个定长的有序字典
可以使用head()、tail()快速查看series对象的样式共同都有一个参数n,默认值是5
#读取文件使用的是pandas,不是使用数据类型
0 |
当索引没有对应的值时可能出现缺失数据显示NaN(not a number)的情况:
#mysql中运行null的效率最低,在开发中对於不重要的字段给出一个default 0
#NaN在统计、分组计算、(where|having)查询的时候效率非常低
(1)适用于numpy的数组运算也适用于series
在运算中自动对齐不同索引的数据
如果索引不对应,则补NAN
注意:要想保留所有的index则需要使用.add()函数
#生成0-100之间的随机整数
#生成0-100之间的随机整数
DataFrame是一个【表格型】的數据结构,可以看做是【由series组成的字典】(共用同一个索引DataFrame由按一定顺序排列的多列数据组成。设计初衷是将Series的使用场景从一维拓展到哆维DataFrame既有行索引,也有列索引
最常用的方法是传递一个字典来创建。DataFrame以字典的键作为每一列的名称以字典的值(一个数组
此外,DataFrame会自动加上每一行的索引(和Series一样)
同Series一样,若传入的列与字典的键不匹配则相应的值为NaN
– 通过类似字典的方式
-使用.iloc[]加整數来进行索引
(3)对元素索引的方法
在运算中自动对齐不同索引的数据
如果索引不对应,则补NaN
# 生成5行4列的随机数
#df5和df6只有cde部分是相同嘚所以其余部分相加结果为NAN
下面是Python 操作符与pandas操作函数的对应表:
使用python操作符:以行为单位操作(参数必须是行),对所有的行都有效。类似于NumpyΦ二维数组与一维数组的运算但可能出现NaN
? axis = 0:以列为单位操作(参数必须是列),对所有的列都有效
? axis = 1:以行为单位操作(参数必须是行)对所有的行都有效
0 |
---|
0 |
希望我的努力对您有帮助,