可进行分组但分组后的所有列,只能使用相同的聚合函数操作
如果想让不同列进行不同的聚合操作,就只能编写多次分别操作。
不同列可进行不同的聚合操作
对counts進行求和操作,对amounts进行均值操作
func接收多个函数名使用列表将多个函数名封装起来。
apply是对整个表格中的數据进行整合;agg可以让不同的字段执行不同的聚合函数
本质:就是对原始数据进行线性变换。
特点:通过离差标准化的计算后计算的值将落在[0,1]区间内。
解决离差标准化的好处:
第一组(以元为单位):
第二组(以k为单位):
对这两组数据计算方差/标准差,以表示数据的离散程喥
显然第一组数据要比第二组数据的标准差大得多,也就是更加离散
aggfunc–聚合函数名,不指定时默认使用mean求平均
index参数不能跟字段名,偠跟字段值
1.表中有些员工数据是重复的,通过选取合适的字段对整个表进行去重
当工号与名字一样时认为该数据为重复
2.员工平均工作年限是多少
3.公司任职最久的三名员工分别是谁?
4.员工总体流失率是多少
5.各部门有多少名员工?
原始数据有八列这里将’姓名’、'工龄’两列排序。
如果使用inplace=True修改原始数据就相当于剩下的六列没变化,将排序后的两列放入会造成数据混乱。
对于广义回归模型人们也总是假设数据具有名义离差,否则统计推断更加困难。
提出依据离差绝对值和准则用目标规划建立多元线性预测方程,该方法优于回归分析