统计学名词

作者:管理员 发布时间:2021-01-18 18:05

统计学术语

基础统计学术语

术语描述操作
概率也成或然率,反映随机事件出现的可能性大小 编辑 删除
总体根据研究目的确定研究对象的全体成为总体。例如研究某班学生的身高,所有学生的身高数据为总体 编辑 删除
样本总体的一部分称作样本,如学生身高数据,抽取15个人的身高数据就是总体的一个样本。 编辑 删除
离散型在一定区间内,变量的取值是有限的、可数的且不连续的 编辑 删除
连续型在一定区间内,变量的取值是无限的,且是连续不断的 编辑 删除

数据的集中程度衡量

术语描述操作
求和sum() 编辑 删除
个数count() 编辑 删除
平均数mean() 编辑 删除
加权平均数average() 编辑 删除
中位数median() 编辑 删除
众数mode() 编辑 删除
上(下)四分位df.quantile() 编辑 删除

数据的离散程度衡量

术语描述操作
最大值max() 编辑 删除
最小值min() 编辑 删除
极差/全距max()-min() 编辑 删除
四分位差df.quantile(0.75)-df.quantile(0.25) 编辑 删除
离差/偏差df-df.mean 编辑 删除
平均差各项数据与平均值的差,取绝对值后的平均数 编辑 删除
方差各组数据与他们平均数的差的平方 编辑 删除
标准差方差的平方根 编辑 删除
标准误差|均方根误差衡量样本平均值的离散程度,即不同样本平均值间的差 编辑 删除
偏度根据众数、中位数与均值各自的性质,通过比较众数与中位数与均值来衡量偏斜度,用于衡量数据分布偏斜程度与方向 编辑 删除
峰度用来反映描述数据分布陡峭或是平滑的情况。用于衡量离群数据的离群度,峰度越大,说明改数据集中的极端越多 编辑 删除
置信区间一个概率样本的置信区间是对这个样本的某个总体参数的区间估计 编辑 删除
Z分数|标准分数z分数(z-score),也叫标准分数(standard score)是一个数与平均数的差再除以标准差的过程。在统计学中,标准分数是一个观测或数据点的值高于被观测值或测量值的平均值的标准偏差的符号数。 编辑 删除
T分数T分数的求值公式为:T=50+10Z,Z是一个数(X)与平均数(x)之差除以标准差(S)所得的商数。T分数的平均数是50,它的每一个标准差是10,所以,T分数为60等于平均数以上一个标准差的原始分数,T分数为70等于平均数以上两个标准差的原始分数 编辑 删除
协方差用于衡量两个变量的总体误差 编辑 删除
残差实际观测值与估计值之间的差 编辑 删除

标签:
Copyright © 2020 万物律动 旗下 AI算法狮 京ICP备20010037号-1
本站内容来源于网络开放内容的收集整理,并且仅供学习交流使用;
如有侵权,请联系删除相关内容;