回归分析
德国学者 Gauss (1777‐1855) 于 1809 年提出最小二乘法。 英国遗传学家 Galton (1822‐1911) 于 1886 年发表关于回归的开山论文 《遗传结构中向中⼼的回...
九阳真经 - 假设检验篇
假设检验是统计推断的重要方法!统计推断包括假设检验和参数估计。 假设检验的定义 假设检验(hypothesis testing)是指从对总体参数所...
LLN & CLT
要分清依概率收敛&依分布收敛和大数定律&中心极限定理 大数定律 LLN 大数定律主要描绘的是样本算术平均值向期望的收敛情况。 伯努利大数...
非参数检验
需要做例题巩固! 参数检验:假设数据满足正态性、方差齐性、独立性等==假设==,通过估计==总体参数==(均值、方差等)进行检验。常见的如 z 检...
样本统计量相关概念辨析
参数:描述总体特征,例如总体均值或标准差。 统计量:描述样本特征,是样本的函数,它不依赖于总体参数。 ⚠️区分统计量和枢轴量(检验统计量也是统计...
统计中的三大检验
t 检验 常用于: 正态总体方差未知,单样本均值检验;(方差已知用 z-test, 非正态总体小样本用切比雪夫不等式); 两独立正态总体,方差未知但相等,均值差检验...
机器学习 Machine Learning
算法有朝一日真的会跟人类一样聪明吗? 打开非线性空间的钥匙:激活函数 激活函数的主要作用是引入非线性,使神经网络能够处理非线性问题,从而增强模型...
pdf pmf cdf
pmf pdf cdf 概念辨析 其实就是英文单词的首字母缩写。 概率质量函数 pmf,用于离散型随机变量:非负性、正则性。pmf 的函数值不能大于 1 概率密度函数 pd...
数据可视化
茎叶图 优点: 直观展示数据分布:茎叶图通过将数据分成“茎”和“叶”两部分,能够直观地展示数据的分布情况。 保留原始数据:与直⽅图不同,茎叶图保留...
关于分布
——转自 《一张图说明二项分布、泊松分布、指数分布、几何分布、负二项分布、伽玛分布的联系》 🐈注:图片中的“连续情况”并非指“连续型随机变量”。...
抽样技术
抽样方法 不同抽样方法各有千秋。抽样方法的选取,取决于研究目的和对性价比的考量。 抽样调查可以分为两类,即概率抽样和非概率抽样。==概率抽样==...
概率的定义
概率的定义 概率有古典定义、几何定义、频率定义(统计定义)和公理化定义(柯尔莫戈洛夫公理)共四种定义。(算上茆书后面提到的主观定义,那就一共有...
点估计相关归纳
定义:用于估计未知参数 $\theta$ 的统计量 $\hat{\theta}=\theta(x_1, x_2, …, x_n)$ 称为 $\theta$ 的估计量,或称为 $\theta$ 的点估计,简称估计。注意:==点估计是统计量(样本的函数)== 补充统计量定义...
多元统计分析复习笔记
主成分分析 主成分分析(Principal Component Analysis,PCA)是研究如何==通过原始变量的少数几个线性组合来解释原始变量绝大多数信息=...
关于概率论中的独立
随机事件层面的独立 在概率论里,“独立"并不意味着两个事件没有任何关系。 独立意味着一个事件的发生与否都不改变另一个事件发...