样本统计量相关概念辨析
参数:描述总体特征,例如总体均值或标准差。 统计量:描述样本特征,是样本的函数,它不依赖于未知参数。 样本统计量:它是根据样本数据计算出来的一些描述样本特征的概括性数字度量,是样本的函数。如样本均值、样本标准差、样本比例等。 抽样分布:由样本统计量这个随机变量所形成的概率分布。区分样本...
参数:描述总体特征,例如总体均值或标准差。 统计量:描述样本特征,是样本的函数,它不依赖于未知参数。 样本统计量:它是根据样本数据计算出来的一些描述样本特征的概括性数字度量,是样本的函数。如样本均值、样本标准差、样本比例等。 抽样分布:由样本统计量这个随机变量所形成的概率分布。区分样本...
打开非线性空间的钥匙:激活函数 激活函数的主要作用是引入非线性,使神经网络能够处理非线性问题,从而增强模型的表达能力,使其能够拟合复杂的函数关系。 LSTM 便是通过激活函数实现“遗忘门”、“输入门”等功能: 各种算法 在二分类问题中,模型通常会输出一个概率得分(如 Softmax),然后通过设定...
德国学者 Gauss (1777‐1855) 于 1809 年提出最小二乘法。 英国遗传学家 Galton (1822‐1911) 于 1886 年发表关于回归的开山论文 《遗传结构中向中⼼的回归》Regression towards Mediocrity in heredity structure)。[[统计学史#^tp89te]] 回归分析是处理变量之间的==相关关系==的⼀种统计⽅法...
概率质量函数 pmf,用于离散型随机变量:非负性、正则性。pmf 的函数值不能大于 1 概率密度函数 pdf,用于连续型随机变量:非负性、正则性。pdf 函数值可能大于 1(用密度去理解) ⚠️存在既非离散又非连续型的随机变量! 概率分布函数 cdf,单调性(单调非减)、有界性、右连续性、非负性 连续...
茎叶图 优点: 直观展示数据分布:茎叶图通过将数据分成“茎”和“叶”两部分,能够直观地展示数据的分布情况。 保留原始数据:与直⽅图不同,茎叶图保留了原始数据的详细信息,每个数据点都可以从图中直接读取。 简单易绘制:茎叶图不需要复杂的计算或⼯具,⼿⼯即可快速绘制。 适合⼩数据集:茎叶图特别适...
——转自 《一张图说明二项分布、泊松分布、指数分布、几何分布、负二项分布、伽玛分布的联系》 二项分布的近似 n 大 p 不是很小, $np \rightarrow \infty$, 实际中常用 $np>5, nq>5$ 来作为使用正态分布来近似二项分布的条件(棣莫弗-拉普拉斯中心极限定理) n 大 p 很小且 $np \rightarrow \lambda$ 时可用泊松分布近似 泊松分布是在不知道事件的可能发生总次...
抽样方法 不同抽样方法各有千秋。抽样方法的选取,取决于研究目的和对性价比的考量。 抽样调查可以分为两类,即概率抽样和非概率抽样。==概率抽样==是按照随机原则进行抽样,不加主观因素,组成总体的每个单位都有被抽中的概率(非零概率),可以避免样本出现偏差,样本对总体有很强的代表性。==非...
概率的定义 概率有古典定义、几何定义、频率定义(统计定义)和公理化定义(柯尔莫戈洛夫公理)共四种定义。(算上茆书后面提到的主观定义,那就一共有 5 种定义) 其中古典定义、几何定义和频率定义(统计定义)都满足概率的公理化定义? 具体介绍可参见该博文 概率的四种定义及公理化定义产生 区别古典概率...
定义:用于估计未知参数 $\theta$ 的统计量 $\hat{\theta}=\theta(x_1, x_2, …, x_n)$ 称为 $\theta$ 的估计量,或称为 $\theta$ 的点估计,简称估计。注意:==点估计是统计量(样本的函数)== 补充统计量定义:设 $x_1, x_2, …, x_n$ 为取自某总体的样本,若样本函数 $T=T(x_1, x_2, …, x_n)$ 中不含有任何未知参数,则称 $T$...
主成分分析 主成分分析(Principal Component Analysis,PCA)是研究如何==通过原始变量的少数几个线性组合来解释原始变量绝大多数信息==的多元统计分析方法。在尽可能地保留原始变量信息的前提下进行降维,从而简化问题的复杂性,==抓住问题的主要矛盾==。 该方法主要基于众多原始变...
假设检验是统计推断的重要方法!统计推断包括假设检验和参数估计。 假设检验的定义 假设检验(hypothesis testing)是指从对总体参数所做的一个假设开始,然后搜集样本数据,计算出样本统计量,进而运用这些数据测定假设的总体参数在多大程度上是可靠的,并做出承认还是拒绝该假设的判断...
随机事件层面的独立 在概率论里,“独立"并不意味着两个事件没有任何关系。 独立意味着一个事件的发生与否都不改变另一个事件发生的概率。 - 知乎文章 数学定义见下: 两个随机事件间的独立性定义: $P(AB)=P(A)P(B)$,即 $P(A|B)=P(A)$ 。不独立,又称相依。 多个随机事件间的独立...
本文使用腾讯 ima.copilt 来搭建知识库 背景 在准备复试时从小红书、闲鱼等各种渠道获取到很多复试资料。但是文件繁多,部分资料还存在重复问题,不想花太多时间在搜索信息上面,想到前几天在小红书看到很多人推荐用腾讯的 ima.copilt 来搭建知识库。于是灵机一动,便萌生了通过搭建知识库以提升信息检索效率的法子。 具体操作...
本人通过 Obsidian + Hugo + Github Page + Github Action 来实现文章管理及博客自动化搭建. Hugo 渲染白名单 因为不想将 Obsidian 仓库中的一些隐私笔记发布到博客上, 于是选择使用 module.mounts 来配置允许 Hugo 渲染的文件夹. 1module: 2 mounts: 3 - source: "content/posts/3. Resources-资源 未来/AI人工智能" 4 target: "content/posts/AI人工智能&#...
参考: # hexo之mongodb修改twikoo评论的管理密码 以及 # Twikoo 找回暗号及密码 核心目标: 把 MongoDB 中的"ADMIN_PASS"值删除.