如何评估统计意义

作者: Randy Alexander
创建日期: 2 四月 2021
更新日期: 26 六月 2024
Anonim
如何判断一只股票的价格是否合理?李永乐老师讲『贴现法』对股票估值
视频: 如何判断一只股票的价格是否合理?李永乐老师讲『贴现法』对股票估值

内容

假设检验以统计分析为指导。使用p值计算统计上显着的置信度-p值表示某个命题(无效假设)为真时观察到的结果的概率。如果p值小于显着性水平(通常为0.05),则实验者可以得出结论,有足够的证据来反驳原假设并接受反假设。使用简单的t检验,您可以计算p值并确定两组不同数据之间的显着性。

脚步

第1部分(共3部分):设置实验

  1. 确定您的假设。 评估统计显着性的第一步是确定要回答的问题并声明您的假设。假设是对经验数据和总体中可能存在差异的陈述。每个实验都有一个原假设和一个反假设。通常,您将比较两个组以查看它们是否相同或不同。
    • 一般而言,假设不是(H0),确认两组数据之间没有差异。示例:上课前阅读材料的学生的最终成绩不会更高。
    • 逆假设(H一种)与原假设相反,是您试图用经验数据支持的陈述。例如:上课前阅读材料的学生实际上会获得更好的期末成绩。

  2. 选择显着性级别,以确定可以在数据中视为有意义的差异程度。 重要性级别(也称为alpha)是您确定含义的阈值。如果p值小于或等于给定的显着性水平,则认为该数据具有统计显着性。
    • 通常,显着性水平(或alpha)通常选择为0.05,这意味着观察到数据差异的机会仅为5%。
    • 置信度越高(因此,p值越低),结果越有意义。
    • 如果需要更多置信度,则将p值降低到0.01。低p值通常用于制造中以检测产品缺陷。高度的可靠性对于接受每个部件的功能都至关重要。
    • 对于大多数基于假设的实验,可接受的显着性水平为0.05。

  3. 决定使用单尾还是双尾测试。 t检验的假设之一是您的数据呈正态分布。正态分布将形成一个钟形曲线,其中大多数观测值居中。 t检验是一种数学检验,用于检查您的数据是否落在曲线“顶部”部分的正态分布之外(上方还是下方)。
    • 如果不确定数据是高于还是低于对照组,请使用两尾检验。它允许您检查两个方向的重要性。
    • 如果您知道数据的预期方向,请使用单尾测试。在上面的示例中,您希望学生的分数会提高。因此,您使用单尾测试。

  4. 通过力分析确定样品大小。 测试的力量是在给定样本量下观察预期结果的能力。力(或β)的通用阈值为80%。没有一些初步数据,力分析可能会非常复杂,因为您需要一些有关组之间的期望均值及其标准偏差的信息。使用在线力分析来确定数据的最佳样本量。
    • 研究人员通常进行小型前提研究,以进行力分析并确定大型和综合研究所需的样本量。
    • 如果没有办法进行复杂的前提研究,请根据阅读文章和其他人可能做过的研究估算可能的均值。它可以为您确定样本量提供一个良好的开端。
    广告

第2部分,共3部分:计算标准差

  1. 确定标准偏差的公式。 标准偏差用于衡量数据的离散度。它为您提供有关样本中每个数据点身份的信息。刚开始使用时,方程式可能看起来非常复杂。但是,以下步骤将帮助您轻松理解计算过程。公式为s = √∑((x一世 -µ)/(N-1))。
    • s是标准偏差。
    • ∑表示您必须将所有收集的观测值相加。
    • X一世 每个代表您的数据值。
    • µ是每组数据的平均值。
    • N是观察总数。
  2. 平均每组中观察的数量。 要计算标准差,您需要首先计算每个单独组的观测值的平均值。该值用希腊字母mu或µ表示。为此,只需将观测值相加并除以观测值总数即可。
    • 例如,要查找上课前阅读文档的小组的平均成绩,我们来看一些数据。为简单起见,我们将使用5个点的数据集:90、91、85、83和94(以100点为单位)。
    • 汇总所有观察值:90 + 91 + 85 + 83 + 94 = 443。
    • 将上述总和除以观察数N(N = 5):443/5 = 88.6。
    • 该组的平均分数是88.6。
  3. 从每个观察值中减去平均值。 下一步涉及部分(x一世 -µ)。从每个观察值中减去平均值。在上面的示例中,我们有五个减法。
    • (90-88.6),(91-88.6),(85-88.6),(83-88.6)和(94-88.6)。
    • 计算值为1.4; 2.4; -3.6; -5.6和5.4。
  4. 将以上差异平方并加总。 现在,刚刚计算出的每个新值都将平方。在这里,负号也将被删除。如果在此步骤之后或计算结束时出现负号,则可能已忘记执行上述步骤。
    • 在我们的示例中,我们现在将使用1.96; 5.76; 12.96; 31.36和29.16。
    • 将这些平方加在一起:1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2。
  5. 除以观测总数减去1。 除以N-1有助于补偿不是针对总体人口进行的计算,而是基于所有学生的总体样本进行的计算。
    • 减:N-1 = 5-1 = 4
    • 除数:81.2 / 4 = 20.3
  6. 获得平方根。 一旦除以观察数减去1,就取所得值的平方根。这是计算标准偏差的最后一步。导入原始数据后,一些统计程序将帮助您执行此计算。
    • 在上述示例中,上课前阅读文档的学生的学期末成绩的标准偏差为:s =√20,3= 4.51。
    广告

第3部分,共3部分:统计意义的确定

  1. 计算两组观测值之间的方差。 到目前为止,该示例仅处理了一组观察结果。要比较两个组,您显然需要两个组的数据。计算第二组观测值的标准偏差,并用它来计算两个实验组之间的方差。计算方差的公式为:sd =√((s1/ N1)+(秒2/ N2)).
    • 小号d 是组之间的差异。
    • 小号1 是第1组和第N组的标准偏差1 组1的大小。
    • 小号2 是第2组和N组的标准偏差2 组2的大小。
    • 在我们的示例中,假设来自第2组的数据(未在课前阅读课文的学生)的大小为5,标准偏差为5.81。差异为:
      • 小号d =√((s1)/ N1)+((s2)/ N2))
      • 小号d = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. 计算数据的t分数。 T统计量使您可以将数据转换为可与其他数据相比的形式。 t值还允许您执行t检验,该检验可以让您计算两组之间统计上显着差异的可能性。 t统计量的计算公式为:t =(µ1 – µ2)/秒d.
    • µ1 是第一组的平均值。
    • µ2 是第二组的平均值。
    • 小号d 是观察值之间的方差。
    • 使用较大的平均值作为µ1 为了不得到负的t统计量。
    • 对于我们的示例,假设第2组(未阅读上一篇文章的)的观察平均值为80。t分数为:t =(µ1 – µ2)/秒d = (88,6 – 80)/3,29 = 2,61.
  3. 确定样品的自由度。 使用t统计量时,自由度是根据样本量确定的。将每个组的观测值相加,然后减去两个。在上面的示例中,自由度(d.f.)为8,因为在第一组中有5个观测值,在第二组中有5个样本((5 + 5)-2 = 8)。
  4. 使用表t评估重要性。 t值和自由度表可以在标准统计书或在线中找到。查找包含数据自由度和与您所拥有的t统计量相对应的p值的行。
    • 当自由度为8且t = 2.61时,单尾测试的p值介于0.01和0.025之间。由于选择的显着性水平小于或等于0.05,因此我们的数据具有统计学意义。有了这些数据,我们就拒绝了原假设,而接受了逆假设:在上课前阅读材料的学生最终得分更高。
  5. 考虑进行进一步的研究。 许多研究人员使用几种指标进行前提研究,以了解如何设计更大的研究。使用更多指标进行其他研究将增加您对结论的信心。广告

忠告

  • 统计是一个庞大而复杂的领域。参加高中或大学(或更高级)的统计假设测试课程以了解统计意义。

警告

  • 该分析着重于t检验,以检验两个正态分布总体之间的差异。根据数据的复杂性,您可能需要另一个统计测试。