计算协方差

作者: Judy Howell
创建日期: 2 七月 2021
更新日期: 1 七月 2024
Anonim
数学期望、方差、协方差
视频: 数学期望、方差、协方差

内容

协方差是一种统计计算,可以使两个数据集之间的关系更加透明。例如,假设人类学家研究特定文化中人口的身高和体重。对于研究中的每个人,身高和体重都可以显示为一对数据(x,y)。这些值可以在标准公式中用于计算协方差关系。本文首先说明确定数据集协方差的计算。接下来,将讨论确定结果的其他两种自动方式。

方法1之4:使用标准公式手动计算协方差

  1. 了解标准协方差公式及其组成部分。 计算协方差的标准公式为 Σ(X一世X平均)(ÿ一世ÿ平均)/(ñ1){ displaystyle Sigma(x_ {i} -x _ { text {avg}})(y_ {i} -y _ { text {avg}})/(n-1)}构造数据表。 在开始之前,收集数据很有帮助。创建一个包含五列的表。您必须声明每一列,如下所示:
    • X{ displaystyle x}计算x个数据点的平均值。 该样本数据集包含9个数字。要找到平均值,请将它们相加并将其除以9。得出的结果为1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 =44。将其除以9时,便得到平均值4.89。这是您将在以后的计算中用作x(avg)的值。
    • 计算y个数据点的平均值。 该y列还必须包含与x个数据点重合的9个数据点。确定这些平均值。对于此样本数据集,该值变为8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 =49。将该总数除以9得到的平均值为5.44。您将使用5.44作为即将进行的计算的y(avg)的值。
    • 计算值 (X一世X平均){ displaystyle(x_ {i} -x _ { text {avg}})}计算值 (ÿ一世ÿ平均){ displaystyle(y_ {i} -y _ { text {avg}})}计算每个数据行的乘积。 通过将您在前两列中计算出的数字相乘来填写最后一列的行 (X一世X平均){ displaystyle(x_ {i} -x _ { text {avg}})}在最后一栏中找到值的总和。 这是Σ符号出现的地方。进行完所有计算后,将结果加在一起。对于此样本数据集,您现在应该在最后一列中有9个值。将这九个数字相加。密切注意数字是正数还是负数。
      • 此样本数据集的总和应为-64.57。将此总计写在列底部的空白处。这是标准协方差公式的分子的值。
    • 计算协方差公式的分母。 标准协方差公式的分子是您刚刚计算的值。分母由(n-1)表示,比数据集中的数据对数少一。
      • 在此示例问题中,有九对数据,因此n为9。因此,(n-1)的值等于8。
    • 用分子除以分母。 计算协方差的最后一步是对分子进行除法, Σ(X一世X平均)(ÿ一世ÿ平均){ displaystyle Sigma(x_ {i} -x _ { text {avg}})(y_ {i} -y _ { text {avg}})}请注意这里有重复的计算。 协方差是您必须手动执行几次的计算,以便您了解结果的含义。但是,如果您打算常规使用协方差来解释数据,那么您需要一种更快,更自动化的方式来获取结果。到现在为止,您可能已经注意到,由于我们的相对较小的数据集(只有9个数据对),计算包括两个均值,十八个单独的减法,九个乘法,一个加法以及最后一个除法。那是找到解决方案的31个相对较小的计算。在此过程中,您可能会遗漏负号或错误地复制结果,从而使答案不再正确。
    • 创建用于计算协方差的工作表。 如果您熟悉Excel(或其他计算程序),则可以轻松创建用于确定协方差的表。像手动进行计算一样,标记五列的标题:x,y,(x(i)-x(avg)),(y(i)-y(avg))和乘积。
      • 为了简化命名,只要您记得数据的含义,就可以将第三列称为“ x差异”,将第四列称为“ y差异”。
      • 如果表格从工作表的左上角开始,则单元格A1将被标记为x,而其他标签将继续到单元格E1。
    • 输入数据点。 在x和y两栏中输入数据值。请记住,数据点的顺序很重要,因此必须将每个y与对应的x值进行匹配。
      • x值从单元格A2开始,一直到所需的数据点数量。
      • y值从B2单元格开始,一直到所需的数据点数为止。
    • 确定x和y值的均值。 Excel可以非常快速地为您计算平均值。在每列数据下方的第一个空白单元格中,输入公式= AVERAGE(A2:A ___)。在空白处填充与您上一个数据点相对应的单元格编号。
      • 例如,如果您有100个数据点,则将填充单元格A2至A101,因此在单元格中键入= AVERAGE(A2:A101)。
      • 对于y数据,键入公式= AVERAGE(B2:B101)。
      • 请记住,Excel中的公式以“ =”开头。
    • 键入列的公式(x(i)-x(avg))。 在单元格C2中,输入用于计算第一个减法的公式。该公式变为:= A2 -___。用包含x数据平均值的单元格地址填充空白。
      • 例如,在100个数据点中,平均值将在单元格A103中,因此您的公式将变为:= A2-A103。
    • 对数据点重复公式(y(i)-y(avg))。 按照相同的示例,它进入单元格D2。公式变为:= B2-B103。
    • 为“产品”列键入公式。 在第五列中,在单元格E2中键入公式以计算前面两个单元格的乘积。然后,它变为:= C2 * D2。
    • 复制公式以填写表格。 到目前为止,您仅对第2行中的前几个数据点进行了编程。用鼠标标记单元格C2,D2和E2。将光标放在右下角的小方框上,直到出现加号。单击并按住鼠标按钮,然后向下拖动鼠标以展开选择并填充整个数据表。此步骤将自动将三个公式从单元格C2,D2和E2复制到整个表中。该表应自动填充所有计算。
    • 编程最后一列的总和。 您需要“产品”列中的项目总和。在该列最后一个数据点正下方的空白单元格中,输入公式:= SUM(E2:E ___)。用最后一个数据点的单元格地址填充空白。
      • 在具有100个数据点的示例中,此公式进入单元格E103。类型:= SUM(E2:E102)。
    • 确定协方差。 您也可以让Excel为您执行最终计算。在我们的示例中,单元格E103中的最后一次计算表示协方差公式的分子。在该单元格的正下方,键入公式:= E103 / ___。用您拥有的数据点数填充空白处。在我们的示例中,该值为100。结果是数据的协方差。

方法3之4:使用在线协方差计算器

  1. 在线搜索协方差计算器。 各种学校,公司或其他来源都有非常容易为您计算协方差值的网站。在搜索引擎中使用搜索词“协方差计算器”。
  2. 输入您的详细信息。 请仔细阅读网站上的说明,以确保您正确输入信息。保持数据对的顺序很重要,否则生成的结果将是不正确的协方差。网站具有不同的数据输入样式。
    • 例如,在http://ncalculators.com/statistics/covariance-calculator.htm网站上,有一个用于输入x值的水平框和另一个用于输入y值的水平框。您必须输入数据,并用逗号分隔。因此,本文前面计算的x数据集应输入为1,3,2,5,8,7,12,2,4。 y数据为8,6,9,4,3,3,2,7,7。
    • 在另一个网站https://www.thecalculator.co/math/Covariance-Calculator-705.html上,将要求您在第一个框中输入x数据。垂直输入数据,每行一项。因此,此站点上的条目如下所示:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. 计算结果。 这些在线计算的吸引力在于,输入数据后,通常只需单击“计算”按钮,结果就会自动显示。大多数站点将为您提供x(avg),y(avg)和n的中间计算。

方法4之4:解释协方差的结果

  1. 寻找积极或消极的关系。 协方差是一个单一的统计数字,表示一个数据集与另一个数据集之间的关系。在引言中提到的示例中,测量了身高和体重。您会期望,随着人们的成长,他们的体重也会增加,从而带来积极的协方差观点。另一个示例:假设收集的数据指示某人练习高尔夫的小时数以及他或她获得的得分。在这种情况下,您期望负协方差,这意味着随着训练小时数的增加,高尔夫球得分将降低。 (在高尔夫中,分数越低越好)。
    • 考虑上面计算的样本数据集。所得的协方差为-8.07。负号表示随着x值增加,y值趋于减小。通过查看一些值,您可以看到这是正确的。例如,1和2的x值分别对应于7、8和9的y值.8和12的x值分别与3和2的y值相关联。 。
  2. 解释协方差的大小。 如果协方差得分的数量很大(正数较大或负数较大),则可以将其解释为以正数或负数方式紧密关联的两个数据元素。
    • 样本数据集的-8.07协方差非常大。请注意,数据范围是1到12。因此8是一个相当大的数字。这表明数据集x和y之间存在相当强的关系。
  3. 了解缺乏关系。 如果您的结果是等于或非常接近0的协方差,则可以得出数据点无关的结论。即,一个值的增加可以但不必导致另一个值的增加。这两个术语几乎是随机链接的。
    • 假设您将鞋子的尺码与考试成绩相关联。由于影响学生考试成绩的因素太多,因此可以预期协方差得分接近0。这表明两个值之间几乎没有关系。
  4. 以图形方式查看关系。 为了直观地了解协方差,您可以在x,y图上绘制数据点。当您执行此操作时,应该很容易地看到,这些点虽然不完全在一条直线上,但往往会从左上角到右下角以对角线的方式接近簇。这是对负协方差的描述。您还可以看到协方差的值等于-8.07。与数据点相比,这是一个很大的数目。较高的数字表明协方差非常大,您可以从数据点的线性形状中得出。
    • 要再次进行此操作,请阅读WikiHow上有关坐标系统中的绘图点的文章。

警示语

  • 协方差在统计中的应用有限。这通常是迈向计算相关系数或其他概念的一步。注意基于协方差得分的过分大胆的解释。