确定相关系数

作者: Morris Wright
创建日期: 28 四月 2021
更新日期: 19 六月 2024
Anonim
陈老师spss数据分析教程之Pearson相关系数简介、原理、计算公式、适用范围及SPSS线性相关操作(1).mp4
视频: 陈老师spss数据分析教程之Pearson相关系数简介、原理、计算公式、适用范围及SPSS线性相关操作(1).mp4

内容

表示为r或ρ的相关系数是两个变量之间线性相关性(强度和方向上的关系)的量度。它的范围从-1到+1,使用加号和减号表示正相关和负相关。如果相关系数正好为-1,则两个变量之间的关系完全为负。如果相关系数正好为+1,则该关系完全为正。两个变量可以具有正相关,负相关或完全不相关。您可以使用在线上可用的一些免费相关性计算,或使用优质图形计算器的统计功能,手动计算相关性。

方法1之4:手动计算相关系数

  1. 首先收集您的数据。 要开始计算有效的相关性,请首先检查数据对。将它们垂直或水平放置在桌子中很有用。标记每行或每列x和y。
    • 例如,假设您有四个数据对 Xÿ。该表可能如下所示:
      • x || ÿ
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 计算平均值 X. 要计算均值,您需要的所有值 X 加,然后除以值的数量。
    • 使用上面的示例,请注意您有四个值 X。要计算平均值,您需要将所有值相加 X 并将其除以4。计算结果如下:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} =(1 + 2 + 4 + 5)/ 4}求平均值 ÿ. 到平均 ÿ 要找到它,请执行相同的步骤,将y的所有值加在一起,然后除以值的数量。
      • 在上面的示例中,您还具有四个值 ÿ。将所有这些值加在一起,然后将它们除以4。
      • μÿ=(1+3+5+7)/4{ displaystyle mu _ {y} =(1 + 3 + 5 + 7)/ 4}确定的标准偏差 X. 只要有能力,就可以计算标准差。为此,使用公式:
        • σX=1ñ1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma(x- mu _ {x})^ {2}}}}计算的标准偏差 ÿ. 使用相同的基本步骤,找到 ÿ。您将使用相同的公式,并使用y的数据点。
          • 使用样本数据,您的计算将如下所示:
          • σÿ=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} *((1-4)^ {2} +(3-4)^ {2} +( 5-4)^ {2} +(7-4)^ {2})}}}查看确定相关系数的基本公式。 用于计算相关系数的公式使用均值,标准差和数据集中的对数(用 ñ)。相关系数本身由小写字母r或希腊字母ρ(rho)表示。对于本文,我们将使用称为Pearson相关系数的公式,如下所示:
            • ρ=(1ñ1)Σ(XμXσX)(ÿμÿσÿ){ displaystyle rho = 左({ frac {1} {n-1}} 右) Sigma 左({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left({ frac {y- mu _ {y}} { sigma _ {y}}} right)}确定相关系数。 现在,您有了变量的均值和标准差,因此可以继续使用相关系数公式。请记住 ñ 代表您拥有的价值数量。您已经在上述步骤中计算出了其他相关信息。
              • 使用样本数据,您可以将数据输入到相关系数公式中,并按以下方式进行计算:
              • ρ=(1ñ1)Σ(XμXσX)(ÿμÿσÿ){ displaystyle rho = 左({ frac {1} {n-1}} 右) Sigma 左({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left({ frac {y- mu _ {y}} { sigma _ {y}}} right)}解释结果。 对于此数据集,相关系数为0.988。这个数字告诉您有关数据的两件事。查看数字的符号和数字的大小。
                • 由于相关系数为正,因此可以说x数据和y数据之间存在正相关。这意味着如果x值增加,则您希望y值也增加。
                • 由于相关系数非常接近+1,因此x数据和y数据非常紧密相关。如果要绘制这些点的图,您会发现它们非常近似于直线。

方法2之4:使用在线相关计算器

  1. 在线搜索相关计算器。 对于统计学家来说,测量相关性是一个相当标准的计算。如果手工完成,对于大型数据集,计算可能会变得非常乏味。因此,许多资料来源已使在线的通用相关性计算可用。使用任何搜索引擎,然后输入搜索词“相关计算器”。
  2. 输入数据。 请仔细阅读网站上的说明,以便您可以正确输入数据。保持数据对的顺序很重要,否则您将得到不正确的关联结果。不同的网站使用不同的格式来输入数据。
    • 例如,在网站http://ncalculators.com/statistics/correlation-coefficient-calculator.htm上,您将找到一个用于输入x值的水平框和另一个用于输入y值的水平框。您输入条款,仅用逗号分隔。因此,本文前面计算的x数据集应输入为1,2,4,5。 y数据集输入为1,3,5,7。
    • 在另一个站点http://www.alcula.com/calculators/statistics/correlation-coefficient/上,您可以水平或垂直输入数据,只要保持数据点有序即可。
  3. 计算结果。 这些计算站点很受欢迎,因为输入数据后,通常只需要单击“计算”按钮-结果就会自动出现。

方法3之4:使用图形计算器

  1. 输入您的详细信息。 在图形计算器上,启用统计功能,然后选择命令“编辑”。
    • 每个计算器的按键命令略有不同。本文提供了针对德州仪器TI-86的特定说明。
    • 要访问统计功能,请按[2nd] -Stat(“ +”键上方),然后按F2-Edit。
  2. 删除所有旧的存储数据。 大多数计算器会保留统计数据,直到将其清除为止。为确保您不会将旧数据与新数据混淆,应首先擦除所有先前保存的信息。
    • 使用箭头键移动光标以突出显示“ xStat”类别。然后按“清除”和“输入。这应该清除xStat列中的所有值。
    • 使用箭头键突出显示“ yStat”类别。按“清除”和“ Enter”也清除该列的数据。
  3. 输入您的数据值。 使用箭头键将光标移动到xStat标头下的第一个空格。输入您的第一个数据值,然后按Enter。您应该在屏幕“ xStat(1)= __”的底部看到空格,其中的值将填充空白区域。当您按Enter键时,数据将填满表格,光标将移至下一行,并且屏幕底部的行现在应显示为“ xStat(2)= __”。
    • 继续输入所有x值。
    • 输入x值后,使用箭头键移至yStat列并输入y值。
    • 输入所有数据后,按“退出”以清除屏幕并退出“统计”菜单。
  4. 计算线性回归统计量。 相关系数是数据接近直线的接近程度的度量。具有统计功能的图形计算器可以非常快速地计算出最佳拟合线和相关系数。
    • 输入统计功能,然后按计算按钮。在TI-86上,这是[2nd] [Stat] [F1]。
    • 选择线性回归计算。在TI-86上,它是[F3],标记为“ LinR”。然后图形显示屏将显示闪烁的光标所在的“ LinR _”行。
    • 现在,您必须输入要计算的两个变量的名称。它们是xStat和yStat。
      • 在TI-86上,通过按[2nd] [List] [F3]选择名称列表(“名称”)。
      • 屏幕的底行现在应该显示可用变量。选择[xStat](这可能是F1或F2按钮),然后输入逗号,然后输入[yStat]。
      • 按Enter计算数据
  5. 解释结果。 当您按Enter键时,计算器将立即为您输入的数据计算以下信息:
    • ÿ=一种+bX{ displaystyle y = a + bx}了解相关性的概念。 相关是指两个量之间的统计关系。相关系数是一个单一数字,可以为两组数据点计算。该数字始终在-1和+1之间,表示两个数据集的紧密程度。
      • 例如,如果您测量的是大约12岁以下儿童的身高和年龄,则可能会发现很强的正相关性。随着孩子年龄的增长,他们往往会更高。
      • 负相关性的一个示例是将某人花在练习高尔夫上的时间与该人的高尔夫得分进行比较。随着练习的进行,分数应该下降。
      • 最终,您期望一个人的鞋子大小与他们的考试成绩之间没有正相关或负相关。
    • 计算平均值。 一组数据的算术平均值或“均值”是通过将数据的所有值相加然后除以该组中值的数量来计算的。为了确定数据的相关系数,您需要计算每组数据的平均值。
      • 变量的平均值由变量指示,变量上方有一条水平线。对于x和y的数据集,通常将其称为“ x-bar”或“ y-bar”。替代地,平均值可以由小写希腊字母μ(mu)表示。例如,要表示x的数据点的平均值,可以使用μX 或μ(x)。
      • 例如,如果您有一组x(1,2,5,6,9,10),则此数据的平均值计算如下:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} =(1 + 2 + 5 + 6 + 9 + 10)/ 6}了解标准偏差的重要性。 在统计数据中,标准差衡量的是变化,表明数字与平均值之间的离散度。具有低标准偏差的一组数字彼此非常接近。具有高标准偏差的一组数字更加分散。
          • 作为符号,标准偏差使用小写字母s或希腊字母σ(sigma)表示。因此,x数据的标准偏差写为 sX 或σX.
        • 识别求和符号。 求和运算符是数学中最常见的运算符之一,它表示值的总和。它由希腊大写字母sigma或∑表示。
          • 例如,如果您有一个数据点x(1,2,5,6,9,10)的集合,则∑x表示:
            • 1+2+5+6+9+10 = 33

尖端

  • 为了纪念其开发者卡尔·皮尔森(Karl Pearson),有时将相关系数称为“皮尔逊乘积矩相关系数”。
  • 通常,高于0.8(正或负)的相关系数表示很强的相关性。低于0.5的相关系数(再次为正或负)表示较弱的相关系数。

警示语

  • 相关性显示两个数据集以某种方式连接。但是,请注意不要将其解释为因果关系。例如,如果您比较人们的鞋子尺码和他们的身高,您可能会发现很强的正相关性。较大的人通常有较大的脚。但是,这并不意味着变高会使您的脚变长,或者变大的脚会使您变高。他们只是在一起发生。