如何计算线性相关系数

作者: Eric Farmer
创建日期: 7 行进 2021
更新日期: 1 七月 2024
Anonim
陈老师spss数据分析教程之Pearson相关系数简介、原理、计算公式、适用范围及SPSS线性相关操作(2)
视频: 陈老师spss数据分析教程之Pearson相关系数简介、原理、计算公式、适用范围及SPSS线性相关操作(2)

内容

相关系数(或线性相关系数)表示为“r”(在极少数情况下为“ρ”)并表征两个或多个变量的线性相关(即由某个值和方向给出的关系)。系数的值介于 -1 和 +1 之间,即相关性可以为正也可以为负。如果相关系数为-1,则存在完全负相关;如果相关系数为+1,则存在完全正相关。否则,两个变量之间存在正相关、负相关或不相关。相关系数可以手动计算,使用免费的在线计算器,或者使用好的图形计算器。

脚步

方法 1 of 4:手动计算相关系数

  1. 1 收集数据。 在开始计算相关系数之前,请研究这些数字对。最好将它们写在可以垂直或水平排列的表格中。用“x”和“y”标记每一行或每一列。
    • 例如,给定变量“x”和“y”的四对值(数字)。您可以创建下表:
      • ×||是
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 计算算术平均值“x”。 为此,请将所有 x 值相加,然后将结果除以值的数量。
    • 在我们的例子中,变量“x”有四个值。要计算算术平均值“x”,请将这些值相加,然后将总和除以 4。计算如下:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μX=12/4{ displaystyle mu _ {x} = 12/4}
    • μX=3{ displaystyle mu _ {x} = 3}
  3. 3 求算术平均值“y”。 为此,请执行相同的步骤,即将所有 y 值相加,然后将总和除以值的数量。
    • 在我们的例子中,给出了变量“y”的四个值。将这些值相加,然后将总和除以 4。计算如下:
    • μ=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μ=16/4{ displaystyle mu _ {y} = 16/4}
    • μ=4{ displaystyle mu _ {y} = 4}
  4. 4 计算标准偏差“x”。 计算“x”和“y”的均值后,找出这些变量的标准差。使用以下公式计算标准偏差:
    • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • 在我们的示例中,计算将如下编写:
    • σX=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σX=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σX=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σX=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σX=1,83{ displaystyle sigma _ {x} = 1.83}
  5. 5 计算标准偏差“y”。 按照上一步中概述的步骤进行操作。使用相同的公式,但插入 y 值。
    • 在我们的示例中,计算将如下编写:
    • σ=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σ=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σ=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σ=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σ=2,58{ displaystyle sigma _ {y} = 2.58}
  6. 6 写出计算相关系数的基本公式。 该公式包括两个变量的均值、标准差和数字对的数量 (n)。相关系数表示为“r”(在极少数情况下为“ρ”)。本文使用一个公式来计算 Pearson 相关系数。
    • ρ=(1n1)Σ(XμXσX)(μσ){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • 在这里和其他来源,数量可以用不同的方式表示。例如,一些公式包含“ρ”和“σ”,而其他公式包含“r”和“s”。一些教科书给出了不同的公式,但它们是上述公式的数学对应物。
  7. 7 计算相关系数。 您已经计算了两个变量的均值和标准差,因此您可以使用公式来计算相关系数。回想一下,“n”是两个变量的值对的数量。其他数值前面已经计算过了。
    • 在我们的示例中,计算将如下编写:
    • ρ=(1n1)Σ(XμXσX)(μσ){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ displaystyle rho = left ({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} right) * left ({ frac {3-4} {2.58}} right)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ( { frac { 5-3} {1.83}} right) * left ({ frac {7-4} {2.58}} right)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left ({ frac {2,965} {3}} right)}
    • ρ=0,988{ displaystyle rho = 0.988}
  8. 8 分析结果。 在我们的示例中,相关系数为 0.988。该值以某种方式表征一组给定的数字对。注意值的符号和大小。
    • 由于相关系数的值为正,因此变量“x”和“y”之间存在正相关。即,随着“x”的值增加,“y”的值也增加。
    • 由于相关系数的值非常接近+1,因此变量“x”和“y”的值高度相关。如果将点放在坐标平面上,它们将位于靠近某条直线的位置。

方法 2 of 4:使用在线计算器计算相关系数

  1. 1 在网上找一个计算器来计算相关系数。 这个系数通常在统计中计算。如果有很多对数,手动计算相关系数几乎是不可能的。因此,有在线计算器来计算相关系数。在搜索引擎中,输入“相关系数计算器”(不带引号)。
  2. 2 输入数据。 检查网站上的说明以输入正确的数据(数字对)。必须输入适当的数字对;否则,您将得到错误的结果。请记住,不同的网站有不同的输入格式。
    • 例如,在 http://ncalculators.com/statistics/correlation-coefficient-calculator.htm,变量 x 和 y 的值在两条水平线上输入。值以逗号分隔。也就是说,在我们的例子中,值“x”是这样输入的:1,2,4,5,而值“y”是这样输入的:1,3,5,7。
    • 在另一个站点 http://www.alcula.com/calculators/statistics/correlation-coefficient/ 上,数据是垂直输入的;在这种情况下,不要混淆相应的数字对。
  3. 3 计算相关系数。 输入数据后,只需单击“计算”、“计算”或类似按钮即可获得结果。

方法 3 of 4:使用图形计算器

  1. 1 输入数据。 拿一个图形计算器,进入统计计算模式并选择“编辑”命令。
    • 不同的计算器需要按不同的键。本文讨论德州仪器 TI-86 计算器。
    • 按[2nd] - Stat(+键上方)进入统计计算模式。然后按 F2 - 编辑。
  2. 2 删除之前保存的数据。 大多数计算器会保留您输入的统计数据,直到您将其删除。为避免将旧数据与新数据混淆,请先删除所有存储的信息。
    • 使用箭头键移动光标并突出显示“xStat”标题。然后按清除和回车清除 xStat 列中输入的所有值。
    • 使用箭头键突出显示“yStat”标题。然后按Clear 和Enter 清除yStat 列中输入的所有值。
  3. 3 输入初始数据。 使用箭头键将光标移动到标题“xStat”下的第一个单元格。输入第一个值并按 Enter。在屏幕底部,显示“xStat (1) = __”,输入的值替换了一个空格。按回车后,输入的值会出现在表格中,光标会移动到下一行;这将在屏幕底部显示“xStat (2) = __”。
    • 输入变量“x”的所有值。
    • 输入 x 的所有值后,使用箭头键导航到 yStat 列并输入 y 的值。
    • 输入所有数字对后,按退出键清屏并退出聚合模式。
  4. 4 计算相关系数。 它表征数据与某条直线的接近程度。图形计算器可以快速确定合适的直线并计算相关系数。
    • 单击统计 - 计算。在 TI-86 上,按 [2nd] - [Stat] - [F1]。
    • 选择线性回归函数。在 TI-86 上,按标有“LinR”的 [F3]。屏幕将显示带有闪烁光标的行“LinR _”。
    • 现在输入两个变量的名称:xStat 和 yStat。
      • 在 TI-86 上,打开姓名列表;为此,请按 [2nd] - [List] - [F3]。
      • 可用的变量显示在屏幕的底行。选择 [xStat](您可能需要按 F1 或 F2 来执行此操作),输入逗号,然后选择 [yStat]。
      • 按 Enter 处理输入的数据。
  5. 5 分析你的结果。 按 Enter 键,屏幕将显示以下信息:
    • =一种+X{ displaystyle y = a + bx}: 这是描述行的函数。请注意,该函数不是以标准形式 (y = kx + b) 编写的。
    • 一种={ displaystyle a =}...这是直线与 y 轴的交点的 y 坐标。
    • ={ displaystyle b =}...这是线的斜率。
    • 校正={ displaystyle { text {corr}} =}...这就是相关系数。
    • n={ 显示样式 n =}...这是计算中使用的数字对的数量。

方法 4 of 4:解释基本概念

  1. 1 理解相关性的概念。 相关性是两个数量之间的统计关系。相关系数是可以为任意两个数据集计算的数值。相关系数的值总是在-1到+1的范围内,表征两个变量之间的关系程度。
    • 例如,给定儿童的身高和年龄(大约 12 岁)。最有可能的是,会有很强的正相关,因为孩子们会随着年龄的增长而变得更高。
    • 负相关的一个例子:冬季两项训练所花费的罚秒和时间,即运动员训练得越多,获得的罚秒就越少。
    • 最后,有时几乎没有相关性(正或负),例如鞋号和数学分数之间的相关性。
  2. 2 记住如何计算算术平均值。 要计算算术平均值(或平均值),您需要找到所有这些值的总和,然后将其除以值的数量。请记住,计算相关系数需要算术平均值。
    • 变量的平均值由其上方带有水平条的字母表示。例如,在变量“x”和“y”的情况下,它们的平均值表示如下:x̅和y̅。平均值有时用希腊字母“μ”(mu)表示。要写出变量“x”的值的算术平均值,请使用符号 μX 或 μ (x)。
    • 例如,给定变量“x”的以下值:1、2、5、6、9、10。这些值的算术平均值计算如下:
      • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μX=33/6{ displaystyle mu _ {x} = 33/6}
      • μX=5,5{ displaystyle mu _ {x} = 5.5}
  3. 3 请注意标准偏差的重要性。 在统计学中,标准差表征数字相对于平均值的分散程度。如果标准差很小,则数字接近平均值;如果标准差很大,则数字与平均值相差很远。
    • 标准偏差由字母“s”或希腊字母“σ”(sigma)表示。因此,变量“x”的值的标准偏差表示如下:X 或 σX.
  4. 4 记住求和运算的符号。 求和符号是数学中最常见的符号之一,表示值的总和。这个符号是希腊字母“Σ”(大写西格玛)。
    • 例如,如果给定变量“x”的以下值:1、2、5、6、9、10,那么Σx的意思是:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

提示

  • 相关系数有时被称为“Pearson 相关系数”,以其开发者 Carl Pearson 的名字命名。
  • 在大多数情况下,当相关系数大于0.8(正或负)时,有很强的相关性;如果相关系数小于 0.5(正或负),则观察到弱相关。

警告

  • 相关性表征两个变量的值之间的关系。但请记住,相关性与因果关系无关。例如,如果比较人的身高和鞋码,很可能会发现很强的正相关关系。一般来说,身高越高的人,鞋码就越大。但这并不意味着身高的增加会导致鞋码的自动增加,或者脚越大会导致更快的增长。这些量只是相互关联的。