如何计算线性相关系数

视频: 陈老师spss数据分析教程之Pearson相关系数简介、原理、计算公式、适用范围及SPSS线性相关操作（2）

内容

脚步
方法 1 of 4：手动计算相关系数
方法 2 of 4：使用在线计算器计算相关系数
方法 3 of 4：使用图形计算器
方法 4 of 4：解释基本概念
提示
警告

相关系数（或线性相关系数）表示为“r”（在极少数情况下为“ρ”）并表征两个或多个变量的线性相关（即由某个值和方向给出的关系）。系数的值介于 -1 和 +1 之间，即相关性可以为正也可以为负。如果相关系数为-1，则存在完全负相关；如果相关系数为+1，则存在完全正相关。否则，两个变量之间存在正相关、负相关或不相关。相关系数可以手动计算，使用免费的在线计算器，或者使用好的图形计算器。

脚步

方法 1 of 4：手动计算相关系数

1 收集数据。 在开始计算相关系数之前，请研究这些数字对。最好将它们写在可以垂直或水平排列的表格中。用“x”和“y”标记每一行或每一列。
- 例如，给定变量“x”和“y”的四对值（数字）。您可以创建下表：
  - ×||是
  - 1 || 1
  - 2 || 3
  - 4 || 5
  - 5 || 7
2 计算算术平均值“x”。 为此，请将所有 x 值相加，然后将结果除以值的数量。
- 在我们的例子中，变量“x”有四个值。要计算算术平均值“x”，请将这些值相加，然后将总和除以 4。计算如下：
- ${ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}$
- ${ displaystyle mu _ {x} = 12/4}$
- ${ displaystyle mu _ {x} = 3}$
3 求算术平均值“y”。 为此，请执行相同的步骤，即将所有 y 值相加，然后将总和除以值的数量。
- 在我们的例子中，给出了变量“y”的四个值。将这些值相加，然后将总和除以 4。计算如下：
- ${ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}$
- ${ displaystyle mu _ {y} = 16/4}$
- ${ displaystyle mu _ {y} = 4}$
4 计算标准偏差“x”。 计算“x”和“y”的均值后，找出这些变量的标准差。使用以下公式计算标准偏差：
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}$
- 在我们的示例中，计算将如下编写：
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}$
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}$
- ${ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}$
- ${ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}$
- ${ displaystyle sigma _ {x} = 1.83}$
5 计算标准偏差“y”。 按照上一步中概述的步骤进行操作。使用相同的公式，但插入 y 值。
- 在我们的示例中，计算将如下编写：
- ${ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}$
- ${ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}$
- ${ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}$
- ${ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}$
- ${ displaystyle sigma _ {y} = 2.58}$
6 写出计算相关系数的基本公式。 该公式包括两个变量的均值、标准差和数字对的数量 (n)。相关系数表示为“r”（在极少数情况下为“ρ”）。本文使用一个公式来计算 Pearson 相关系数。
- ${ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}$
- 在这里和其他来源，数量可以用不同的方式表示。例如，一些公式包含“ρ”和“σ”，而其他公式包含“r”和“s”。一些教科书给出了不同的公式，但它们是上述公式的数学对应物。
7 计算相关系数。 您已经计算了两个变量的均值和标准差，因此您可以使用公式来计算相关系数。回想一下，“n”是两个变量的值对的数量。其他数值前面已经计算过了。
- 在我们的示例中，计算将如下编写：
- ${ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}$
- ${ displaystyle rho = left ({ frac {1} {3}} right) *}$ [ ${ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} right) * left ({ frac {3-4} {2.58}} right)}$
  ${ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ( { frac { 5-3} {1.83}} right) * left ({ frac {7-4} {2.58}} right)}$ ]
- ${ displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}$
- ${ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}$
- ${ displaystyle rho = left ({ frac {2,965} {3}} right)}$
- ${ displaystyle rho = 0.988}$
8 分析结果。 在我们的示例中，相关系数为 0.988。该值以某种方式表征一组给定的数字对。注意值的符号和大小。
- 由于相关系数的值为正，因此变量“x”和“y”之间存在正相关。即，随着“x”的值增加，“y”的值也增加。
- 由于相关系数的值非常接近+1，因此变量“x”和“y”的值高度相关。如果将点放在坐标平面上，它们将位于靠近某条直线的位置。

方法 2 of 4：使用在线计算器计算相关系数

1 在网上找一个计算器来计算相关系数。 这个系数通常在统计中计算。如果有很多对数，手动计算相关系数几乎是不可能的。因此，有在线计算器来计算相关系数。在搜索引擎中，输入“相关系数计算器”（不带引号）。
2 输入数据。 检查网站上的说明以输入正确的数据（数字对）。必须输入适当的数字对；否则，您将得到错误的结果。请记住，不同的网站有不同的输入格式。
- 例如，在 http://ncalculators.com/statistics/correlation-coefficient-calculator.htm，变量 x 和 y 的值在两条水平线上输入。值以逗号分隔。也就是说，在我们的例子中，值“x”是这样输入的：1,2,4,5，而值“y”是这样输入的：1,3,5,7。
- 在另一个站点 http://www.alcula.com/calculators/statistics/correlation-coefficient/ 上，数据是垂直输入的；在这种情况下，不要混淆相应的数字对。
3 计算相关系数。 输入数据后，只需单击“计算”、“计算”或类似按钮即可获得结果。

方法 3 of 4：使用图形计算器

1 输入数据。 拿一个图形计算器，进入统计计算模式并选择“编辑”命令。
- 不同的计算器需要按不同的键。本文讨论德州仪器 TI-86 计算器。
- 按[2nd] - Stat（+键上方）进入统计计算模式。然后按 F2 - 编辑。
2 删除之前保存的数据。 大多数计算器会保留您输入的统计数据，直到您将其删除。为避免将旧数据与新数据混淆，请先删除所有存储的信息。
- 使用箭头键移动光标并突出显示“xStat”标题。然后按清除和回车清除 xStat 列中输入的所有值。
- 使用箭头键突出显示“yStat”标题。然后按Clear 和Enter 清除yStat 列中输入的所有值。
3 输入初始数据。 使用箭头键将光标移动到标题“xStat”下的第一个单元格。输入第一个值并按 Enter。在屏幕底部，显示“xStat (1) = __”，输入的值替换了一个空格。按回车后，输入的值会出现在表格中，光标会移动到下一行；这将在屏幕底部显示“xStat (2) = __”。
- 输入变量“x”的所有值。
- 输入 x 的所有值后，使用箭头键导航到 yStat 列并输入 y 的值。
- 输入所有数字对后，按退出键清屏并退出聚合模式。
4 计算相关系数。 它表征数据与某条直线的接近程度。图形计算器可以快速确定合适的直线并计算相关系数。
- 单击统计 - 计算。在 TI-86 上，按 [2nd] - [Stat] - [F1]。
- 选择线性回归函数。在 TI-86 上，按标有“LinR”的 [F3]。屏幕将显示带有闪烁光标的行“LinR _”。
- 现在输入两个变量的名称：xStat 和 yStat。
  - 在 TI-86 上，打开姓名列表；为此，请按 [2nd] - [List] - [F3]。
  - 可用的变量显示在屏幕的底行。选择 [xStat]（您可能需要按 F1 或 F2 来执行此操作），输入逗号，然后选择 [yStat]。
  - 按 Enter 处理输入的数据。
5 分析你的结果。 按 Enter 键，屏幕将显示以下信息：
- ${ displaystyle y = a + bx}$ : 这是描述行的函数。请注意，该函数不是以标准形式 (y = kx + b) 编写的。
- ${ displaystyle a =}$ ...这是直线与 y 轴的交点的 y 坐标。
- ${ displaystyle b =}$ ...这是线的斜率。
- ${ displaystyle { text {corr}} =}$ ...这就是相关系数。
- ${ 显示样式 n =}$ ...这是计算中使用的数字对的数量。

方法 4 of 4：解释基本概念

1 理解相关性的概念。 相关性是两个数量之间的统计关系。相关系数是可以为任意两个数据集计算的数值。相关系数的值总是在-1到+1的范围内，表征两个变量之间的关系程度。
- 例如，给定儿童的身高和年龄（大约 12 岁）。最有可能的是，会有很强的正相关，因为孩子们会随着年龄的增长而变得更高。
- 负相关的一个例子：冬季两项训练所花费的罚秒和时间，即运动员训练得越多，获得的罚秒就越少。
- 最后，有时几乎没有相关性（正或负），例如鞋号和数学分数之间的相关性。
2 记住如何计算算术平均值。 要计算算术平均值（或平均值），您需要找到所有这些值的总和，然后将其除以值的数量。请记住，计算相关系数需要算术平均值。
- 变量的平均值由其上方带有水平条的字母表示。例如，在变量“x”和“y”的情况下，它们的平均值表示如下：x̅和y̅。平均值有时用希腊字母“μ”（mu）表示。要写出变量“x”的值的算术平均值，请使用符号 μ_X 或 μ (x)。
- 例如，给定变量“x”的以下值：1、2、5、6、9、10。这些值的算术平均值计算如下：
  - ${ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}$
  - ${ displaystyle mu _ {x} = 33/6}$
  - ${ displaystyle mu _ {x} = 5.5}$
3 请注意标准偏差的重要性。 在统计学中，标准差表征数字相对于平均值的分散程度。如果标准差很小，则数字接近平均值；如果标准差很大，则数字与平均值相差很远。
- 标准偏差由字母“s”或希腊字母“σ”（sigma）表示。因此，变量“x”的值的标准偏差表示如下：_X 或 σ_X.
4 记住求和运算的符号。 求和符号是数学中最常见的符号之一，表示值的总和。这个符号是希腊字母“Σ”（大写西格玛）。
- 例如，如果给定变量“x”的以下值：1、2、5、6、9、10，那么Σx的意思是：
  - 1 + 2 + 5 + 6 + 9 + 10 = 33.