作者:
Eric Farmer
创建日期:
7 行进 2021
更新日期:
1 七月 2024
内容
相关系数(或线性相关系数)表示为“r”(在极少数情况下为“ρ”)并表征两个或多个变量的线性相关(即由某个值和方向给出的关系)。系数的值介于 -1 和 +1 之间,即相关性可以为正也可以为负。如果相关系数为-1,则存在完全负相关;如果相关系数为+1,则存在完全正相关。否则,两个变量之间存在正相关、负相关或不相关。相关系数可以手动计算,使用免费的在线计算器,或者使用好的图形计算器。
脚步
方法 1 of 4:手动计算相关系数
- 1 收集数据。 在开始计算相关系数之前,请研究这些数字对。最好将它们写在可以垂直或水平排列的表格中。用“x”和“y”标记每一行或每一列。
- 例如,给定变量“x”和“y”的四对值(数字)。您可以创建下表:
- ×||是
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7
- 例如,给定变量“x”和“y”的四对值(数字)。您可以创建下表:
- 2 计算算术平均值“x”。 为此,请将所有 x 值相加,然后将结果除以值的数量。
- 在我们的例子中,变量“x”有四个值。要计算算术平均值“x”,请将这些值相加,然后将总和除以 4。计算如下:
- 3 求算术平均值“y”。 为此,请执行相同的步骤,即将所有 y 值相加,然后将总和除以值的数量。
- 在我们的例子中,给出了变量“y”的四个值。将这些值相加,然后将总和除以 4。计算如下:
- 4 计算标准偏差“x”。 计算“x”和“y”的均值后,找出这些变量的标准差。使用以下公式计算标准偏差:
- 在我们的示例中,计算将如下编写:
- 5 计算标准偏差“y”。 按照上一步中概述的步骤进行操作。使用相同的公式,但插入 y 值。
- 在我们的示例中,计算将如下编写:
- 6 写出计算相关系数的基本公式。 该公式包括两个变量的均值、标准差和数字对的数量 (n)。相关系数表示为“r”(在极少数情况下为“ρ”)。本文使用一个公式来计算 Pearson 相关系数。
- 在这里和其他来源,数量可以用不同的方式表示。例如,一些公式包含“ρ”和“σ”,而其他公式包含“r”和“s”。一些教科书给出了不同的公式,但它们是上述公式的数学对应物。
- 7 计算相关系数。 您已经计算了两个变量的均值和标准差,因此您可以使用公式来计算相关系数。回想一下,“n”是两个变量的值对的数量。其他数值前面已经计算过了。
- 在我们的示例中,计算将如下编写:
- [
]
- 8 分析结果。 在我们的示例中,相关系数为 0.988。该值以某种方式表征一组给定的数字对。注意值的符号和大小。
- 由于相关系数的值为正,因此变量“x”和“y”之间存在正相关。即,随着“x”的值增加,“y”的值也增加。
- 由于相关系数的值非常接近+1,因此变量“x”和“y”的值高度相关。如果将点放在坐标平面上,它们将位于靠近某条直线的位置。
方法 2 of 4:使用在线计算器计算相关系数
- 1 在网上找一个计算器来计算相关系数。 这个系数通常在统计中计算。如果有很多对数,手动计算相关系数几乎是不可能的。因此,有在线计算器来计算相关系数。在搜索引擎中,输入“相关系数计算器”(不带引号)。
- 2 输入数据。 检查网站上的说明以输入正确的数据(数字对)。必须输入适当的数字对;否则,您将得到错误的结果。请记住,不同的网站有不同的输入格式。
- 例如,在 http://ncalculators.com/statistics/correlation-coefficient-calculator.htm,变量 x 和 y 的值在两条水平线上输入。值以逗号分隔。也就是说,在我们的例子中,值“x”是这样输入的:1,2,4,5,而值“y”是这样输入的:1,3,5,7。
- 在另一个站点 http://www.alcula.com/calculators/statistics/correlation-coefficient/ 上,数据是垂直输入的;在这种情况下,不要混淆相应的数字对。
- 3 计算相关系数。 输入数据后,只需单击“计算”、“计算”或类似按钮即可获得结果。
方法 3 of 4:使用图形计算器
- 1 输入数据。 拿一个图形计算器,进入统计计算模式并选择“编辑”命令。
- 不同的计算器需要按不同的键。本文讨论德州仪器 TI-86 计算器。
- 按[2nd] - Stat(+键上方)进入统计计算模式。然后按 F2 - 编辑。
- 2 删除之前保存的数据。 大多数计算器会保留您输入的统计数据,直到您将其删除。为避免将旧数据与新数据混淆,请先删除所有存储的信息。
- 使用箭头键移动光标并突出显示“xStat”标题。然后按清除和回车清除 xStat 列中输入的所有值。
- 使用箭头键突出显示“yStat”标题。然后按Clear 和Enter 清除yStat 列中输入的所有值。
- 3 输入初始数据。 使用箭头键将光标移动到标题“xStat”下的第一个单元格。输入第一个值并按 Enter。在屏幕底部,显示“xStat (1) = __”,输入的值替换了一个空格。按回车后,输入的值会出现在表格中,光标会移动到下一行;这将在屏幕底部显示“xStat (2) = __”。
- 输入变量“x”的所有值。
- 输入 x 的所有值后,使用箭头键导航到 yStat 列并输入 y 的值。
- 输入所有数字对后,按退出键清屏并退出聚合模式。
- 4 计算相关系数。 它表征数据与某条直线的接近程度。图形计算器可以快速确定合适的直线并计算相关系数。
- 单击统计 - 计算。在 TI-86 上,按 [2nd] - [Stat] - [F1]。
- 选择线性回归函数。在 TI-86 上,按标有“LinR”的 [F3]。屏幕将显示带有闪烁光标的行“LinR _”。
- 现在输入两个变量的名称:xStat 和 yStat。
- 在 TI-86 上,打开姓名列表;为此,请按 [2nd] - [List] - [F3]。
- 可用的变量显示在屏幕的底行。选择 [xStat](您可能需要按 F1 或 F2 来执行此操作),输入逗号,然后选择 [yStat]。
- 按 Enter 处理输入的数据。
- 5 分析你的结果。 按 Enter 键,屏幕将显示以下信息:
- : 这是描述行的函数。请注意,该函数不是以标准形式 (y = kx + b) 编写的。
- ...这是直线与 y 轴的交点的 y 坐标。
- ...这是线的斜率。
- ...这就是相关系数。
- ...这是计算中使用的数字对的数量。
方法 4 of 4:解释基本概念
- 1 理解相关性的概念。 相关性是两个数量之间的统计关系。相关系数是可以为任意两个数据集计算的数值。相关系数的值总是在-1到+1的范围内,表征两个变量之间的关系程度。
- 例如,给定儿童的身高和年龄(大约 12 岁)。最有可能的是,会有很强的正相关,因为孩子们会随着年龄的增长而变得更高。
- 负相关的一个例子:冬季两项训练所花费的罚秒和时间,即运动员训练得越多,获得的罚秒就越少。
- 最后,有时几乎没有相关性(正或负),例如鞋号和数学分数之间的相关性。
- 2 记住如何计算算术平均值。 要计算算术平均值(或平均值),您需要找到所有这些值的总和,然后将其除以值的数量。请记住,计算相关系数需要算术平均值。
- 变量的平均值由其上方带有水平条的字母表示。例如,在变量“x”和“y”的情况下,它们的平均值表示如下:x̅和y̅。平均值有时用希腊字母“μ”(mu)表示。要写出变量“x”的值的算术平均值,请使用符号 μX 或 μ (x)。
- 例如,给定变量“x”的以下值:1、2、5、6、9、10。这些值的算术平均值计算如下:
- 3 请注意标准偏差的重要性。 在统计学中,标准差表征数字相对于平均值的分散程度。如果标准差很小,则数字接近平均值;如果标准差很大,则数字与平均值相差很远。
- 标准偏差由字母“s”或希腊字母“σ”(sigma)表示。因此,变量“x”的值的标准偏差表示如下:X 或 σX.
- 4 记住求和运算的符号。 求和符号是数学中最常见的符号之一,表示值的总和。这个符号是希腊字母“Σ”(大写西格玛)。
- 例如,如果给定变量“x”的以下值:1、2、5、6、9、10,那么Σx的意思是:
- 1 + 2 + 5 + 6 + 9 + 10 = 33.
- 例如,如果给定变量“x”的以下值:1、2、5、6、9、10,那么Σx的意思是:
提示
- 相关系数有时被称为“Pearson 相关系数”,以其开发者 Carl Pearson 的名字命名。
- 在大多数情况下,当相关系数大于0.8(正或负)时,有很强的相关性;如果相关系数小于 0.5(正或负),则观察到弱相关。
警告
- 相关性表征两个变量的值之间的关系。但请记住,相关性与因果关系无关。例如,如果比较人的身高和鞋码,很可能会发现很强的正相关关系。一般来说,身高越高的人,鞋码就越大。但这并不意味着身高的增加会导致鞋码的自动增加,或者脚越大会导致更快的增长。这些量只是相互关联的。