中文数学 Wiki
Advertisement

在概率论中,相关系数是衡量随机变量随机向量的各分量之间(线性)相关性程度的一个指标。注意它只能衡量线性关系,对于非线性关系还需要引入其它概念。一下所称的相关性均指线性相关性。

定义[]

设有两个非退化的随机变量,它们的协方差存在,并记做,定义下述值 为这两个随机变量的相关系数。定义常数(退化的随机变量)和任何随机变量的相关系数为零。

可以证明协方差定义了某种内积,相关系数可以认为定义了某种夹角的余弦值。

如果,我们就说这两个随机变量正(负)相关;如果,我们就说这两个随机变量完全正(负)相关;如果,我们就说这两个随机变量线性无关。

线性不变性[]

的相关系数为,那么对任何实常数,随机变量的相关系数仍为

注意这里的线性指的是对一个随机变量进行线性操作,如果考虑这样两个随机变量,它的相关系数不一定是

等价刻画[]

是存在方差的随机变量,那么以下四款等价:

  1. 不相关();
  2. 协方差

相关与独立[]

独立,那么它们一定不相关,但反之不真。

但是,如果正态变量,独立性和相关性是等价的;如果是二值随机变量,独立性和相关性也是等价的。

二元正态分布中,参数就是的相关系数。

随机事件的相关系数[]

可以将随机变量的相关系数推广到随机事件中去,这是二值随机变量的一个应用。设为两个随机事件,,定义它们的相关系数为 显然当且仅当相互独立。

上下节[]

参考资料

  1. 李贤平, 《概率论基础(第3版)》, 高等教育出版社, 北京, 2010-04, ISBN 978-7-0402-8890-2.
Advertisement