본문 바로가기

통계

[통계] 상관관계와 상관계수

통계적 사고방식이란 '어떤 사건이 우연히 발생할 확률이 얼마일까'라고 질문하는 것

 

상관관계란

한 변수와 다른 변수가 공변(서로 변함)하는 관계입니다.

  • 양의 상관관계를 가질경우, 두변수는 같은 방향으로 움직입니다. ex) X ↗ Y ↗
  • 음의 상관관계를 가질경우, 두변수는 서로 다른 방향으로 움직입니다. ex) X ↗ Y ↘

 

상관관계를 나타내는 값으로는 상관계수가 있는데, 이 상관계수 값은 -1 ~ +1까지만 존재하고

  • 상관계수가 -1일때는 완벽한 음의 상관관계
  • 상관계수가  0일때는 아무 관계가 없으며
  • 상관계수가  +1일때는 완벽한 양의 상관관계를 가지게 됩니다.

여기서 말하는 +/- 는 방향을 의미하는데,  이는 상관계수가 힘과 방향을 가지기 때문입니다.

앞의 양의 상관관계와 음의 상관관계 또한 방향에 관한 것입니다. 힘이란 상관계수의 크기를 의미하는데 상관계수의 절댓값이 1에 가까울수록 힘이 센것이고, 0에 가까울수록 힘이 약하다고 말할 수 있습니다.

X,Y를 산포도로 그렸을 때 데이터들이 서로 가깝게 모여있다는 말은 힘이 세다는 의미이며, 데이터가 멀리 퍼져있다는 말은 상관계수가 약해서 0에 가까워지는 것이라고 말하면 됩니다.

즉, + 는 우상향, -는 우하향의 의미를 가지며 방향성을 알수없는 거의 공모양에 가까워지면 상관계수는 0이 됩니다.

여기서 주의할점은 상관계수는 점들이 모여서 이루는 선의 각도와는 무관하다는 점은 유의하시길 바랍니다.

 

 

 

++ 상관관계는 인과관계가 아닙니다.

상관관계는 두 변수가 서로 관계가 있는지 없는지에 대한 이야기이고,

인과관계는 원인과 결과의 관계를 가지는 변수의 관계성을 의미하기 때문입니다.

 


이 포스팅은 Sapientia a Dei님의 통알못을 위한 통계튜브 - 기초편 - 을 참고하였습니다.

 

Sapientia a Dei

통알못을 위한 통계튜브 - 통통튜브 - 통알못(통계를 알지 못하는 사람)을 위한 통계튜브입니다. 이제 책도 웹/모바일에서 보실 수 있습니다. 통알못을 위한 기초통계 1권: https://who4u78.github.io/book

www.youtube.com