본문 바로가기
  • Fast wealthy
  • 투비리치
기타/생각에 관한 생각

[생각에 관한 생각] 회귀로 직관적 예측을 다듬는 방법

by FORT98 2021. 2. 24.

 몇 가지 증거를 바탕으로 결과를 예측하는 우리의 직관적 능력은 때로는 정확하나, 똥볼을 차는 경우가 상당히 많다. 그렇다고 우리의 직관적 예측을 아예 무시할 수는 없다. 직관적 예측을 고려하면서 편향되지 않은 답을 내놓아야 한다. 책 "생각에 관한 생각"에서는 우리의 직관적 예측을 다듬는 방법으로 다음 네 가지 단계를 제시한다.

1. 평균 추정
2. 직관적 예측
3. 1,2 사이의 상관관계 추정
4. 1에서 상관관계만큼 2로 이동

 이 네 가지 단계를 통해 어떻게 직관을 다듬을 수 있는지 알아보자. 그 전에, 이 방법은 평균회귀에 대해 알아야 받아들일 수 있다. 평균회귀를 잠깐 살펴보고 가자.

평균회귀

 평균회귀를 가장 잘 설명해주는 명언(?)이 있다.

출처 : 스포츠한국

 시즌 초반 원래보다 좋은 성적을 보여주던 팀이, 경기를 거듭할수록 점점 순위가 떨어지는 현상은 스포츠를 좀 본 사람이라면 한 번쯤은 봤을 것이다. 팀뿐 아니라 선수도 이런 경우가 흔하다. 시즌 초반의 '반짝'은 비일비재하다.

 

 평균회귀는 두 측정치 사이의 상관관계가 불완전할 때 불가피하게 일어난다. 팀 순위와 실력 간의 상관관계는 불완전하다. 경기 결과는 오로지 실력으로만 결정되는 게 아니기 때문이다. 그렇기에 순위에 '이변'이 생기는 것이다. 그러나 팀 순위와 실력 간의 상관관계는 높기 때문에 'DTD, UTU'가 일어난다.

두 측정치 사이의 ‘상관계수’는 둘이 공유하는 요소의 상대적 비중을 0에서 1 사이의 값으로 나타낸다.

회귀로 직관적 예측을 다듬기

 회귀와 상관관계를 이용하면 우리의 직관적 예측을 다듬을 수 있다. 한 경기만 보고 어느 공격수가 한 시즌 동안 넣을 골을 예측하는 상황을 가정해보자. 선수의 퍼포먼스를 근거로 예측하는 것은 직관적 예측이다. 리그 공격수들의 평균 득점을 근거로 예측하는 것은 객관적 예측이다. 각 예측을 공통 요소와 한정요소로 표현하면 다음과 같다.

평균 득점 = 공통요소 + 평균 득점에 한정된 요소 = 100 퍼센트
퍼포먼스 = 공통요소 + 퍼포먼스에 한정된 요소 = 100 퍼센트

공통 요소가 둘 사이의 상관관계 정도다. 공통 요소에는 선수의 포지션이 있겠다. 퍼포먼스에 한정된 요소로는 선수 개인의 실력과 동료들의 도움이 있다. 평균 득점에 한정된 요소로는 그 리그의 축구 스타일을 들 수 있다. 

 리그 평균 공격수들의 평균 득점이 5골이라고 가정하자. 퍼포먼스를 근거로 예측한 골 수는 20골이라고 가정해보자. 5골에서 20골로 상관관계만큼 이동하면 편향되지 않은 예측을 내놓은 것이 된다.

상관관계

 퍼포먼스와 평균 득점 간의 상관관계가 30%라면 5골에서 20골 쪽으로 30%만큼 움직여야 한다. 그럼 대략 10골이다. 상관관계가 50%라면 12.5골이 편향되지 않은 예측이다.

 

 실제로는 상관관계가 10%도 안될 것이다. 그렇기 때문에 한 경기만 보고 시즌 총 득점 수를 예측하라고 했을 때는 평균치를 얘기하는 게 가장 편향되지 않은 답변이다. 

 

<직관적 예측 다듬기>

1. ~의 평균 추정
2. ~에 대한 직관적 예측
3. 1,2 사이의 상관관계 추정
4. 1에서 상관관계만큼 2로 이동

 

댓글