그냥 당신이 노총각일 확률 2012/01/09 11:52 by 세리자와

보다시피 지난 한 해동안 전혀 블로그 포스팅을 못했다. 이글루스에 이래저래 실망했기도 했고, 바쁘기도 했고, 결정적으로 트위터라는 물건을 발견해서 신변잡담은 대체로 거기에 토로하고 있기 때문이다.

근데 일년동안 전혀 글을 안 쓰는데도 오시는 방문객에게 예의가 아닐 것 같아, 새해벽두 농담이나 함 풀어볼란다.

요 근래 인기를 모으고 있는 코미디 중에 "애정남 - 애매한 것을 정해주는 남자"에 나도 꽤 빠져 있다. 이 개그의 미덕 중의 하나는 문제의 애매한 것을 정할 때 골치아프게 그 문제의 본질을 직접적으로 따지고 들기보다는 그 문제가 주위 사람들과 어떻게 상호작용하는지에 따라 결정된다는 반전의 묘에 있다. 예를 들어 노총각/노처녀의 기준을 결혼 적령기는 얼마이고 나이는 얼마인데 생물학적으로 자식을 잘 낳으려면 몇살 이하여야 되고 어쩌고 하는 등으로 본인 그 자체를 따지고 들기보다, 애정남 최효종은 이런 식으로 정해준다.

먼저 최효종은 주변사람들의 반응을 예로 들었다. “초면에 결혼했냐는 질문을 하면서 왜 안했는지 궁금해하면 노총각 노처녀가 아니고 결혼 안했다는 말에 ‘아 그렇구나’라며 바로 이해하면 노총각 노처녀다”고 말해 웃음을 자아냈다.

- 뉴스엔 기사

이와 비슷하게 확률/통계에도 어떤 현상의 추이를 직접적으로 재단하지 않고, 내가 현재 알고 있는 사실과 새로운 파악된 증거와의 상호작용을 통해 판단하는 방법이 있다. 이를 Bayesian 추론이라고 하는데, 기본적으로 다음과 같은 Bayes 정리에 기초하고 있다. 어떤 사건의 가능한 원인 중 하나가 \(C\) 결과를 \(O\)라고 하면, 그 \(O\)라는 결과가 관찰되었을 때 그것이 \(C\)때문이다 라고 추론될 확률은
\[ P(C|O) = \frac{P(O|C) P(C)}{P(O)} = \frac{P(O|C) P(C)}{\sum_{C=c}P(O|c)P(c)}\]
즉, \(C\)라면 \(O\)가 얼마나 일어날 수 있다는 개연성 (\(P(O|C)\))과 실제 \(C\)가 일어날 확률 (\(P(C)\))에 의해 결정되는 것이다.

그럼 오늘은 다음과 같은 질문에 답해보기로 하자: 주위 사람들이 여러분을 노총각이라고 부르거나 짐작한다면 여러분이 실제 노총각일 확률은 얼마나 될까? (단 유부남일 가능성은 제외하기로 한다).

그럼 실제로 노총각인 것을 \(o\), 노총각으로 의심받는 (하지만 실제 노총각인 줄은 알 수 없는) 것을 \(\bar{o}\)라고 표시하면 우리가 구할 것은 \(P(o|\bar{o})\)가 된다. 그러면 위의 Bayes 정리에 의해서
\[P(o|\bar{o}) = \frac{P(\bar{o}|o) P(o)}{P(\bar{o})}
= {1}/\left(1+\frac{P(\bar{o}|\sim o) P(\sim o)}{P(\bar{o}|o) P(o)}\right) \]
여기서 \(\sim o\)는 not \(o\), 즉 실제로는 노총각이 아닌 것을 뜻한다.

그러면 여러분의 나이가 \(y\)라고 하면, 노총각일 확률 \(P(o)\)는 다음과 같이 모델링될 수 있다고 가정하자.
\[ P(o) = \frac{1}{1+\exp(-(y-\mu)/\sigma)} \]
\(P(o)\) 함수는 아래처럼 나이가 아주 어릴 때는 노총각일 확률이 0이지만 나이가 먹으면 먹을 수록 확률이 조금씩 증가해서 소위 혼기 \(\mu\) 근처에서 \(\sigma\) 정도의 아리까리한 기간을 지나면 노총각 확률이 1에 근접해지게 된다. 대체로 다음과 같은 모양을 그리게 된다.



위에 그래프에서는 \(\mu = 35\), \(\sigma = 0.65\)를 사용했는데 그러면 대충 확률이 32세 근처(실제 평균 초혼 연령)에서 늘어나기 시작해서 37-8세(다문화 가정 평균 혼인 연령)면 완연한 노총각이 되는 것으로 모델이 된다. 그러면 \(P(\sim o) = 1-P(o)\)인 것을 이용하면 위에 위에 식은 다음과 같이 되는데,
\[ P(o|\bar{o}) = \frac{1}{1+\exp(-(y-\mu+b\sigma)/\sigma)}\]
여기서 \(b\)는 바이어스를 나타내는 것으로
\[ b = \log \frac{P(\bar{o}|o)}{P(\bar{o}|\sim o)} \]
즉 \(b\)는 대체로 노총각일 때 노총각이라고 의심받는 확률과 노총각이 아닌데도 노총각이라고 의심받는 확률의 비율에 해당한다.

그렇다면 여기서 생각을 해볼 수 있는 것이... 사회통념상 어떤 사람에게 노총각이라고 딱지를 붙이기는 보통 조심스럽다. 즉, 노총각이 아닌 것 같은데도 노총각이라고 불릴 확률보다는 노총각이 비교적 분명해보이는 사람이 노총각이라고 불릴 확률이 사회의 예의범절에 비추어 볼 때 훠얼씬 크다는 말이다. 이렇게 생각해 보면, 진짜 노총각이 노총각이라고 불리는 확률이 노총각 아닌 사람이 노총각이라고 불릴 확률보다 어림 땡 잡아서 한 세배 이상은 족히 될 것이다. 그런 젼차로,
\[ b = \log \frac{P(\bar{o}|o)}{P(\bar{o}|\sim o)} > \log 3. \]
따라서 \(P(o|\bar{o})\)는 다음과 같이 된다.
\[ P(o|\bar{o}) = \frac{1}{1+\exp(-(y-\mu+b\sigma)/\sigma)}, \qquad e^b \gg 1.\]
그리고 그림으로 그려보면 아래와 같이 된다.



파란 선은 \(P(o)\), 빨간선이 바로 \(P(o|\bar{o})\)에 해당되는데 파라메터는 위의 그래프와 같다. 바이어스는 잘 봐줘서 \(\log 3\) 로 했다. 여기에서 알 수 있는 사실은

  1. 여러분 나이가 만 34세 이하이면 아직 멀었다. "결혼 안하니?"하고 채근해도 걍 무시해라.

  2. 꺽인 만 34-35세 사이이고 노총각 소리를 듣기 시작하는 미혼이라면 여러분이 실제 노총각(그게 뭐던간에. -_-;;;)일 확률은 50%를 넘어가기 시작한다. 긴장 슬슬 하시라.

  3. 35세 이상이고 노총각 소리를 듣고 있다면 당신이 실제 노총각일 확률은 이미 75%를 넘고 있다. 서두르시라.



결론: 올해도 건강하시고 꼭 좋은 사람 만나세요.





덧글

댓글 입력 영역