아이엑셀러 닷컴
  • 최초 작성일: 2008-08-29
  • 최종 수정일: 2008-08-29
  • 조회수: 5,440 회
  • 작성자: 무지개타고
  • 강의 제목: 다음 당첨자가 나올 확률은 얼마?

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

오가는 길 중간에 로또 판매점이 몇 군데 있는데 유독 눈길을 끄는 점포가 있다.

로딩 중...

찾아보지는 않았지만 아마도 최다 당첨점이 아닐까 싶다. 대충 정리해 보자.

로딩 중...

간격? 알려져 있기를, 어떤 사건이 발생되는 간격(시간)의 분포는 지수분포를 따른다고 하니 엑셀을 이용해 그래프로 한번 나타내 본다.

로딩 중...

이번 주가 298회이고 가장 최근에 1등이 나온 주가 286회. 그러면 이번 주와 최근 주의 간격은 12회차. 그럼 이번 주에 이 점포에서 당첨자가 나올 확률은 이렇게 계산할 수 있다.

P{X=12} = ExponDist(12,1/29.5,false) = 0.0226
로딩 중...

그런데 시간은 연속형 자료이므로 한 시점의 확률을 구하는 것은 별 의미가 없다. 12회차까지의 누적 확률을 구해야 한다.

P{X≤12} = ExponDist(12, 1/29.5, true) = 0.3342

그리고 지난 11회차까지의 누적 확률은,

P{X≤11} = ExponDist(11, 1/29.5, true) = 0.3113
로딩 중...

그런데 이 점포에서 지난 297회까지 당첨자가 나오지 않았다. 즉 11회차까지 당첨자가 나오지 않았으니 이번 12회차에서 당첨자가 나올 확률은 수정되어야 한다.

'P{11<X≤12} = P{X≤12} - P{X<11}'가 아니라 아래와 같이 되어야 한다.
P{X≤1+11|X>11} = P{X≤1} = ExponDist(1, 1/29.5, true) = 0.0333

이는 지수분포가 갖는 특성 때문이다. 야구 중계를 보면, 타율이 2할 5푼인 타자가 세 번째 타석까지 치지 못했으니 네 번째 타석에서는 칠 확률이 높다고 아주 '뻥'을 친다. 시간에는 메모리 칩이 달려 있지 않다(비기억성).

로딩 중...

그리고 이 점포에서 다음 당첨자가 나올 확률이 0.5가 되는 시간은 누적지수분포의 역함수를 구해 -29.5*Ln(0.5) = 20.4회차가 된다. 약 5개월이다.

다음 주에 이 점포 간판은 바뀔까? 이렇게 멋대로 계산해 봤지만 영양가가 없다. 당첨자가 나오든 말든 무슨 상관인가. 혼탁한 세상에 로또나 찍고 액땜이나 해야겠다. 이때 액땜 비용은 1,000원을 초과할 필요는 없겠다.

아이엑셀러 닷컴