• 최초 작성일: 2007-10-23
  • 최종 수정일: 2007-10-23
  • 조회수: 8,999 회
  • 작성자: 무지개타고
  • 강의 제목: 통계로 세상보기 ㅡ 길동이가 만든 30cm 자, 과연 팔 수 있을까?

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

만약에 만 10세 ~ 18세까지의 취학 연령대의 인구(학생)는 자가 항상 필요한데, 가지고 있는 자를 매년 한 번씩 부러뜨려 먹다 보니 해마다 하나씩 꼭 산다고 하자.

통계청의 추계인구 자료를 보니 2007년 인구는 6,025,530명이다. 이 중 여학생은 30㎝ 자가 학업에 필요 없다면 남학생의 수만 알면 되겠다. 추계인구 중 남학생은 3,194,155명이다. 30㎝ 학습용 자의 판매가가 1,000원 이라고 하면 학습용 자의 시장규모는 대략 32억 된다. 이에 우리의 길동이는 학습용 자를 생산하는 공장을 세워 자를 만들기 시작한다. 이제 돈 벌 일만 남았다.

길동이가 드디어 30㎝ 학습용 자의 첫 번째 시제품을 완성했다. 그런데 길이를 확인하니 30.11㎝가 나왔다. 30㎝ 자의 길이는 무조건 30㎝로 정확해야 한다. 당연하다. 30㎝ 자가 29㎝ 또는 31㎝가 나오면 안 되잖아. 그런데 30.11㎝가 나와 버렸다.

만약 30㎝ 자의 표준 규격을 29.9㎝~30.1㎝라고 가정한다면 평균은 30㎝이고 규격 한계는 ±0.1㎝이다(음, 애매하군. 이걸 시장에 내다 팔어? 말어?)

표준 규격을 벗어나므로 길동이는 30.11㎝의 자를 사기(?)치고 팔아야 될 형국이다. 그런데 두 번째 시제품은 29.99㎝가 나왔다. 만약 생산된 자의 길이가 정규분포 N(30.05, 0.0072)를 따른다고 한다면,

로딩 중...

표준 규격에 포함되는 면적이 68.36%이므로 대략 2/3만 유통 가능한 품질수준이다. 풀 죽은 길동이. 남들은 6시그마인가 뭔가도 한다는데 이게 도대체 뭐냐고요? 그래, 더 정확한 30㎝ 자를 만들자!

방법은 크게 두 가지다. 평균을 이동시키는 방법과 분산을 줄이는 방법. 우선 분산을 줄이기 위해 현재 공정을 1s라 한다면, 1s공정의 분산을 반으로 줄이는 공정을 2s라 하고 1s공정의 분산을 1/3로 줄이는 공정을 3s라 하고...

로딩 중...

이랬을 때 4s부터는 합격률의 증가속도가 거의 정체되어 나타나는 걸 볼 수 있다. 즉 5s, 6s는 좋긴 하지만 노력한 만큼 성과가 눈에 잘 띄지 않는 참으로 힘든 단계가 되겠다.

로딩 중...

그리고 여기다 평균까지 고려하면

로딩 중...

엄청 정신 없어 보이는데, 평균이 30에 가깝고 분산이 작을수록 합격률이 높은 건 당연하다(원래 통계는 당연한 걸 당연하게 보여주는 거다. 아닌가?). 여기서 만약에 규격에서 제시한 ±0.1㎝ 을 1σ라 하고, 1σ를 반으로 줄인 것을 2σ, 1σ를 1/3로 줄인 것을 3σ라고 한다면...

로딩 중...

익히 알려진 6σ다. 그런데 이 때 편의 bias가 발생된다고 한다. 참고로, 편의란 대충 이런 거다. 과녁에 화살을 쏘는데 한 쪽으로 쏠리는 것.

로딩 중...

이렇게 편의가 발생된다면 활의 축을 이동시키야 하는데, 여차 잘못하면 안정된 분산까지 커질 수 있어서 절대 만만치 않은 작업이다.

다시 돌아와서, 편의가 발생될 때에 6σ수준의 분포를 편의가 없을 때(불편)와 비교해 그려보면 아래와 같다.

로딩 중...

축(평균)의 이동으로 인해 많은 변화가 발생했다. 즉 6σ수준의 공정 내에서 불편일 때 ±3σ내 면적보다 편의일 때 ±3σ내 면적이 훨씬 줄어들기 때문인데, 범위를 6σ까지로 넓힌다면 눈으로 봐선 불편이든 편의든 거의 차이가 없다. 물론 '거의' 차이가 없는 것과 차이가 없는 것은 다르지만...

로딩 중...

공정수준을 어디에 맞추느냐는 상당히 중요한 문제인데 솔직히 6σ가 가능한 공정수준인지 의심스럽다. 말이 쉬워 불량률 3.4ppm이지 숫자만으론 그냥 0과 별 차이 없는 매우 작은 값으로 엄청난 노력이 없다면 거의 불가능한 수준으로 보기 때문이다. 그런데 6σ가 가능하다는 것은 작년 설 때 발생된 5천 원 신권 오류 사건을 보고 알았다.

  • "어~ 홀로그램 또 없네"... 인쇄 잘못된 5000원 신권 잇달아 발견 (연결 정보 손실)

사건의 발단이나 대책은 각자 확인 바라고 관심 있는 건 불량률이니... 1억 5천만 장이 시중에 유통되어서 3장의 불량 화폐가 발견됐다. 그리고 창고에 비축된 1517만 장에서 7장의 불량 화폐가 발견됐다. 그럼 총 1억6517만 장 중에서 10장의 불량 화폐가 나온 거다. 이를 가지고 불량률을 구해보면 1/16,517,000이다(단, 발견 안 된 불량 화폐는 없다고 가정한다).

이 숫자가 얼마나 작은 숫자인지 나부터도 감이 오지 않는데 6σ수준에서 불량률이 3.4ppm이고 7σ수준일 때 불량률은 0.019ppm이다. 그런데 화폐 불량률은 0.06ppm이다. 계산해 보니 6.8σ수준에서의 불량률과 근사하던데 이 정도면 불량이 발생됐다고 호들갑을 떨 게 아니라 그 불량 신권을 찾아냈다는 게 역으로 더 놀라울 정도다.

그에 반해 여론조사에서 익히 보아온 95% 신뢰수준은 약 1.96σ로 6σ에는 깜도 안 되는 수준이다. 신뢰수준을 6σ로 키운다면 제2종오류 또한 매우 커질 것이다.

아무튼 믿기지 않는 수준의 안 인간적인(?) 공정관리가 가능하다고 하니 놀라울 따름이다.

길동이는 열심히 뺑이 돌아라~~