2019년 프로야구 한국시리즈가 4대 0, 두산의 일방적 승리로 끝났다. 시리즈전에는 키움의 우세를 점친 전문가가 많았다. 시즌 득실점도 앞서고, 맞대결 성적도 9승 7패로 앞서고, SK와의 플레이오프에서 3전승하면서 키움의 기세가 올랐다는 게 근거였다. 우승 '확률' 키움 52%, 두산 48%라는 숫자도 나왔다. 두산이 1차전에 이긴 다음에는 숫자가 더 구체적이었다.
먼저 낙관론. "과거 35차례의 한국시리즈에서 1차전 승리팀이 26차례 우승했으니 1차전 승리팀 두산의 우승 '확률'이 74.3%다". 비관론도 있었다. "두산은 9차례 한국시리즈에 진출했지만, 1차전 이긴 해에는 단 한 차례 우승했으니 우승 '확률'은 11.1%다." 같은 팀 두산의 2019년 우승 '확률'은 왜 이렇게 서로 다를까?
간단히 말해 위의 숫자들은 확률이 아니며 기사는 '가짜' 뉴스다. 확률은 '충분한 크기의 표본'과 '동일한 조건'을 기본 전제로 한다. 35차례나 9차례는 확률을 논하기에는 '너무 작은 표본'이다. 다음 35차례든 9차례든 같은 팀이 아니고, 피아 모두 같은 감독이 아니고 같은 선수가 아니니 '조건이 다르다'. 올해도 마찬가지다. '①표본이 작고 ②조건이 다르니' 확률을 논할 수조차 없다.
요즈음 세이버메트릭스라 해서 통계적 기법을 도입해 저렴한 비용으로 좋은 성적을 거둔 사례가 국내에도 소개되고 있다. 시즌 중에는 경기 수가 워낙 많아 몇 년의 자료를 축적해 나름 예측력을 발휘할 수 있다. 그러나 포스트시즌은 다르다. 표본이 극히 적고, 거의 해마다 다른 감독, 다른 선수로 구성된 다른 팀들의 경기가 진행된다. 모두 같아도 타순과 투수 등판 순서에 따라 결과는 달라진다. 무지한 기자와 캐스터, 해설가 때문에 청소년들이 잘못된 확률 개념을 갖게 될까 걱정스럽다. 확률 운운하지 말고 숫자만 재미로 즐겨라. 하나 더, 스포츠는 숫자만으로 예측할 수 없는 신비의 영역이다.
댓글 많은 뉴스
[단독] 경주에 근무했던 일부 기관장들 경주신라CC에서 부킹·그린피 '특혜 라운딩'
최재해 감사원장 탄핵소추 전원일치 기각…즉시 업무 복귀
"TK신공항, 전북 전주에 밀렸다"…국토위 파행, 여야 대치에 '영호남' 소환
헌재, 감사원장·검사 탄핵 '전원일치' 기각…尹 사건 가늠자 될까
계명대에서도 울려펴진 '탄핵 반대' 목소리…"국가 존립 위기 맞았다"