Post

축구에서도 통계, 데이터 분석이 주목 받고 있다

축구에서도 통계, 데이터 분석이 주목 받고 있다

개인적으로 해외 축구에 관심이 많아서 이런저런 유튜브 채널들도 좀 구독을 하는 편이다. 그 중 〈 독서축구〉라는 채널이 있는데, 주로 “독일”과 “스페인” 축구를 다루기 때문에 “독 & 서”이고, 축구를 읽어준다는 의미도 있다.

여기서 축구 통계에 대해 한 번 다룬 적이 있다.

참고로 이 채널을 운영하는 골닷컴 김현민 기자는 내가 전부터 좋아하던 분이다. 항상 긍정적인 표정으로 설명도 침착하게 잘 해주시고, 소개하거나 직접 분석하는 내용도 꽤 전문적이기 때문이다.

아무튼 위 영상에서 축구 통계, 데이터 분석을 담당한 분이 직접 함께 나와서 내용을 소개했는데, 내용이 흥미로워서 한 번 정리해봤다.

축구에서 통계, 데이터 분석이 주목 받게 된 과정

사실 축구에서 본격적으로 통계를 활용해 의미 있는 분석을 한지는 그리 오래 되지 않았다.

참고로  야구에서는 머니볼, 세이버매트릭스(Sabermetrics) 개념 이 훨씬 빨리 자리를 잡았는데, 이는 야구라는 스포츠의 속성이 애초에 그렇기 때문일 거다. 플레이를 끊어서 독립시행으로 이뤄지는, 마치 통제된 실험실에 가깝기 때문이다.

반면  축구는 멈추지 않고 상황이 동시다발적으로 발생하는 스포츠 이다보니 제대로 수집할 수 있는 데이터가 없었다. 그나마 골, 파울, 옐로/레드 카드, 교체 및 출전시간 정도는 쉽게 집계할 수 있지만, 다른 지표들은 그 기준을 설정하는 게 너무 어렵기 때문이다. 예를 들면 어시스트도 시대에 따라 리그마다 기준이 다르고, 포지션이라는 것도 명확하게 정해진 게 아닌 데다가 슛 개수 셀 때도 이게 슛인지 패스인지 모를 것들도 있고, 슛을 하더라도 발로 한 건지 종아리로 한 건지, 머리로 한 건지 어깨로 한 건지… 아무튼 모든 게 다 불명확하다.

그러다가 2003년 즈음부터  옵타(Opta) 라는 곳을 필두로 여러 기관에서 좀 더 전문적이고 세분화된 축구 통계 지표들을 공개하기 시작한다. 어시스트와 키패스를 합쳐 슈팅으로 연결된 패스라는 의미의  CC(chance created) , 명백한 찬스를 뜻하는  CCC(clear-cut chances) 와 같은 지표가 대표적이다. 그리고 이런 식으로 재가공된 주요 통계 지표들이 계속 세미나나 언론에 공개되면서 축구계 전반에서 이와 관련한 관심이 높아졌다. 이 시기에 잉글랜드 몇몇 클럽에서는 새롭게 등장한 지표들을 가지고 특정 선수들을 영입할 때 활용했다고도 한다.

요즘 주목 받는 통계 지표들

최근에는  xG(expected goals) 라는 개념이 인기인 것 같다. 우리말로 하면 기대득점. 이 xG는 도움의 유형 (땅볼인지, 공중볼인지), 슈팅할 때의 거리와 각도, 슈팅을 한 부위(발로 했는지 헤더로 했는지), 어떤 상황이었는지(프리킥이었는지, 오픈 플레이인지, 역습인지, 빅 찬스였는지), 슈팅할 때 경로에 있는 수비 숫자 등 다양한 요인들을 가지고 계산한다. (사실 통계를 제공하는 곳마다 이 xG를 계산하는 기준이 조금씩 다르다는 게 함정이다. 어쨌든 본인들만의 노하우를 가지고 이렇게 데이터를 재가공해서 분석하는 게 요즘 추세니까.)

xG에 대해 더 자세히 알고 싶다면 다음 영상을 참고하자.

xG 외에도  패킹(packing) ,  임팩트(impect)  개념도 주목을 받고 있는 것 같다. 상대를 얼마나 통과했느냐에 대한 지표인데, 결국 축구라는 경기에서 골을 넣으려면 수비를 뚫고 전진을 해야 하기 때문이다. 실제로 브라질 월드컵 경기들에서 이 지표를 가지고 사후 분석을 해본 결과, 승부 예측 정답률이 92% 정도 나왔다고 한다. 어마어마한 수치다.

아, 그리고 요즘 당연히  패스맵 이나  히트맵  같은 것도 많이 사용된다. 공의 움직임 뿐만 아니라 선수들의 위치나 뛴 거리 같은 것도 쉽게 수집해서 시각화 할 수 있으니까.

축구 통계 제공 사이트

축구계에서도 데이터를 가공해서 분석하는 곳이 정말 많아졌다. 대표적인 해외 사이트 몇개만 가져와봤다.

옵타나 스탯츠밤 같은 곳은 아예 전문적인 솔루션 형태로 비싸게 제공하는 것 같고, 와이스카웃은 API 형태로 제공하는 거 같긴 한데 역시나 유료다. 그나마 언더스탯이나 후스코어드 같은 곳은 무료로 몇 가지 지표들을 검색해서 확인할 수 있다.

축구 데이터 시각화 예시

위에서 소개한 데이터들은 결국 숫자이기 때문에, 이 숫자를 사람들이 보고 이해할 수 있는 형태로 시각화하는 것도 당연히 중요한 영역이다.

포스팅에서 소개하고 싶은 데이터 시각화 예시는 @DatoBHJ 라는 분의 트위터에서 가져왔다. (위에서 링크한 유튜브 영상에 출연한 분이다.) 개인 트위터 계정에 취미로 축구 데이터를 시각화해서 업로드 해왔는데, 이게 대외적으로(?) 인정을 받아서 언론사에서 기사나 잡지를 낼 때 같이 소개되기도 할 정도. 이제 외주 작업도 좀 하시는 것 같긴 하다.

아무튼 인상 깊어서 대표적인 사례 몇 가지만 가져와봤다.

축구 데이터 시각화 예시

홀란드 도르트문트 이적 후 스탯. 90분당 xG가 거의 1개다. 미쳤다.

축구 데이터 시각화 예시

오른발/왼발 사용 비율을 시각화 한 게 재밌다. 데브라이너 히트맵 보면 하프 스페이스가 눈에 딱 띈다.

축구 데이터 시각화 예시

스페인 라리가 클럽들의 스타일을 라리가 로고를 가지고 표현한 것도 재밌다.

데이터 시각화 분야에는 정말 숨은 고수들이 많은 것 같다.

This post is licensed under CC BY 4.0 by the author.