TRABAJO FIN DE MÁSTER MÁSTER EN BIG DATA DEPORTIVO · 17 R. C. Celta de Vigo 26 27 -1 18 R. C. D....
Transcript of TRABAJO FIN DE MÁSTER MÁSTER EN BIG DATA DEPORTIVO · 17 R. C. Celta de Vigo 26 27 -1 18 R. C. D....
1
TRABAJO FIN DE MÁSTER
MÁSTER EN BIG DATA DEPORTIVO
……………………………………………………………………
ANÁLISIS DE LA LIGA SANTANDER
Pablo Sanzol García
DIRECTOR
David Fombella
Pamplona
27 de marzo de 2020
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
2
Agradecimientos
A todo el profesorado del Big Data International Campus que compone el Máster en
Big Data Deportiva y a todo el personal administrativo y de captación que ha estado,
día a día, por y para nosotros.
A todos los ponentes de las MásterClass de La Liga, Telefónica, Driblab, Marca, Opta
Sports, Catapult Sports, IBM Global Markets, ERIC Sports, Nagi Smartpool and
NBN23, Nac Sports, SaS Analyst, Objetivo Analista, Oliver, Analítica Sports, Arsenal y
Club América de México, entre otros muchos.
A todos mis compañeros por el desarrollo de las actividades colaborativas y las largas
lecciones de aprendizaje.
A Miguel Ángel del Barrio y David R. Sáez Ávila por haber estado siempre
disponible, a Francisco Oviedo por su cercanía y a David Fombella por su atención.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
3
Índice
I. Introducción.
II. Contexto y marco situacional.
III. Análisis de las relaciones entre las variantes de La Liga Santander.
1. Análisis de la finalización entre los equipos.
1.1. Relación existente entre los goles y los goles esperados.
1.2. Relación existente entre los tiros y el porcentaje de tiros a puerta.
1.3. Relación existente entre los goles y las oportunidades.
2. Análisis de la progresión en el juego entre los equipos.
2.1. Relación de las oportunidades y el porcentaje de posesión de balón.
2.2. Relación existente entre pases cortos y pases largos.
2.3. Cantidad de ataques en función de los pasillos.
2.4. Cantidad de entradas en campo rival, último tercio y área rival.
2.5. Estudio de la posición media ofensiva.
3. Análisis de la fase defensiva entre los equipos.
3.1. Estudio de las recuperaciones totales y en campo rival.
3.2. Estudio de la proporción de acciones defensivas frente a pases del
rival, atendiendo a la zona.
3.3. Estudio de la distancia media de la línea defensiva.
3.4. Estudio de las pérdidas totales y en campo propio.
IV. Conclusiones.
V. Abreviaturas.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
4
I. Introducción.
No solo hay que hablar del juego y del balón, sino también de personas, que al fin y al
cabo, son las que nutren de sentido, diversidad y emoción al fútbol. La vitalidad de La
Liga Santander se debe a múltiples factores que no deben ceñirse a un solo
desencadenante, como podría ser la cultura. Numerosos ingredientes sociales,
económicos, de pertenencia o de otra índole adornan de color el fútbol en España, como
lo han hecho a lo largo de la historia, potenciando y mejorando la estructura del marco
deportivo nacional.
Tal y como pronunció una vez el jugador del Real Zaragoza, en la temporada 1978-1979,
Vujadin Boskov, “fútbol es fútbol”. Un buen epitafio para establecer de manera simple,
rápida y comprensible qué y de qué trata el mencionado deporte. Nadie va a descubrir
nada nuevo y, si nos centramos en la teoría de la lógica interna del fútbol, tampoco parece
ser que diste mucho de la oración citada. No obstante, el fútbol es complejo. El fútbol es
un sentido continuo de relaciones entre múltiples variantes, algunas tangibles, pero otras
intangibles. Ahí está la cuestión, la ingeniería de la imaginación y el sueño de pensar el
dónde puede estar ese espacio, ese instante o esa secuencia que haga a un equipo ganador.
El estudio de la complejidad consiste, entre otras cosas, en el estudio de sistemas
complejos como el fútbol. Perfectamente, se podría definir como un sistema formado por
componentes o partes interconectadas o interdependientes, a partir de las cuales emerge
un comportamiento colectivo con propiedades distintas a las que tiene cada uno de sus
componentes por separado1. En otras palabras, de una serie de interacciones surgirán
comportamientos de relación y oposición con respecto a espacios, tiempos, alturas,
distancias, amplitudes, profundidades y fases del juego, entre otras. Todo ello, nos
proporcionará una información muy valiosa y susceptible de ser analizada.
Queda claro que, si existen relaciones con compañeros, adversarios y balón, dentro de
cada una de las mismas existe una temática diferente. El fútbol es tan rico en sí mismo
porque no tiene fin. Se mire por donde se mire o se estire por donde se estire, el análisis
es tan relevante como interminable. La incertidumbre del juego invita a su observación y
a la interpretación de los datos que segrega. Dicha razón es la que motiva el presente
trabajo, el análisis de relaciones entre diferentes variantes y el anhelo de unión entre
1 FERNÁNDEZ, M. El entrenamiento emergente, 2017
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
5
distintos momentos del juego, estableciendo una comparativa interesante entre los
diferentes equipos de La Liga Santander.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
6
II. Contexto y marco situacional
Antes de comenzar a establecer cualquier relación entre variables y posibles comparativas
entre los distintos equipos y jugadores de La Liga Santander, cabe centrarse en el entorno
que envuelve a la competición.
La Liga Santander está compuesta por veinte equipos, de los cuales, por norma general,
los cuatro primeros se clasifican para jugar la UEFA Champions League, el quinto y el
sexto consiguen acceder a la UEFA Europa League y los tres últimos descienden a La
Liga Smartbank. En el caso de la categoría de plata del fútbol español, los dos primeros
ascienden directos, los cuatro siguientes disputan la promoción de ascenso y los cuatro
últimos descienden a Segunda División B.
A continuación, se refleja la clasificación actual de La Liga Santander -hasta la jornada
27-, así como la puntuación esperada y la diferencia existente (TABLA 1).
TABLA 1. CLASIFICACIÓN ACTUAL DE LA LIGA SANTANDER
POSICIÓN EQUIPO PUNTUACIÓN PUNTUACIÓN
ESPERADA
DIFERENCIA
1 F. C. Barcelona 58 48 +10
2 Real Madrid C. F. 56 55 +1
3 Sevilla F. C. 47 44 +3
4 Real Sociedad 46 38 +8
5 Getafe C. F. 46 37 +9
6 Atlético de Madrid 45 45 0
7 Valencia C. F. 42 25 +17
8 Villarreal C. F. 38 35 +3
9 Granada C. F. 38 31 +7
10 Athletic Club 37 31 +6
11 C. A. Osasuna 34 36 -2
12 Real Betis Balompié 33 31 +2
13 Levante U. D. 33 19 +14
14 Deportivo Alavés 32 29 +3
15 Real Valladolid 29 23 +6
16 S. D. Eibar 27 30 -3
17 R. C. Celta de Vigo 26 27 -1
18 R. C. D. Mallorca 25 24 +1
19 C. D. Leganés 23 32 -9
20 R. C. D. Espanyol 20 26 -6
Fuente: elaboración propia
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
7
En relación con los datos obtenidos, la gran mayoría de los equipos de La Liga Santander
han obtenido una puntuación mayor de la esperada (GRÁFICOS 1 y 2). A simple vista,
destacan los casos del Levante U.D., Valencia C. F. y F. C. Barcelona:
- Levante U.D.: el equipo de Paco López tiene trece puntos más que los esperados.
Han encajado dieciséis goles menos que los esperados y han marcado tres goles
menos. La lógica descansa en los goles esperados a favor (x G) y en los goles
esperados en contra (x GA). Por ello, la diferencia positiva reside claramente en
los goles recibidos.
- Valencia C.F.: el equipo de Albert Celades acumula diecisiete puntos más que
los esperados, ya que ha encajado nueve goles menos que los esperados y ha
marcado tres más. Por lo tanto, los veinticinco puntos esperados residen en que de
haber recibido la diferencia de nueve goles y no haber marcado tres goles más, la
puntuación esperada sería la señalada.
- F. C. Barcelona: el equipo de Quique Setién sigue la misma línea de los
razonamientos anteriores (+10), pero desde el punto de vista de los goles
marcados. Su diferencia positiva de diez puntos reside en que ha marcado dieciséis
goles más que los esperados, ya que ha recibido los mismos goles que se esperaban
(31).
Ahora bien, hay cinco equipos con puntuaciones inferiores a las esperadas y dos de ellos
son el C. D. Leganés (-9) y el R. C. D. Espanyol (-6), ambos en descenso a La Liga
Smartbank. Dichos datos se explican de la misma forma que el supuesto del párrafo
anterior.
- R. C. D. Espanyol de Barcelona: el equipo de Abelardo ha encajado diez goles
más que los esperados y ha marcado siete goles menos, datos que justifican su
puntuación actual inferior. En este caso, se aprecia una afectación importante
tanto desde el punto de vista de los goles marcados como de los encajados.
- C. D. Leganés: el equipo de Javier Aguirre tiene nueve puntos menos que los
previstos. Ha encajado siete goles más y ha marcado nueve goles menos que los
esperados, tendencia muy similar a la del equipo perico.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
8
GRÁFICO 1. RELACIÓN GOLES ENCAJADOS – GOLES ENCAJADOS ESPERADOS
Fuente: elaboración propia a partir de datos de Instat
GRÁFICO 2. RELACIÓN GOLES – GOLES ESPERADOS
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
9
III. Análisis de las relaciones entre las variantes de La Liga Santander.
El análisis realizado tiene por objeto de estudio las relaciones entre las diferentes variantes
consideradas relevantes para valorar los paralelismos y las distancias existentes entre los
equipos de La Liga Santander. En el seno de este análisis radican los diversos modelos
de juego de cada equipo, así como el perfil distinto de los jugadores que pertenecen a los
mismos.
El perfil del jugador es el que determina, más que otro aspecto, el estilo de juego y los
fundamentos del juego que se desempeñan en el mismo. El sistema de juego es su forma
de ordenarlo en el campo y el modelo de juego el recipiente de todo lo anterior. Son
numerosas y casi infinitas las referencias encontradas a la hora de definir un sistema de
juego, pero en todas ellas reside una relación óptima con los demás elementos que
componen el modelo de juego. Como afirma Christian Lovrincevich, entrenador
argentino de fútbol profesional, “la organización táctica estructural de un equipo de fútbol
viene determinada por una dimensión estática y una dimensión dinámica. Por dimensión
estática se entiende al sistema de juego que representa el modo de situarse los jugadores
sobre el terreno de juego. Esta posición de inicio fundamental restablece el orden y los
equilibrios en varias zonas del campo, y sirve como punto referencial y de partida para
los desplazamientos relativos de los jugadores y para la coordinación de las acciones
individuales y colectivas. Por dimensión dinámica se entiende a las diferentes tareas y
misiones tácticas distribuidas entre los jugadores que componen el equipo”. Otros
autores, como A. Casanadi, H. Tassara, L. Teodorescu, J. Fernández y J. M. Yagüe,
persisten en la idea de que la elección del sistema de juego depende de las características
de los jugadores y que se ha de permitir la creatividad para dar respuesta a cada una de
las situaciones del juego, dando lugar a cambios de posición y roles cambiantes. En
conclusión, en todas las definiciones señaladas, se contempla la figura del jugador
inteligente capaz de interpretar y de resolver los problemas dinámicos e imprevisibles de
los diferentes momentos del juego que se dan en un mismo partido de fútbol. Fruto de esa
constante unión, no se separarán a lo largo del análisis los diferentes guiones específicos
de cada apartado.
Las relaciones que surgen entre los diferentes parámetros que se analizan abren un
importante abanico de conocimiento. Por ello, a continuación, se van a sincronizar y
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
10
valorar distintos eventos y aspectos del juego para realizar una comparativa de los equipos
de La Liga Santander, atendiendo como base a su modelo de juego.
1. Análisis de la finalización entre los equipos.
La finalización está directamente relacionada con los goles y los tiros a puerta. Estos dos
parámetros son relevantes para el análisis de la capacidad finalizadora de los equipos de
La Liga Santander. Dicho análisis tiene por objeto establecer las relaciones
correspondientes con los goles esperados y los tiros totales (GRÁFICOS 3-5).
GRÁFICO 3. RELACIÓN GOLES – GOLES ESPERADOS ENTRE EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
En el gráfico anterior queda patente que los equipos de La Liga marcan menos goles de
los esperados, en su cómputo general. Solamente son cinco los equipos que han marcado
más goles de los previstos: F. C. Barcelona (+16), Granada C. F. (+2), Valencia C. F.
(+3), Getafe C. F. (+4) y Real Sociedad (+3). Entre los mencionados equipos, destaca el
equipo de Quique Setién con una diferencia positiva de dieciséis goles a favor, ya que los
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
11
cuatro equipos restantes no superan la diferencia de cuatro goles a favor. Por otro lado,
C. D. Leganés (-9), Atlético de Madrid (-8), R. C. D. Espanyol de Barcelona (-7), Celta
de Vigo (-6), S. D. Eibar (-6) y el R. C. D. Mallorca (-6) destacan dentro del grupo amplio
de equipos que han marcado menos goles que los esperados.
Se considera reseñable acudir a los datos individuales por equipo para justificar,
brevemente, las conclusiones señaladas (GRÁFICO 4). Para el diseño del gráfico se han
seleccionado, únicamente, los centrocampistas y delanteros de los veinte equipos de La
Liga con más de 1000 minutos disputados. La diferencia positiva del F. C. Barcelona
descansa en que la gran mayoría de sus jugadores ofensivos han marcado más goles que
los esperados:
- Arturo Vidal (990’): 6 > 2.4
- Arthur Melo: 3 > 0.89
- Leo Messi: 19 > 15
- Luis Suárez: 11 > 8
- Antoine Griezmann: 8 > 6
Asimismo, aunque en menor medida, ya que las diferencias positivas son bastante
inferiores en el Granada C. F., el Valencia C. F., el Getafe C. F. y en la Real Sociedad
hay jugadores que han marcado más goles que los esperados. A continuación, se adjuntan
algunos jugadores como ejemplo:
- Darwin Machis (GRA): 6 > 3.9
- Carlos Fernández (GRA): 5 > 3.6
- Maxi Gómez (VAL): 9 > 5.1
- Dani Parejo (VAL): 8 > 5.2
- Ángel Rodríguez (GET): 10 > 5.8
- Jaime Mata (GET): 8 > 7
- Portu (RSO): 7 > 4.9
- Martin Odegaard (RSO): 4 > 3.1
Por otro lado, destacan los datos individuales de los jugadores de Atlético de Madrid, C .
D. Leganés, R. C. D. Espanyol de Barcelona, R . C. D. Mallorca, Celta de Vigo y S. D.
Eibar, donde resaltan Álvaro Morata (ATM), Guido Carrillo (LEG) o Jonathan Calleri
(ESP) con 4 goles menos marcados.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
12
GRÁFICO 4. RELACIÓN GOLES – GOLES ESPERADOS ENTRE JUGADORES
Fuente: elaboración propia a partir de datos de Instat
GRÁFICO 5. RELACIÓN TIROS TOTALES – % TIROS A PUERTA ENTRE EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
13
En el gráfico número 5, se aprecia un grupo mayoritario de equipos de La Liga que están
por debajo del 40% con respecto a los tiros a puerta realizados – el R. C. Celta de Vigo
se encuentra en la frontera-. Existe una importante distribución en cuanto al porcentaje
de tiros a puerta – desde el 34% del Granada C. F. al 51% del F. C. Barcelona-, pero los
tiros totales de los diferentes equipos giran en torno a la media de 293 disparos.
Son solamente seis equipos los que se alejan del grupo mayoritario señalado, el Real
Madrid, el F. C. Barcelona, el C. D. Leganés, el Valencia C. F. y el Deportivo Alavés. La
razón objetiva es que son los cinco equipos con mayor porcentaje de tiros a puerta de La
Liga, a pesar de que los dos últimos sean los que menos tiros totales han ejecutado. En
cuanto a los tiros totales se encuentran el Real Madrid y el F. C. Barcelona liderando y
con un porcentaje de tiros a puerta óptimo. Sin embargo, tras ellos, el Villarreal C. F., el
C. A. Osasuna y el Sevilla F. C. completan el top cinco de tiros totales, pero carecen de
un porcentaje alto en tiros a puerta con un 38%, 35% y 39%, respectivamente.
En sintonía con las conclusiones obtenidas, se considera importante analizar a nivel
individual a F. C. Barcelona y Valencia C. F., ya que son los dos equipos con mayor
porcentaje de tiros a puerta realizados, superando varios jugadores, ampliamente, el 51%
máximo:
- F. C. Barcelona: Arthur Melo (63%), Arturo Vidal (62%), Luis Suárez (60%),
Sergio Busquets (57%), Gerard Piqué (56%) o Messi (55%).
- Valencia C. F.: Ezequiel Garay (80%), Maxi Gómez (62%), Gabriel Paulista
(60%), Kevin Gameiro (53%) o Dani Parejo (52%). A nivel individual, tras las
relaciones establecidas, se observa que Maxi Gómez está rindiendo a un nivel
superior al resto de atacantes del equipo de Albert Celades -se excluye a Manu
Vallejo al haber disputado solamente 611 minutos-, ya que ha marcado 4 goles
más de los esperados, es el máximo goleador y tiene un 62% de tiros a puerta
realizados (GRÁFICO 6).
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
14
GRÁFICO 6. RELACIÓN GOLES – % TIROS A PUERTA DE DELANTEROS DEL VALENCIA C. F.
Fuente: elaboración propia a partir de datos de Instat
En el gráfico adjunto, a posteriori, se analiza la relación existente entre las oportunidades
generadas y los goles conseguidos. En dicho análisis se advierte un grupo de equipos
entre las 100 y las 140 oportunidades totales con grandes diferencias entre los mismos.
El Valencia C. F., el C. A. Osasuna, el Getafe C. F., el Levante U. D., el Celta de Vigo y
el R. C. D. Mallorca acumulan un total de entre 124 y 120 oportunidades, pero sus cifras
goleadoras son bien diferentes con una diferencia de entre 38 y 22 goles marcados. Por
lo tanto, existen evidencias de que no todos los equipos de La Liga aprovechan de igual
forma sus ocasiones.
Por otra parte, el F. C. Barcelona y el Granada C. F. destacan sobre el resto por razones
antagónicas. El equipo blaugrana es el equipo que más goles ha marcado (63) y el que
más oportunidades acumula (212), pero su porcentaje de éxito se reduce al 30%. Sin
embargo, el equipo de Diego Martínez es el equipo que menos oportunidades crea, pero
el que más rédito obtiene de las mismas con un 39%. La Real Sociedad y el Valencia C.
F. le siguen con un 32% y un 31%, respectivamente.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
15
GRÁFICO 7. RELACIÓN GOLES – OPORTUNIDADES ENTRE EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
Finalmente, es preciso acudir al extracto de datos individuales de la relación estudiada
con el fin de justificar los datos genéricos (GRÁFICO 8). En el siguiente gráfico se recoge
la relación entre las oportunidades y el porcentaje de ocasiones con éxito, incluyendo a
todos los jugadores con más de 3 goles de La Liga. El Granada C. F., como ya se ha
señalado, es el equipo con mayor porcentaje de oportunidades satisfactorias y,
principalmente, se debe a las actuaciones de sus jugadores.
Darwin Machis (GRA), junto a Moi Gómez (VILL) y Arturo Vidal (FCB), es uno de los
jugadores que menos ocasiones atesora, pero que más rendimiento consigue con un 64%.
Asimismo, Carlos Fernández, delantero centro o media punta del equipo nazarí,
aprovecha el 45% de las ocasiones, por detrás de jugadores como Joaquín (47%), Rubén
Rochina (50%), Santi Cazorla (57%) y Dani Parejo (60%). En caso de exclusión del filtro
de goles a favor del estudio, los centrales del Granada C. F., Domigos Duarte y Germán,
obtienen éxito en el 67% y el 50% de las oportunidades, y el centrocampista Yangel
Herrera consigue un buen resultado en la mitad de las oportunidades.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
16
GRÁFICO 8. RELACIÓN OPORTUNIDADES - % OPORTUNIDADES MATERIALIZADAS ENTRE JUGADORES
Fuente: elaboración propia a partir de datos de Instat
2. Análisis de la progresión en el juego.
A modo de establecer una conexión con el análisis de la finalización, comenzaremos
valorando las relaciones existentes de las ocasiones generadas con el porcentaje de
posesión de los equipos de La Liga (GRÁFICO 9). Este indicador medirá cómo es la
tenencia del balón en cada equipo.
El F. C. Barcelona (63%), el Sevilla F. C. (57%), la Real Sociedad (56%), el Real Madrid
(56%), el Real Betis Balompié (53%), el Villarreal C. F. (52%) y el Real Celta de Vigo
(51%) son los siete equipos que superan el 50% de posesión de balón de La Liga. El resto
de equipo se encuentran por debajo de dicha cifra. Asimismo, el número de oportunidades
que ocasionan es alto, en comparación con el resto de equipos, ya que todos ellos, salvo
el Real Celta de Vigo se encuentran entre los siete primeros equipos de esta clasificación.
No es casualidad que todos los equipos citados apuesten en su modelo de juego por tener
el balón y, a partir de él, mirar hacia portería contraria. El F. C. Barcelona es el equipo
que más posesión acumula y que más ocasiones realiza, a pesar de tener una eficacia de
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
17
conversión de dichas oportunidades más bajo a otros equipos, como ya se ha señalado en
el análisis de la finalización.
Ahora bien, el Atlético de Madrid se coloca cuarto en ocasiones generadas, a pesar de
tener un 47% de posesión de balón, ya que su modelo de juego es antagónico al de los
equipos anteriormente mencionados. El equipo de Diego Pablo Simeone no se caracteriza
por el desarrollo del juego posicional y no necesita mover de lado a lado para crear un
alto número de ocasiones. Otro de los equipos que resalta es el C. A. Osasuna. El equipo
de Jagoba Arrasate, más afín al juego directo y presionante en bloque alto para recuperar
cerca de portería rival, es el octavo de La Liga que más oportunidades crea, aunque con
una posesión media del 49%.
GRÁFICO 9. RELACIÓN OPORTUNIDADES - % POSESIÓN DE BALÓN ENTRE EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
Por otro lado, Real Madrid C. F., F. C. Barcelona, Villarreal C. F., C. A. Osasuna, Sevilla
F. C., Real Betis Balompié, Real Sociedad y Atlético de Madrid son los ochos equipos de
La Liga que superan los 300 disparos totales, a pesar de tener un porcentaje de tiros a
puerta inferior al 39%, a excepción del equipo de Quique Setién con un 51%. Entonces,
no es casualidad que todos ellos sean los que más oportunidades de gol generen.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
18
En virtud de las conclusiones adoptadas, se ha realizado una selección de los jugadores
con más oportunidades de La Liga, aplicando el filtro de más de 20 oportunidades
generadas (GRÁFICO 10). Como se aprecia en el gráfico de barras horizontales adjunto,
la inmensa mayoría de los jugadores que superan las 20 ocasiones de gol coinciden con
los equipos que superan las 120 oportunidades, como se aprecia en el gráfico 9. Destacan
sobre los demás Leo Messi (FCB), Karim Benzema (RMA), Álvaro Morata (ATM),
Gerard Moreno (VILL), Iago Aspas (CEL), Luis Suárez (FCB), Ante Budimir (MALL),
Roger Martí (LEV) y Jaime Mata (GET).
GRÁFICO 10. JUGADORES DE LA LIGA CON MÁS DE VEINTE OPORTUNIDADES
Fuente: elaboración propia a partir de datos de Instat
Seguidamente, tras valorar cómo utilizan la posesión de balón los diferentes equipos de
La Liga y su traslado a los tiros y oportunidades generadas, es importante valorar la
calidad del dominio de balón. Para ello, se estudia la relación existente entre los pases y
el porcentaje de acierto en los pases, pero no se extraen conclusiones significativas porque
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
19
el porcentaje medio es realmente similar. Ahora bien, se acude a los registros de pases
cortos y pases largos (GRÁFICO 11) para encontrar una posible respuesta que razone los
porcentajes de acierto inferiores al 80%.
GRÁFICO 11. RELACIÓN DE PASES CORTOS – PASES LARGOS ENTRE EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
El Getafe C. F. tiene el menor porcentaje de acierto en el pase (71%), que está
directamente relacionado con que es el equipo que menos pases cortos ejecuta por partido
(221) y el segundo que más pases largos envía (81). Asimismo, también hay una conexión
entre el 77% de acierto en el pase del C. A. Osasuna y en que es el sexto equipo que
menos pases cortos lleva a cabo por partido (304) y el tercero que más insiste en el pase
largo (73). Finalmente, por justificar aún más dichas relaciones, es preciso citar el caso
de la S. D. Eibar con un 78% de acierto en el pase, siendo el máximo pasador en largo
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
20
por partido (83) y el quinto que menos apuesta por pasar en corto (290). Es reseñable que
los tres equipos citados se aproximan, en exceso, en sus modelos de juego, apostando por
asumir los mínimos riesgos en campo propio y cediendo protagonismo a la presión
avanzada para robar alto. Por este motivo, son los equipos que menos pases cortos diseñan
y que más emplean el juego directo para ser fuertes en las segundas jugadas.
En cuanto a la utilización de los tres pasillos, en caso de dividir el campo en dos pasillos
exteriores y un pasillo central, no existen diferencias significativas entre los equipos de
La Liga, pero sí hay determinadas escuadras que sobresalen por encima de las demás
(GRÁFICO 12). En La Liga, existe un predominio claro a atacar por los pasillos
exteriores, ya que la media por pasillo lateral izquierdo es de 734 y la correspondiente al
pasillo lateral derecho es de 750. Estas cifras están, considerablemente, por encima de la
media referente al pasillo central de 527 ataques.
- Pasillo exterior izquierdo: destaca el C. A. Osasuna con 910 ataques, por delante
de la S. D. Eibar con 851 o el Getafe C. F. con 818.
- Pasillo exterior derecho: destacan S. D. Eibar y el Sevilla F. C. con 941 y 930
ataques, respectivamente, superando los 840 de Athletic Club.
- Pasillo central: predomina el F. C. Barcelona con 727, directamente relacionado
con su juego de posición.
GRÁFICO 12. NÚMERO DE ATAQUES, ATENDIENDO A LOS PASILLOS DE JUEGO
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
21
El C. A. Osasuna predomina en el número de ataques realizados por el pasillo lateral
izquierdo debido a las incorporaciones de Pervis Estupiñán desde su posición de lateral y
la constante asociación con Rubén García y Chimy Ávila -antes de lesión-, así como las
llegadas desde segunda línea de Darko Brasanac. Existe un claro predominio del juego
por fuera. El lateral izquierdo del equipo de Jagoba Arrasate es el segundo jugador que
más centros realiza de La Liga con 122 y el máximo pasador del equipo y decimoquinto
de La Liga con 1439 pases (77% acierto).
El Sevilla F. C. acumula un importante número de ataques por el pasillo lateral derecho
debido a la influencia en el juego que tiene su lateral Jesús Navas y las rupturas de Lucas
Ocampos, Joan Jordán, Franco Vázquez o Suso hacia dicho sector. El juego interior del
Sevilla F. C. es clave para que, una vez que se filtre el pase interior desde un inicio de
juego lento que atraiga al rival, se pueda acelerar el ritmo y desplegar hacia fuera para
sorprender con la llegada de los laterales. Por ello, Ever Banega es el cuarto
centrocampista de La Liga que más pases realiza con 1683 y los registros de Fernando
con 1248 (90% acierto) y Joan Jordán con 1192 (88% acierto) pases no se quedan atrás.
Además, es el equipo que más centra de La Liga con 510, muy por encima de la media
de 365 centros. El lateral derecho del equipo de Julen Lopetegui es el máximo centrador
con 172 y máximo pasador de La Liga con 1869 pases (80% acierto).
La S. D. Eibar deposita su progresión en el juego en las subidas de los laterales y en la
profundidad de sus extremos. Existe una negación al juego por pasillo interior y no asume
riesgos en el inicio de juego. Por ello, su fase ofensiva nace tras recuperación en campo
rival o mediante un juego vertical por ambos pasillos exteriores. El equipo de José Luis
Mendilibar es el tercero que más centros realiza con un total de 461, muy cerca de los
486 del Real Madrid. En dicho apartado, destacan José Ángel (101), Pedro León (75),
Álvaro Tejero (52), Fabián Orellana (47), Pablo De Blasis (44) y Takashi Inui (35).
A continuación, se adjuntan los siguientes mapas de calor en los que se verifica la
influencia en el juego de los equipos citados:
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
22
• Sevilla F. C. - C. A. Osasuna (3-2)
Fuente: WhoScored
• C. A. Osasuna – S. D. Eibar (0-0)
Fuente: WhoScored
• F. C. Barcelona – Sevilla F. C. (4-0)
Fuente: WhoScored
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
23
• S. D. Eibar – Real Sociedad (1-2)
Fuente: WhoScored
• S. D. Eibar – Real Betis Balompié (0-0)
Fuente: WhoScored
• Sevilla F. C. – Getafe F. C. (2-0)
Fuente: WhoScored
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
24
GRÁFICO 13. ENTRADAS A CAMPO RIVAL, ÚLTIMO TERCIO Y ÁREA DE LOS EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
En el gráfico 13 se recogen los datos del número de entradas de los equipos a campo rival,
último tercio y dentro de área rival. Asimismo, se ha querido realizar una comparativa
con el número de entradas en el área rival de la Premier League sin apreciar diferencias
importantes. Con dos jornadas más completadas, la media inglesa es de 447 entradas en
área rival, mientras que la media española se queda en 382.
La S. D. Eibar, el Getafe C. F., el Real Madrid, el C. A. Osasuna, el Sevilla F. C. y el
Athletic Club son los seis equipos de La Liga que más entradas realizan en campo rival,
siendo superiores a las 1700. La S. D. Eibar y el Getafe C. F. desempeñan un modelo de
juego similar, aunque con matices. En inicio de juego, no utilizan los pases “para llamar”
y las relaciones con cercanos y próximos son mínimas, ya que mitigan riesgos
innecesarios en campo propio. Por ello, son las máximos valedores de los pases largos y
entran dentro, como se ha señalado anteriormente, del ranking de seis equipos que menos
pases cortos ejecutan. Es más, utilizan su fase defensiva para atacar. Su presión en bloque
alto, tras invitación al rival para que inicie desde portero, es el principal signo de ambos.
Son equipos estrechos y con la línea defensiva adelantada posibilitando una activación
tras robo en campo rival alta. Concretamente, son los dos equipos en los que existe una
mayor distancia entre la línea defensiva y su propia portería, 40.8 y 40.3 metros,
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
25
respectivamente. De ahí, que sean los dos equipos con mayor eficacia en la presión tras
la Real Sociedad y C. A. Osasuna. Todas estas características de su modelo de juego
evidencian y justifican que sean dos de los seis equipos que más entradas en campo rival
acometen.
Para terminar de cerrar el presente análisis, es reseñable acudir a la posición media
ofensiva que tienen los equipos de La Liga con respecto a su propia portería. De esta
manera se puede justificar con mejor criterio el número de entradas y la influencia en el
juego en campo rival (GRÁFICO 14).
La S. D. Eibar y el Getafe C. F. son los dos equipos que presiden esta clasificación, ya
que, como ya se ha explicado anteriormente, utilizan su fase defensiva para recuperar alto
y finalizar en el menor tiempo posible, acumulando entre seis y siete jugadores en campo
rival. Muy cerca de ambos, se encuentran el Real Madrid y el F. C. Barcelona, dos equipos
que se encuentran cómodos con balón en campo rival y que se posicionan en bloque
medio-alto con las líneas juntas, sin balón, para ejercer una presión tras pérdida
importante y reiniciar el juego, más vertical y profundo en el equipo de Zinedine Zidane
y más posicional en el equipo de Quique Setién con una posición media ofensiva de 46.6
y 46.3 metros, respectivamente.
Tras dichos equipos, la Real Sociedad pertenece al siguiente grupo con una posición
media ofensiva con respecto a su propia portería de 45.1 metros de distancia. Es uno de
los equipos de La Liga que más hombres acumula por delante del balón y que incide en
progresar desde Álex Remiro, su portero, hasta sus atacantes. Igor Zubeldia, Mikel
Merino y Martin Odegaard son fundamentales en el desarrollo de la fase de progresión
en el juego, ya que son los máximos pasadores del equipo de Imanol Alguacil, superando
los 1293 pases y con un 90%, 81% y 83% de acierto en el pase. Asimismo, Martin
Odegaard es el que más pases clave realiza de su equipo y el segundo de La Liga, por
detrás de Leo Messi, con 97 pases.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
26
GRÁFICO 14. POSICIÓN MEDIA OFENSIVA DE LOS EQUIPOS DE LA LIGA
Fuente: elaboración propia a partir de datos de Instat
3. Análisis de la fase defensiva
En el presente análisis se va a comenzar estudiando el número de balones que recupera
cada equipo en campo rival con la finalidad de establecer una relación con la posición
media ofensiva de los equipos de La Liga. En el fútbol todas las fases están
interrelacionadas y no se entiende la anterior sin la posterior, y viceversa.
Como bien se observa en el gráfico 15, la S. D. Eibar es el equipo que más balones
recupera en campo rival (339), por delante de Real Madrid y Getafe C. F., que también
superan los 300 balones recuperados en campo contrario. La posibilidad de recuperar un
número alto de balones cerca de portería rival viene motivado por una posición media
ofensiva alta. Los datos así lo reflejan, ya que los tres equipos mencionados son los que
ocupan una posición media ofensiva más alejada con respecto a su portería, ya que tras
pérdida, con las líneas juntas y avanzadas, existe una mejor preparación para recuperar.
Tampoco es casualidad que F. C. Barcelona, C. A. Osasuna y Real Sociedad atesoren un
importante número de recuperaciones, porque se encuentran a una distancia igual o
superior a los 44,9 metros con respecto a su propia portería. Para entender de una manera
más concisa dichos datos es clave atender al perfil de jugador que reside en cada uno de
los equipos señalados. Sin ir más lejos, el jugador que más balones recupera de la
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
27
categoría en campo rival es Casemiro con 73, muy por encima de los centrocampistas
defensivos Sergio Busquets y Dani García con 50 y 47, respectivamente (GRÁFICO 16).
GRÁFICO 15. NÚMERO DE RECUPERACIONES EN CAMPO RIVAL DE LOS EQUIPOS DE LA LIGA
Fuente: elaboración propia a partir de datos de Instat
Por lo tanto, del siguiente gráfico de barras horizontales -se incluyen los jugadores con
más de 30 recuperaciones- se puede extraer la conclusión de que la inmensa mayoría de
los máximos recuperadores de La Liga son de un perfil común, centrocampistas
defensivos y ofensivos, salvo alguna excepción como las de Pervis Estupiñán y Jesús
Navas, laterales acostumbrados a incorporarse y vivir en campo rival, con 32 y 29
recuperaciones.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
28
GRÁFICO 16. NÚMERO DE RECUPERACIONES EN CAMPO RIVAL DE LOS JUGADORES DE LA LIGA
Fuente: elaboración propia a partir de datos de Instat
Dicho denominador común evidencia, de nuevo, que los equipos que más roban son los
que tienen las líneas más avanzadas y dispuestas a recuperar tras pérdida. En el caso de
la S. D. Eibar hay hasta cuatro jugadores con más de 30 recuperaciones en campo rival:
Pape Diop (37), Gonzalo Escalante (36), Edu Expósito (36) y José Ángel (35). Asimismo,
en el Getafe C. F. su doble pivote formado por Mauro Arambarri y Nemanja Maksimovic
acumula hasta 77 recuperaciones totales en campo contrario, sin olvidar las 33 de Marc
Cucurella, habituado a jugar en la posición de extremo en el 1-4-4-2 de Pepe Bordalás.
Otro dato revelador es que la S. D. Eibar es el equipo que más balones recupera de La
Liga y que más balones recupera en campo rival. Dicho factor no se cumple en todos los
equipos, donde el Sevilla F. C., el R . C. D. Espanyol y el Athletic Club son el tercer,
cuarto y sexto equipo, respectivamente, que más balones totales recuperan, pero con
índices bajos en campo rival. Concretamente, el R. C. D. Espanyol de sus 1471
recuperaciones totales, solamente son 253 en campo rival, es decir, el 17%. No obstante,
otros equipos como el F. C. Barcelona recuperan pocos balones en comparación a los
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
29
demás equipos de La Liga (1269), pero en campo rival consiguen un número muy superior
que al resto, 287 recuperaciones, es decir, el 23% (GRÁFICO 17).
GRÁFICO 17. RELACIÓN RECUPERACIONES – RECUPERACIONES EN CAMPO RIVAL DE LOS EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
Para concretar más en el análisis, se adjuntan los mapas del Getafe C. F., de la S. D. Eibar,
del F. C. Barcelona, del Levante U. D., del Valencia C. F. y del Real Betis Balompié en
los que se aprecia la proporción de acciones defensivas frente a los pases del rival,
atendiendo a las zonas. En los mismos, el color rojo es indicador de mayor promedio de
acciones defensivas. Se incluyen los tres últimos equipos en este análisis específico con
la finalidad de justificar su posición en el gráfico anterior de una forma más visual.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
30
MAPAS. PROPORCIÓN DE ACCIONES DEFENSIVAS FRENTE A PASES DEL RIVAL
Fuente: StatsBomb
Ahora bien, es preciso completar dicho análisis atendiendo a la distancia existente entre
la línea defensiva y la portería propia con la finalidad de observar el posicionamiento
medio de la línea defensiva y cuantos metros a la espalda dejan libres los equipos de La
Liga. Este factor está directamente relacionado con la posición media ofensiva analizada
en el epígrafe anterior, aunque más completa, y la ejecución de su fase defensiva
(GRÁFICO 18).
Nuevamente, al igual que en la posición ofensiva media de los equipos, Getafe C. F., S.
D. Eibar, Real Madrid y F. C. Barcelona encabezan la clasificación, aunque la Real
Sociedad, también, se separa del grupo amplio de equipos con una distancia de la línea
defensiva con respecto a su propia portería igual o inferior a los 38 metros. Como ya se
ha explicado anteriormente, los cuatro equipos citados mantienen su línea defensiva
adelantada con diferentes finalidades afines a su modelo de juego.
La S. D. Eibar y el Getafe C. F., con balón, mantienen la posición ofensiva media más
avanzada de La Liga, así como la superior distancia media a espaldas de su línea
defensiva. Se caracterizan por ser equipos, sin balón, realmente presionantes. De hecho,
son los dos que más desarrollan dicha fase del juego y con la tercera (49%) y cuarta
(48%) mayor eficacia en la presión ejercida. La misión es situarse en bloque alto
orientando la presión e incorporando jugadores desde líneas posteriores para recuperar
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
31
GRÁFICO 18. DISTANCIA MEDIA LÍNEA DEFENSIVA
en campo rival y mirar hacia portería
rival con pocos metros por delante. Sus
más de 300 recuperaciones en campo
contrario, junto al Real Madrid, lo
justifican, así como el poseer el mayor
número de entradas en campo rival.
Tras haber estudiado las recuperaciones
realizadas en campo rival y su relación
estrecha con la posición media que
ocupan los equipos sobre el campo con
respecto a su propia portería, se
considera importante entender de forma
global los datos de balones recuperados
y balones perdidos totales (GRÁFICO
19). Existe una lógica que consiste en
que los equipos que más balones
recuperan, como la S. D. Eibar, el C. A.
Osasuna, el R. C. D. Espanyol, el
Athletic Club y el Getafe C. F., son los
que más balones pierden. Ahora bien, se
observa una excepción notoria. El Real
Madrid es el cuarto equipo que más
balones recupera y, al mismo tiempo, el
cuarto que menos balones totales pierde.
Principalmente, atendiendo al perfil de
jugador que más pérdidas totales
acumula, son los delanteros centro de
aquellos equipos que priorizan el juego
directo para ganar las segundas jugadas
y prolongar el juego o aquellos que a
través de un pase largo optan por
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
32
conceder la posesión al rival y obligarle a perder el balón en su campo ante una presión
efectiva. Joselu Sanmartín (ALA), Raúl García (ATH) y Jaime Mata (GET) superan las
300 perdidas totales, sobresaliendo el delantero centro del Deportivo Alavés con 365.
En relación con los balones perdidos totales, es preciso cuantificar cuantos han sido en
campo propio. De esta manera, se observará qué equipos de La Liga apuestan por asumir
riesgos en inicio de juego para, posteriormente, progresar en el juego y las pérdidas que
acumulan. El Real Celta de Vigo sobresale en este apartado, perdiendo hasta un 25% de
sus pérdidas totales en campo propio, mismo porcentaje que obtiene el Real Betis
Balompié con hasta siete jugadores con más de 30 pérdidas en campo propio.
Por detrás, se sitúan el Villarreal C. F. y el Valencia C. F. con un 24% de las pérdidas
totales en campo rival. Por otro lado, aquellos equipos que priorizan los pases largos y el
desempeño del juego vertical y del juego directo para, a partir de ahí, ganar segundas
jugadas o prolongar el juego son los que menos pérdidas suman en campo propio -entre
el 13% y el 19%-, como el Getafe C. F., la S. D. Eibar, el C. D. Leganés, el Granada C.
F. y el Athletic Club.
GRÁFICO 19. RELACIÓN BALONES PERDIDOS – BALONES RECUPERADOS DE LOS EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
33
En cuanto a las pérdidas en campo propio, existe una gran variedad de perfiles de jugador.
Para ello, en el gráfico 20 se observan los datos relativos a los jugadores con 30 o más
pérdidas en campo propio, donde resaltan Joselu Sanmartín (ALA) con 53, Jesús Navas
(SEV) con 50, Dani Parejo (VAL) con 48, Gerard Moreno (VILL) con 45 y Daniel Wass
(VAL) con 44. En su cómputo general, son más los interiores y centrocampistas
defensivos los que pierden mayor número de balones en campo rival, ya que son los
principales constructores de la progresión en el juego.
Ahora bien, también destaca el número de laterales y defensas centrales, donde destacan
Jesús Navas (SEV) con 50, Pervis Estupiñán (OSA) con 43 y Sergio Reguilón (SEV) con
41 pérdidas en campo propio. Haciendo hincapié en los datos referentes a los últimos
laterales mencionados, cabe destacar que otros laterales como Martín Aguirregabiria
(ALA), Ander Capa (ATH), Didac Vilá (ESP), Emerson (BET), Miramón (LEV), Rubén
Peña (VILL), Nelsinho Semedo (FCB), Yuri Berchiche (ATH), Carvajal (RM) y José
Ángel (EIB), también acumulan un importante número de pérdidas en campo rival. Se
concluye que el perfil de los citados laterales es claramente ofensivo, ya que destacan por
su incorporación desde línea posterior para sorprender y, muchos de ellos, son una de las
primeras alternativas de inicio de juego y de progresión de sus equipos.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
34
GRÁFICO 20. NÚMERO DE BALONES PERDIDOS EN CAMPO PROPIO DE LOS JUGADORES DE LA LIGA
Fuente: elaboración propia a partir de datos de Instat
Con la finalidad de concretar más en el previo análisis, en el gráfico 21 adjunto se recogen
los jugadores del Sevilla F. C., C. A. Osasuna, Getafe C. F y Athletic Club con la finalidad
de comparar perfiles individuales. Se confirma, por un lado, que los delanteros centro
pierden un alto número total de balones, pero pocos en campo rival, salvo Raúl García
(ATH) superando las 30 pérdidas e Iñaki Williams (ATH) y Yousef En-Nesyri (SEV) con
30 y 29 pérdidas, respectivamente. Por otro lado, en la parte superior del gráfico destacan
los nombres de los laterales del Sevilla F. C. y del Athletic Club superando el límite de
las 30 pérdidas.
No obstante, el C. A. Osasuna, solamente, cuenta con Pervis Estupiñán entre Jesús Navas
y Sergio Reguilón (SEV) y el Getafe C. F. no cuenta con ningún jugador por encima de
las 30 pérdidas en campo propio. En cuanto a sus laterales, tanto Damián Suárez como
Allan Romeo Nyom, se encuentran muy por debajo con 22 y 21 pérdidas,
respectivamente. Ahora bien, destacan tres de sus delanteros con un importante número
de balones perdidos, pero relativamente bajo en campo propio, motivado por su modelo
de juego.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
35
GRÁFICO 21. RELACIÓN DE BALONES PERDIDOS TOTALES – BALONES PERDIDOS EN CAMPO PROPIO
Fuente: elaboración propia a partir de datos de Instat
Siguiendo el análisis de la fase defensiva de los equipos de La Liga, se considera de
interés estudiar las relaciones existentes en materia de duelos defensivos y de duelos
aéreos ganados.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
36
GRÁFICO 22. RELACIÓN DE DUELOS AÉREOS - % AÉREOS GANADOS DE LOS EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
GRÁFICO 23. RELACIÓN DE DUELOS DEFENSIVOS – % DUELOS DEFENSIVOS GANADOS DE LOS EQUIPOS
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
37
Como se observa en los gráficos expuestos, la S. D. Eibar destaca en la cantidad de duelos
defensivos y duelos aéreos realizados. No obstante, su porcentaje de éxito es reducido.
Por ello, el C. A. Osasuna, el C. D. Leganés, la Real Sociedad, el Atlético de Madrid y el
Real Madrid con un porcentaje de éxito superior al 56% destacan en cuanto a los duelos
defensivos. En el apartado de los duelos aéreos ganados, es reseñable detenerse en seis
equipos: el Deportivo Alavés, el Athletic Club, el F. C. Barcelona, el Real Madrid, la S.
D. Eibar y el Getafe C. F.
No existe una relación en la que a más duelos aéreos ejecutados, se produzca una mayor
eficacia en los mismos. El Deportivo Alavés y el Athletic Club ejecutan más de 1420
duelos aéreos con el 57% y el 56% ganados. El Real Madrid y el F. C. Barcelona son los
dos equipos que menos duelos aéreos acumulan, pero con un 56% y 55% ganados. Y, por
último, el Getafe C. F. y la S. D. Eibar son los dos equipos que más duelos aéreos suman,
pero con un 48% y 46% de éxito. Joselu Sanmartín (ALA), Ante Budimir (MALL) y Raúl
García (ATH) destacan sobre los demás con 430, 313 y 307 duelos aéreos ganados.
Dichos jugadores desempeñan las funciones de delantero centro en sus equipos, donde
los utilizan como referencias en el juego directo. A partir de la caída, se origina la
progresión en el juego.
Atendiendo, únicamente, a los defensores con más de 20 duelos aéreos ejecutados, se
aprecia claramente que los centrales Iñigo Martínez (ATH) y David García (OSA) son
los que más llevan a cabo y con un porcentaje de acierto superior al 70%. Seguidamente,
destacan los centrales del Getafe C. F. Djené Dakoman y Leandro Cabrera – fichado por
el R. C. D. Espanyol en el mercado invernal- con un alto número de duelos aéreos
ejecutados y a una eficacia superior al 66%. Finalmente, los jugadores que menos
participan en duelos aéreos y con una eficacia muy baja son, predominantemente,
laterales: Nelsinho Semedo (FCB), Jordi Alba (FCB), Carlos Neva (GRA), Joan Sastre
(MALL) o Rubén Peña (VILL).
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
38
GRÁFICO 24. RELACIÓN DE AÉREOS – % AÉREOS GANADOS DE LOS DEFENSORES DE LA LIGA
Fuente: elaboración propia a partir de datos de Instat
Para realizar una síntesis adecuada respecto a lo comentado hasta el momento, se adjuntan
cuatro mapas en los que se resumen los datos más característicos de la fase defensiva del
Getafe C. F., de la S. D. Eibar, del C. A. Osasuna y del Real Betis Balompié. Se han
seleccionado los mencionados equipos con el fin de detectar visualmente las similitudes
patentes entre los tres primeros y las diferencias existentes con el equipo verdiblanco con
un modelo de juego antagónico. Además, es importante reseñar que el Getafe C. F., la S.
D. Eibar y el C. A. Osasuna desarrollan su fase ofensiva centrándose en un porcentaje de
posesión por debajo del 50%, en un alto número de pases largos y secuencias mínimas de
pases cortos, ya analizado en los apartados previos. Al mismo tiempo que comparten
múltiples comportamientos en su fase defensiva.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
39
MAPA 1. PRINCIPALES COMPORTAMIENTOS DE LA FASE DEFENSIVA DEL GETAFE C. F.
Fuente: elaboración propia a partir de datos de Instat
MAPA 2. PRINCIPALES COMPORTAMIENTOS DE LA FASE DEFENSIVA DE LA S. D. EIBAR
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
40
MAPA 3. PRINCIPALES COMPORTAMIENTOS DE LA FASE DEFENSIVA DEL C. A. OSASUNA
Fuente: elaboración propia a partir de datos de Instat
MAPA 4. PRINCIPALES COMPORTAMIENTOS DE LA FASE DEFENSIVA DEL REAL BETIS BALOMPIÉ
Fuente: elaboración propia a partir de datos de Instat
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
41
TABLA DE SIMILITUDES Y DIFERENCIAS
Fuente: elaboración propia a partir de datos de Instat (se incluye al Real Madrid C. F.)
Similitudes entre Getafe F. C, S. D. Eibar, C. A. Osasuna y Real Madrid C. F.
El Getafe C. F. se encuentra en un número de intercepciones intermedia.
Características defensivas propias del Real Betis Balompié distantes de las del resto de equipos.
Similitudes entre Real Madrid C. F. con C. A. Osasuna y Real Betis Balompié.
EVENTOS GETAFE EIBAR OSASUNA REAL
MADRID
REAL BETIS
Pérdidas (en campo
propio)
2089 (278) 2134 (294) 2102 (373) 1820 (385) 1768 (441)
Recuperaciones (en
campo rival)
1450 (302) 1560 (339) 1530 (277) 1464 (303) 1228 (197)
Duelos defensivos (%
acierto)
2224 (56%) 2207 (54%) 2153 (58%) 1991 (57%) 1908 (55%)
Aéreos (% acierto) 1655 (48%) 1722 (46%) 1483 (49%) 908 (56%) 972 (50%)
Intercepciones 1344 1445 1407 1173 1136
Entradas 829 822 826 840 705
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
42
IV. Conclusiones
1. La gran mayoría de los equipos de La Liga Santander han obtenido una puntuación
mayor de la esperada. Ahora bien, hay cinco equipos con puntuaciones inferiores a
las esperadas y dos de ellos son el C. D. Leganés (-9) y el R. C. D. Espanyol (-6),
ambos en descenso a La Liga Smartbank. La lógica descansa en los goles esperados
a favor (x G) y en los goles esperados en contra (x GA).
2. Los equipos de La Liga marcan menos goles de los esperados, en su cómputo general.
Solamente son cinco los equipos que han marcado más goles de los previstos: F. C.
Barcelona (+16), Granada C. F. (+2), Valencia C. F. (+3), Getafe C. F. (+4) y Real
Sociedad (+3). Entre los mencionados equipos, destaca el equipo de Quique Setién
con una diferencia positiva de dieciséis goles a favor, ya que los cuatro equipos
restantes no superan la diferencia de cuatro goles a favor. Por otro lado, C. D. Leganés
(-9), Atlético de Madrid (-8), R. C. D. Espanyol de Barcelona (-7), Celta de Vigo (-
6), S. D. Eibar (-6) y el R. C. D. Mallorca (-6) destacan dentro del grupo amplio de
equipos que han marcado menos goles que los esperados.
3. Un grupo mayoritario de equipos de La Liga que están por debajo del 40% con
respecto a los tiros a puerta realizados – el R. C. Celta de Vigo se encuentra en la
frontera-. Existe una importante distribución en cuanto al porcentaje de tiros a puerta
– desde el 34% del Granada C. F. al 51% del F. C. Barcelona-, pero los tiros totales
de los diferentes equipos giran en torno a la media de 293 disparos. Son solamente
seis equipos los que se alejan del grupo mayoritario señalado, el Real Madrid, el F.
C. Barcelona, el C. D. Leganés, el Valencia C. F. y el Deportivo Alavés. La razón
objetiva es que son los cinco equipos con mayor porcentaje de tiros a puerta de La
Liga, a pesar de que los dos últimos sean los que menos tiros totales han ejecutado.
4. Se advierte un grupo de equipos entre las 100 y las 140 oportunidades totales con
grandes diferencias entre los mismos. El Valencia C. F., el C. A. Osasuna, el Getafe
C. F., el Levante U. D., el Celta de Vigo y el R. C. D. Mallorca acumulan un total de
entre 124 y 120 oportunidades, pero sus cifras goleadoras son bien diferentes con una
diferencia de entre 38 y 22 goles marcados. Por lo tanto, existen evidencias de que no
todos los equipos de La Liga aprovechan de igual forma sus ocasiones.
5. El F. C. Barcelona (63%), el Sevilla F. C. (57%), la Real Sociedad (56%), el Real
Madrid (56%), el Real Betis Balompié (53%), el Villarreal C. F. (52%) y el Real Celta
de Vigo (51%) son los siete equipos que superan el 50% de posesión de balón de La
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
43
Liga. El resto de equipo se encuentran por debajo de dicha cifra. Asimismo, el número
de oportunidades que ocasionan es alto, en comparación con el resto de equipos, ya
que todos ellos, salvo el Real Celta de Vigo se encuentran entre los siete primeros
equipos de esta clasificación.
6. Ahora bien, el Atlético de Madrid se coloca cuarto en ocasiones generadas, a pesar de
tener un 47% de posesión de balón, ya que su modelo de juego es antagónico al de
los equipos anteriormente mencionados. El equipo de Diego Pablo Simeone no se
caracteriza por el desarrollo del juego posicional y no necesita mover de lado a lado
para crear un alto número de ocasiones. Otro de los equipos que resalta es el C. A.
Osasuna. El equipo de Jagoba Arrasate, más afín al juego directo y presionante en
bloque alto para recuperar cerca de portería rival, es el octavo de La Liga que más
oportunidades crea, aunque con una posesión media del 49%.
7. La inmensa mayoría de los jugadores que superan las 20 ocasiones de gol coinciden
con los equipos que superan las 120 oportunidades. Destacan sobre los demás Leo
Messi (FCB), Karim Benzema (RMA), Álvaro Morata (ATM), Gerard Moreno
(VILL), Iago Aspas (CEL), Luis Suárez (FCB), Ante Budimir (MALL), Roger Martí
(LEV) y Jaime Mata (GET).
8. El Getafe C. F. tiene el menor porcentaje de acierto en el pase (71%), que está
directamente relacionado con que es el equipo que menos pases cortos ejecuta por
partido (221) y el segundo que más pases largos envía (81). Asimismo, también hay
una conexión entre el 77% de acierto en el pase del C. A. Osasuna y en que es el sexto
equipo que menos pases cortos lleva a cabo por partido (304) y el tercero que más
insiste en el pase largo (73). Finalmente, por justificar aún más dichas relaciones, es
preciso citar el caso de la S. D. Eibar con un 78% de acierto en el pase, siendo el
máximo pasador en largo por partido (83) y el quinto que menos apuesta por pasar en
corto (290). Es reseñable que los tres equipos citados se aproximan, en exceso, en sus
modelos de juego, apostando por asumir los mínimos riesgos en campo propio y
cediendo protagonismo a la presión avanzada para robar alto. Por este motivo, son los
equipos que menos pases cortos diseñan y que más emplean el juego directo para ser
fuertes en las segundas jugadas.
9. En cuanto a la utilización de los tres pasillos, en caso de dividir el campo en dos
pasillos exteriores y un pasillo central, no existen diferencias significativas entre los
equipos de La Liga, pero sí hay determinadas escuadras que sobresalen por encima
de las demás. En La Liga, existe un predominio claro a atacar por los pasillos
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
44
exteriores, ya que la media por pasillo lateral izquierdo es de 734 y la correspondiente
al pasillo lateral derecho es de 750. Estas cifras están, considerablemente, por encima
de la media referente al pasillo central de 527 ataques.
10. La S. D. Eibar, el Getafe C. F., el Real Madrid, el C. A. Osasuna, el Sevilla F. C. y el
Athletic Club son los seis equipos de La Liga que más entradas realizan en campo
rival, siendo superiores a las 1700. La S. D. Eibar y el Getafe C. F. desempeñan un
modelo de juego similar, aunque con matices. En inicio de juego, no utilizan los pases
“para llamar” y las relaciones con cercanos y próximos son mínimas, ya que mitigan
riesgos innecesarios en campo propio. Por ello, son las máximos valedores de los
pases largos y entran dentro, como se ha señalado anteriormente, del ranking de seis
equipos que menos pases cortos ejecutan.
11. La S. D. Eibar y el Getafe C. F., con balón, mantienen la posición ofensiva media más
avanzada de La Liga, así como la superior distancia media a espaldas de su línea
defensiva. Se caracterizan por ser equipos, sin balón, realmente presionantes. De
hecho, son los dos que más desarrollan dicha fase del juego y con la tercera (49%) y
cuarta (48%) mayor eficacia en la presión ejercida. La misión es situarse en bloque
alto orientando la presión e incorporando jugadores desde líneas posteriores para
recuperar en campo rival y mirar hacia portería rival con pocos metros por delante.
Sus más de 300 recuperaciones en campo contrario, junto al Real Madrid, lo
justifican, así como el poseer el mayor número de entradas en campo rival.
12. La S. D. Eibar es el equipo que más balones recupera de La Liga y que más balones
recupera en campo rival. Dicho factor no se cumple en todos los equipos, donde el
Sevilla F. C., el R . C. D. Espanyol y el Athletic Club son el tercer, cuarto y sexto
equipo, respectivamente, que más balones totales recuperan, pero con índices bajos
en campo rival. Concretamente, el R. C. D. Espanyol de sus 1471 recuperaciones
totales, solamente son 253 en campo rival, es decir, el 17%. No obstante, otros equipos
como el F. C. Barcelona recuperan pocos balones en comparación a los demás equipos
de La Liga (1269), pero en campo rival consiguen un número muy superior que al
resto, 287 recuperaciones, es decir, el 23%.
13. En relación con los balones perdidos totales, es preciso cuantificar cuantos han sido
en campo propio. De esta manera, se observa qué equipos de La Liga apuestan por
asumir riesgos en inicio de juego para, posteriormente, progresar en el juego y las
pérdidas que acumulan. El Real Celta de Vigo sobresale en este apartado, perdiendo
hasta un 25% de sus pérdidas totales en campo propio, mismo porcentaje que obtiene
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
45
el Real Betis Balompié con hasta siete jugadores con más de 30 pérdidas en campo
propio. Por detrás, se sitúan el Villarreal C. F. y el Valencia C. F. con un 24% de las
pérdidas totales en campo rival.
14. Por otro lado, aquellos equipos que priorizan los pases largos y el desempeño del
juego vertical y del juego directo para, a partir de ahí, ganar segundas jugadas o
prolongar el juego son los que menos pérdidas suman en campo propio -entre el 13%
y el 19%-, como el Getafe C. F., la S. D. Eibar, el C. D. Leganés, el Granada C. F. y
el Athletic Club.
15. No existe una relación en la que a más duelos aéreos ejecutados, se produzca una
mayor eficacia en los mismos. El Deportivo Alavés y el Athletic Club ejecutan más
de 1420 duelos aéreos con el 57% y el 56% ganados. El Real Madrid y el F. C.
Barcelona son los dos equipos que menos duelos aéreos acumulan, pero con un 56%
y 55% ganados. Y, por último, el Getafe C. F. y la S. D. Eibar son los dos equipos
que más duelos aéreos suman, pero con un 48% y 46% de éxito. Joselu Sanmartín
(ALA), Ante Budimir (MALL) y Raúl García (ATH) destacan sobre los demás con
430, 313 y 307 duelos aéreos ganados.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM
46
V. Abreviaturas
ALA – Deportivo Alavés
ATH – Athletic Club
ATM – Atlético de Madrid
BET – Real Betis Balompié
CEL – Real Celta de Vigo
EIB – S. D. Eibar
ESP – R. C. D. Espanyol
FCB – F. C. Barcelona
GET – Getafe C. F.
GRA – Granada C. F.
LEG – C. D. Leganés
LEV – Levante U. D.
MALL – R. C. D. Mallorca
OSA – C. A. Osasuna
RMA – Real Madrid C . F.
RSO – Real Sociedad
SEV – Sevilla F. C.
VAL – Valencia C. F.
VALL – Real Valladolid C. F.
VILL – Villarreal C. F.
Pablo Sanzol. 2020Máster en Big Data Deportivo
Big Data International Campus / UCAM