Toma de decisiones – Blog ACBStats

Es evidente que es de vital importancia conocer el impacto de un jugador en un partido de baloncesto. De las distintas medidas que se tienen para cuantificar esto, seguramente destaque el porcentaje de usabilidad, el cual se calcula (ver, por ejemplo, el glosario de Basketball-Reference) como: \[USG\% = 100 \cdot \frac{1}{\frac{T_J}{T_E/5}} \cdot \frac{TCI_J + 0.44 * T1I_J + BP_J}{TCI_E + 0.44 * T1I_E + BP_E},\] donde \(TCI\) denota a los tiros de campo intentados, \(T1I\) los tiros libres intentados, \(BP\) los balones perdidos, \(T_E\) el tiempo de partido (si no hay prórrogas, 200 minutos) y \(T_J\) los minutos jugados. Los subíndices \(J\) y \(E\) hacen referencia a los jugadores y equipo, respectivamente.

Analizando la expresión anterior, se tiene que:

El denominador \(TCI_E + 0.44 * T1I_E + BP_E\) cuantifica el número de acciones que se toman en el ataque de un equipo.
El término \(\frac{T_J}{T_E/5}\) determina el porcentaje de tiempo que está un jugador en pista.
Por tanto, el producto de ambas determina el número de acciones que se producen en un partido mientras que éste está en pista.

Por otro lado:

\(TCI_J + 0.44 * T1I_J + BP_J\) cuantifica el número de acciones que se toma en ataque un jugador.
Al dividir este factor por el número de acciones que se producen en un partido mientras que un jugador está en pista, y multiplicar el resultado por 100, se obtiene el porcentaje de acciones tomadas por un jugador mientras que éste está en pista.

Ahora bien, creo que esta medida puede completarse considerando que:

Un jugador también finaliza jugada (que no ataque, ver el post sobre desgranando el juego) cuando recibe una falta personal y cuando da una asistencia. Puesto que dar una asistencia significa regalar una canasta consideramos que en cierto modo estamos finalizando jugada.
Planteando cuantificar las jugadas que se finalizan con éxito, es decir, no es lo mismo hacer un tiro de campo que anotar un tiro de campo. Si se considera que un jugador finaliza una jugada cuando intenta un tiro de campo, recibe una falta personal pierde un balón o da una asistencia, se considerará que la finaliza con éxito cuando convierte un tiro de campo, recibe una falta o da una asistencia. Con los datos del primer caso, se puede obtener el porcentaje de posesiones finalizadas por un jugador (%PosFJ); mientras en el segundo caso, el porcentaje de posesiones finalizadas con éxito (%PosFJE).

Estas medidas, ya propuestas en el blog ACBStats primigenio, se pueden calcular a partir de las siguientes expresiones:

\[\%PosFJ = \frac{TCI_J + FPR_J + BP_J + Asis_J}{PosJ} \cdot 100,\] \[\%PosFJE = \frac{TCC_J + FPR_J + Asis_J}{TCI_J + FPR_J + BP_J + Asis_J} \cdot 100.\] donde \(PosJ\) son el número de posesiones disfrutadas por el equipo mientras el jugador está en pista, que se calcula como: \[PosJ = \frac{(TCI_E + 0.4 T1I_E + BP_E) \cdot T_J}{T_E/5}.\]

Para ilustrar los conceptos anteriores, voy a usar los datos de todos los jugadores de la Liga Endesa en su Temporada 2022-23 que han jugado en las 21 primeras jornadas:

library(readxl)
datos <- read_excel("JugadoresDECISIONES.xlsx", sheet = "datos")
attach(datos)
vistazo = head(datos)
library(knitr)
kable(vistazo, align = "c", caption = "Visualización de los datos que tenemos: unas pocas observaciones")

Visualización de los datos que tenemos: unas pocas observaciones
Quinteto	Apodo	Fecha	Jornada	Local	Nombre	PosJ	PosFJ	PosFJE	PorcPosFJ	PorcPosFJE	USGporc
0	MF2	20220928	1	1	M. Fjellerup	31.64458	9	4	28.44089	44.44444	28.09530
1	EV4	20220928	1	1	E. Vila	53.85067	10	4	18.56987	40.00000	16.50980
1	KT5	20220928	1	1	K. Taylor	57.10658	24	16	42.02668	66.66667	25.87831
0	PF7	20220928	1	1	P. Figueras	40.02217	9	4	22.48754	44.44444	17.27778
0	RP8	20220928	1	1	R. Prkacin	21.95000	6	1	27.33485	16.66667	22.50225
0	QC10	20220928	1	1	Q. Colom	39.32708	13	9	33.05610	69.23077	14.76985

De los datos disponibles, destacar los referentes al apodo/nombre de los jugadores, al número de posesiones que se disputan mientras que están en pista (PosJ), las que finalizan (PosFJ) y las que finalizan con éxito (PosFJE). Ésta últimas permiten calcular tanto %PosFJ como %PosFJE.

Lo que vamos a hacer en primer lugar es calcular la media de %PosFJ y %PosFJE para cada jugador. También se calcula el número de partidos jugados por cada uno:

media <- function(x) mean(x, na.rm=TRUE) # creo una función que calcule la media ignorando los datos faltantes para que sea usada en tapply 
attach(datos)
  PorcPosFJ_Jugadores = tapply(PorcPosFJ, Nombre, media)
  PorcPosFJE_Jugadores = tapply(PorcPosFJE, Nombre, media)
  USGporc_Jugadores = tapply(USGporc, Nombre, media)
  partidos = table(Nombre)
detach(datos)

Una vez se tiene esta información, la guardamos en un objeto llamada decisiones y, a continuación, se filtran los datos considerando aquellos jugadores que cumplen una característica en concreto:

decisiones = data.frame(PorcPosFJ_Jugadores, PorcPosFJE_Jugadores, USGporc_Jugadores, partidos)
library(dplyr)
datos_finales = filter(decisiones, PorcPosFJ_Jugadores > 35 & PorcPosFJE_Jugadores > 50 & partidos > 10)

En este caso, se tienen aquellos jugadores que finalizan al menos el 35% de las posesiones que se juegan mientras que están en pista y lo hacen con un porcentaje de éxito de al menos el 50%. Igualmente se exige que hayan disputado un mínimo de 10 partidos:

vistazo = datos_finales[,c(1:3,5)]
colnames(vistazo) = c("%PosFJ", "%PosFJE", "USG%", "Partidos")
kable(vistazo, align = "c", caption = "Visualización de los datos finales: unas pocas observaciones")

Visualización de los datos finales: unas pocas observaciones
	%PosFJ	%PosFJE	USG%	Partidos
A. Feliz	35.61138	64.11329	19.92716	21
A. Tomic	40.13157	66.96117	24.92194	21
C. Higgins	36.37489	65.05229	24.58911	12
C. Jones	39.82838	62.49129	21.75581	20
D. Bender	40.91816	59.83706	27.55383	11
D. Brizuela	39.07884	55.93991	24.98426	19
D. Musa	36.76048	65.19383	24.03685	21
D. Pérez	36.51907	58.31018	15.66245	20
D. Thompson	39.32742	67.00733	18.99664	21
F. Ferrari	38.07126	50.87350	19.76843	20
J. Harding	36.79917	53.96966	24.79218	18
J. Harper	39.43701	51.13491	21.95475	14
K. Perry	36.30916	62.50246	22.11812	21
K. Prepelic	37.26915	55.80782	20.08231	21
K. Robertson	37.25933	54.30781	24.51953	12
L. Hakanson	35.94340	61.38621	20.63077	19
L. Westermann	39.51235	52.53715	18.51805	17
M. Howard	43.43138	50.32005	29.73622	20
M. Huertas	46.20942	61.50144	22.56525	20
N. Laprovittola	39.27613	59.16550	21.84572	20
Q. Colom	36.77544	56.72501	19.05379	21
R. Jokubaitis	35.12299	63.03960	17.80500	21
S. Evans	41.67295	60.22886	23.23821	21
T. Trice	38.51710	56.63688	23.96577	21

De la representación de %PosFJ frente %PosFJE de los 24 jugadores seleccionados obtenemos que el jugador que más posesiones finaliza es M. Huertas (Tenerife); mientras que el que mayor porcentaje de posesiones finaliza con éxito es D. Thompson (Baskonia), seguido de cerca por A. Tomic (Joventut):

PosFJ = datos_finales[,1]
PosFJE = datos_finales[,2]

  plot(PosFJ, PosFJE, xlab="% de posesiones finalizadas", ylab="% de posesiones finalizadas con éxito", lwd=3, col="blue", 
       main="Liga ACB - Temporada 2022/23 - Jornadas 1 a 21", 
       xlim=c(min(PosFJ)-1, max(PosFJ)+1), ylim=c(min(PosFJE)-1, max(PosFJE)+1))
  text(PosFJ, PosFJE, labels = rownames(datos_finales), col="black", pos=1)
  abline(v=mean(PosFJ), col="red", lwd=2)
  abline(h=mean(PosFJE), col="red", lwd=2)
  grid(nx = NULL, ny = NULL, lty = 2, col = "gray", lwd = 2)

El tener en cuenta a las asitencias, hace pensar en el predominio de los jugadores exteriores en esta estadística, lo que da aún mayor valor a la presencia de A. Tomic entre los mejores.

Representando %PosFJ frente USG% se observa que el máximo valor de USG% es menor que el mínimo valor de %PosFJ:

USG = datos_finales[,3]

  plot(PosFJ, USG, xlab="% de posesiones finalizadas", ylab="USG%", lwd=3, col="blue", 
     main="Liga ACB - Temporada 2022/23 - Jornadas 1 a 21",
     xlim=c(min(PosFJ)-1, max(PosFJ)+1), ylim=c(min(USG)-1, max(USG)+1))
  text(PosFJ, USG, labels = rownames(datos_finales), col="black", pos=1)
  abline(v=mean(PosFJ), col="red", lwd=2)
  abline(h=mean(USG), col="red", lwd=2)
  abline(a=0, b=1, col="orange", lwd=2)
  grid(nx = NULL, ny = NULL, lty = 2, col = "gray", lwd = 2)

Es evidente que esto se debe a que en %PosFJ se tiene en cuenta a las faltas recibidas y las asistencias dadas, al contrario que en USG%, lo que podría hacer pensar que la primera es una medida más completa que la segunda.

Para finalizar, puesto que tenéis los datos disponibles y el código usado, podeís modificarlo para jugar con ellos modificando las condiciones de filtrado que yo he considerado. Por ejemplo, ¿quienes serán los jugadores que, finalizando más del 35% de las posesiones que se disputan mientras que están en pista, son los que menos finalizan con éxito?