¿Valores absolutos o proporcionales?

Teoría de la relatividad
absoluto
relativo
readxl
kable
attach
plot
grid
cor.test
correlación
Author

Román Salmerón Gómez

Published

May 18, 2023

Como seguidor del Covirán Granada he escuchado en distintas ocasiones afirmaciones de los comentaristas del tipo es un equipo peligroso en el rebote ofensivo o es el equipo que más balones pierde de toda la liga. Y, yo me pregunto, ¿será cierto?

Bien es cierto que en las 33 jornadas disputas hasta el momento captura una media de 11.64 rebotes ofensivos por partido (el tercero que más de toda la liga) o que pierde una media de 15.48 puntos por partido (el segundo que más), pero…

Veamos si hay un pero o no

Para ello voy a usar los siguientes datos de todos los equipos de la Liga Endesa en su Temporada 2022-23 desde la jornada 1 hasta la 33:

library(readxl)
datos <- read_excel("EquiposPORCENTAJE.xlsx", sheet = "datos")
attach(datos)
vistazo = head(datos)
library(knitr)
kable(vistazo, align = "c", caption = "Visualización de los datos que tenemos: unas pocas observaciones")
Visualización de los datos que tenemos: unas pocas observaciones
Fecha Jornada Liga Local Resultado Nombre T2C T2I T2P T3C T3I T3P TCC TCI TCP RD RO BP PorcRD PorcRO Ataques Posesiones PorcBPPosesiones PorcAsisPosesiones
20220928 1 ACB 1 0 Girona 19 42 45.24 9 24 37.50 28 66 42.42 23 10 11 79.31034 26.31579 77.8 87.8 12.528474 23.91800
20220928 1 ACB 0 1 RMadrid 17 31 54.84 18 32 56.25 35 63 55.56 28 6 17 73.68421 20.68966 78.0 84.0 20.238095 23.80952
20220928 1 ACB 1 0 Fuenlabrada 25 42 59.52 8 26 30.77 33 68 48.53 21 9 11 77.77778 25.71429 74.0 83.0 13.253012 18.07229
20220928 1 ACB 0 1 Granada 22 38 57.89 9 20 45.00 31 58 53.45 26 6 13 74.28571 22.22222 71.0 77.0 16.883117 20.77922
20220928 1 ACB 1 1 Obradoiro 17 36 47.22 7 21 33.33 24 57 42.11 36 9 16 70.58824 28.12500 74.4 83.4 19.184652 14.38849
20220928 1 ACB 0 0 Zaragoza 22 45 48.89 5 27 18.52 27 72 37.50 23 15 8 71.87500 29.41176 75.8 90.8 8.810573 15.41850

De las variables disponibles, usaremos el porcentaje de tiros de campo (TCP), número de rebotes ofensivos capturados (RO), porcentaje de rebotes ofensivos (PorcRO, de los rebotes ofensivos, cuántos se han capturado), las posesiones disfrutadas (Posesiones), el número de balones perdidos y el porcentaje de posesiones donde se pierde un balón (PorcBPPosesiones).

Rebotes Ofensivos

Empezamos representando el porcentaje de tiros de campo frente al número de rebotes ofensivos capturados:

  plot(TCP, RO, xlab="Porcentaje de Tiros de Campo", ylab="Número de Rebotes Ofensivos", col="blue", lwd=2)
  grid(nx = NULL, ny = NULL, lty = 2, col = "gray", lwd = 2)

Se aprecia que aquellos equipos con mayor porcentaje de tiros de campo capturan menos rebotes ofensivos, lo cual se confirma al calcular la correlación entre ambas variables y obtener un valor negativo, -0.33898149 (que es significativamente distinto de cero):

  cor.test(TCP, RO)

    Pearson's product-moment correlation

data:  TCP and RO
t = -10.282, df = 590, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.4560723 -0.3192600
sample estimates:
       cor 
-0.3898149 

Por tanto, ¿los equipos analizados capturan muchos rebotes ofensivos porque son buenos en este aspecto del juego o simplemente tienen malos porcentajes en los tiros de campo (fallan mucho)?

Para intentar dar respuesta a esta pregunta, vamos a poner en juego el concepto de porcentaje de rebotes ofensivos: cuando un equipo falla un tiro, el rebote puede capturarlo el equipo que ataca (rebote ofensivo) o el que defiende (rebote defensivo); haciendo el cociente \(\frac{\mbox{rebote ofensivo}}{\mbox{rebote ofensivo + rebote defensivo}} \cdot 100\%\) proporciona el porcentaje de rebotes ofensivos capturados por un equipo.

Así se controla situaciones como la siguiente: no es lo mismo capturar 10 rebotes ofensivos de 15 posibles que de 20.

Representando ahora el porcentaje de tiros de campo frente al porcentaje de rebotes ofensivos capturados se observa que no hay un patrón definido:

  plot(TCP, PorcRO, xlab="Porcentaje de Tiros de Campo", ylab="Porcentaje de Rebotes Ofensivos", col="blue", lwd=2)
  grid(nx = NULL, ny = NULL, lty = 2, col = "gray", lwd = 2)

La ausencia de relación se confirma al calcular el coeficiente de correlación entre ambas variables al obtenerse un coeficiente de corrlación no significativamente distinto de cero:

  cor.test(TCP, PorcRO)

    Pearson's product-moment correlation

data:  TCP and PorcRO
t = -0.30131, df = 590, p-value = 0.7633
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.09289461  0.06824834
sample estimates:
        cor 
-0.01240367 

¿Entonces? Pues todo parece indicar que para determinar si un equipo es peligroso o no en el rebote no es adecuado usar el número absoluto de rebotes ofensivos capturados, ya que esta variable está relacionada (negativamente) con el porcentaje de tiro: capturan más rebote ofensivo aquellos equipos que tienen peor porcentaje de tiro. Sin embargo, esta relación se rompe si se usa el porcentaje de rebote ofensivo capturado. Es mejor usar los términos relativos que los absolutos.

Balones Perdidos

Si trabajamos ahora con los balones perdidos, obtenemos una situación parecida a la anterior.

En la representación gráfica de las posesiones jugadas por los equipos frente al número de balones perdidos se aprecia cierta relación positiva:

plot(Posesiones, BP, xlab="Posesiones Jugadas", ylab="Número de Balones Perdidos", col="blue", lwd=2)
grid(nx = NULL, ny = NULL, lty = 2, col = "gray", lwd = 2)

Que aquellos equipos que más posesiones juegan pierden más balones se confirma al calcular la correlación lineal, 0.3171085 (significativamente distinta de cero), entre ambas variables:

  cor.test(Posesiones, BP)

    Pearson's product-moment correlation

data:  Posesiones and BP
t = 8.1217, df = 590, p-value = 2.697e-15
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.2427274 0.3877830
sample estimates:
      cor 
0.3171085 

Por tanto, ¿los equipos analizados pierden más balones porque son malos en este aspecto del juego o simplemente juegan más poesiones (hay más opciones de que pierdan un balón)?

Para ver si podemos responder a esta pregunta, sacamos a pista la variable porcentaje de posesiones donde se pierde un balón, que se calcula como sigue: \(\frac{\mbox{balones perdidos}}{\mbox{posesiones jugadas}} \cdot 100\%\).

Así se controla situaciones como la siguiente: no es lo mismo perder 20 balones disputando 70 posesiones que 85.

Representando ahora el número de posesiones jugadas frente al porcentaje de posesiones donde se pierde un balón se observa que la relación anterior desaparece:

  plot(Posesiones, PorcBPPosesiones, xlab="Posesiones Jugadas", ylab="Porcentaje de Posesiones donde se Pierde un Balón", col="blue", lwd=2)
  grid(nx = NULL, ny = NULL, lty = 2, col = "gray", lwd = 2)

Lo cual se confirma al obtener un coeficiente de correlación no significativamente distinto de cero.

  cor.test(Posesiones, PorcBPPosesiones)

    Pearson's product-moment correlation

data:  Posesiones and PorcBPPosesiones
t = 1.8805, df = 590, p-value = 0.06054
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.003418806  0.156794793
sample estimates:
       cor 
0.07718625 

¿Entonces? Pues todo parece indicar que para determinar si un equipo es flojo cuidando el balón no es adecuado usar el número absoluto de balones perdidos, ya que esta variable está relacionada (positivamente) con el número de posesiones que se juegan: pierden más balones aquellos equipos que juegan más posesiones. Sin embargo, esta relación se rompe si se usa el porcentaje de posesiones donde se pierde un balón. Es mejor usar los términos relativos que los absolutos.

Pero, ¿los comentaristas están equivocados?

Espero que el lector se esté haciendo dicha pregunta. ¿Los comentaristas están en lo cierto?

Atendiendo a las variables relativas, resulta que el Covirán Granada es el tercer equipo que más porcentaje de rebote ofensivo captura con un 30.97%, al mismo tiempo que es el segundo que mayor porcentaje de posesiones tiene con un balón perdido con un 17.7%.

Luego…

Causalidad y correlación

Cuando estamos tratando la relación entre variables, tenemos que tener claro que no se estableciendo relaciones de causa-efecto. Me explico: es muy distinto decir Que aquellos equipos que más posesiones juegan pierden más balones que decir Que los equipos pierden más balones porque juegan más posesiones. Otro ejemplo, decir que capturan más rebote ofensivo aquellos equipos que tienen peor porcentaje de tiro es muy distinto a decir que capturan más rebote ofensivo porque tienen peor porcentaje de tiro.

En el análisis realizado, diagrama de dispersión y correlación lineal simple, lo que se obtiene es que cuando una variable aumenta/disminuye la otra también aumenta/disminuye. Pero no podríamos afirmar que una variable aumenta/disminuye porque otra aumenta disminuye.

He repasado el texto intentando que no haya contradicciones en lo referente a esta nota final, pero como dice Osgood al final de ‘’Con faldas y a lo loco’’: nadie es perfecto.