Saltar al contenido
Talacote.com

Metodología y fuentes científicas

Esta página documenta cómo funcionan las herramientas Talacote bajo el capó: los tres modelos estadísticos utilizados para las predicciones, los artículos académicos que los fundamentan, las fuentes de datos, y los límites asumidos. Todo es verificable. Ninguna black box.

Tres modelos estadísticos públicos

Talacote no practica el pronóstico intuitivo. Cada probabilidad de victoria/empate/derrota se calcula a partir de tres modelos estadísticos publicados en revistas científicas con revisión por pares. Aquí están los tres, su rol y la referencia académica exacta que puedes descargar para verificar.

1. Modelo de Poisson bivariado

La distribución de Poisson modela el número de goles marcados por cada equipo en función de sus medias ataque/defensa de la temporada. Para un partido dado, el modelo calcula la probabilidad de cada marcador posible (0-0, 1-0, 2-1, …) y luego suma por resultado (1, X, 2). Adaptado a deportes con marcadores discretos bajos — fútbol típicamente.

Referencias :

  • Maher, M.J. (1982). Modelling Association Football Scores. Statistica Neerlandica, 36(3), 109-118. DOI
  • Karlis, D., & Ntzoufras, I. (2000). On modelling soccer data. Student, 3(4), 229-244. Author page

2. Sistema ELO ajustado

El sistema ELO (originalmente diseñado para la clasificación de jugadores de ajedrez por Arpad Elo en 1960) atribuye una puntuación de fuerza a cada equipo, actualizada después de cada partido según el resultado y la fuerza del adversario. Talacote utiliza una variante calibrada para el fútbol, con un factor K (velocidad de aprendizaje) ajustado empíricamente para el contexto deportivo. Hvattum & Arntzen validaron esta adaptación comparativamente a 8 otros métodos de puntuación.

Referencias :

  • Hvattum, L.M., & Arntzen, H. (2010). Using ELO ratings for match result prediction in association football. International Journal of Forecasting, 26(3), 460-470. DOI
  • Elo, A.E. (1978). The Rating of Chessplayers, Past and Present. Arco Pub. (texte fondateur du système, applicable bien au-delà des échecs).

3. Corrección Dixon-Coles

El modelo de Poisson bivariado subestima la frecuencia de los marcadores bajos (0-0, 1-0, 0-1, 1-1) porque trata los goles de ambos equipos como independientes — lo que es falso a marcador bajo (los equipos cierran su defensa). La corrección Dixon-Coles añade un término correctivo τ que reequilibra estos 4 marcadores específicos según los datos empíricos. Sin esta corrección, las apuestas a marcador exacto bajo estarían sistemáticamente mal valoradas.

Referencias :

  • Dixon, M.J., & Coles, S.G. (1997). Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society. Series C (Applied Statistics), 46(2), 265-280. DOI · JSTOR

Fuentes de datos

Ningún dato se inventa ni se obtiene ilegalmente por scraping. Talacote consume exclusivamente fuentes públicas oficiales o licenciadas. Aquí está la lista exhaustiva y las condiciones de uso.

  • football-data.org — Calendarios, resultados, clasificaciones, estadísticas de equipos para 12 competiciones principales (Premier League, La Liga, Bundesliga, Serie A, Ligue 1, etc.).
    football-data.org · Licencia : CC BY 4.0
  • the-odds-api.com — Cuotas de bookmakers en tiempo real para la comparación multi-operador y la detección de Value Bets. Plan comercial suscrito, sin scraping.
    the-odds-api.com · Licencia : API comercial (clave de acceso de pago)
  • Geolocalización IP — ipapi.co (gratuito, anonimizado) para adaptar los precios Premium a la zona monetaria del visitante. Ninguna IP se almacena — la consulta se hace en memoria y el resultado se cachea 24h.

Stack técnico

Sin framework ML opaco. Sin modelo entrenado en un dataset propietario. Los cálculos se realizan en PHP del lado servidor (Poisson, ELO, Dixon-Coles son fórmulas cerradas, no aprendizaje), y el resultado se renderiza del lado cliente en JavaScript vanilla.

  • WordPress + thème custom child d'Astra (~80 fichiers PHP)
  • PHP 8.x pour les modèles statistiques + l'API REST + le rendu serveur
  • JavaScript vanilla côté client (pas de React, pas de Vue, pas de jQuery global)
  • Stripe Payment Links pour le paiement Premium (PCI-DSS niveau 1, aucune donnée bancaire stockée chez nous)
  • MySQL via le `$wpdb` WordPress (utilisateurs, prédictions cachées, log inscriptions)
  • JSON multilingue pour l'i18n (17 langues, fallback chain langue → FR → EN → clé brute)

Límites asumidos

Honestidad intelectual: un modelo estadístico no es un oráculo. Aquí está lo que las herramientas Talacote NO saben hacer, y que debes tener en cuenta antes de basar una apuesta en sus salidas.

  1. Lesiones y eventos de última hora. Los modelos se entrenan con resultados agregados. Una lesión anunciada 30 minutos antes de un partido no se reflejará hasta que los datos de la temporada se actualicen.
  2. Contexto motivacional. Un equipo clasificado que alinea a sus suplentes a final de temporada, un derbi donde la motivación trasciende la relación de fuerzas estadística: nuestros modelos no capturan estas señales.
  3. Varianza y sample size. Una probabilidad estimada al 60% significa que sobre 100 partidos comparables, alrededor de 60 se saldarían con victoria — no que ESTE partido específico se salde con victoria. Las series de 5-10 pérdidas consecutivas son normales y estadísticamente esperadas.
  4. Calibración vs sobreconfianza. La fuerza de los modelos depende de la calidad de los datos de entrenamiento. En las grandes competiciones (Big 5 europeos), los modelos están bien calibrados. En las ligas menores o exóticas, los datos son más escasos y la fiabilidad disminuye mecánicamente.

Talacote es una herramienta de apoyo a la decisión, no un sistema de apuestas automatizado ni una garantía de ganancia. Las apuestas deportivas conllevan un riesgo financiero real. Apuesta responsablemente.

Por qué es auditable

Los tres modelos anteriores están publicados en revistas con revisión por pares desde hace 25 a 50 años. Cualquier persona con un fondo estadístico de licenciatura puede descargar los artículos, reconstruir las fórmulas a partir de los anexos matemáticos, y obtener el mismo resultado que Talacote sobre un dataset idéntico. Esa es la definición de un método reproducible. Ningún ingrediente secreto, ningún parámetro oculto.

Si eres investigador, periodista o estudiante y quieres profundizar (re-implementación, comparación con otro modelo, auditoría de reproducibilidad), escribe a contact@talacote.com — compartimos con gusto los detalles de implementación, los conjuntos de validación utilizados y los límites observados en producción.

Scroll al inicio