跳到主要内容
Talacote.com

方法论与科学依据

本页面记录了Talacote工具的内部工作原理:用于预测的三个统计模型、参考学术论文、所用数据来源以及已认知的局限。无黑箱、无营销 — 仅有公开、可审计的数学。

三个公开的统计模型

Talacote不进行直觉式预测。每一个胜/平/负的概率都来自三个发表在科学期刊的统计模型,通过每个赛季校准的加权平均加以聚合。

1. 二元Poisson模型

Poisson分布根据每支球队的赛季攻防均值,对其进球数进行建模。Talacote使用的二元版本将两个分布交叉,从而推导每个准确比分(1-0、2-1、0-0等)的概率,并通过聚合得到三种1X2结果的概率。

参考文献 :

  • Maher, M.J. (1982). Modelling Association Football Scores. Statistica Neerlandica, 36(3), 109-118. DOI
  • Karlis, D., & Ntzoufras, I. (2000). On modelling soccer data. Student, 3(4), 229-244. Author page

2. 调整后的ELO系统

ELO系统(最初由Arpad Elo于1960年为国际象棋棋手排名设计)为每支球队分配一个实力分数,每场比赛后根据结果与实力差异更新。Talacote使用一个针对足球调整的变体(内置主场优势,K因子取决于赛事),灵感来自clubelo.com。

参考文献 :

  • Hvattum, L.M., & Arntzen, H. (2010). Using ELO ratings for match result prediction in association football. International Journal of Forecasting, 26(3), 460-470. DOI
  • Elo, A.E. (1978). The Rating of Chessplayers, Past and Present. Arco Pub. (texte fondateur du système, applicable bien au-delà des échecs).

3. Dixon-Coles修正

二元Poisson模型低估了低比分(0-0、1-0、0-1、1-1)的频率,因为它将两队进球视为独立 — 这在足球中并不完全成立。Dixon-Coles修正(1997)重新校准这四个比分的概率,是当今足球预测学术研究的事实标准。

参考文献 :

  • Dixon, M.J., & Coles, S.G. (1997). Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Journal of the Royal Statistical Society. Series C (Applied Statistics), 46(2), 265-280. DOI · JSTOR

数据来源

不杜撰任何数据,也不非法抓取。Talacote仅使用公开官方或授权来源。完整列表如下。

  • football-data.org — 12项主要赛事(Premier League、La Liga、Bundesliga、Serie A、Ligue 1等)的日程、结果、积分榜、球队统计,通过football-data.org获取 — 公开开放数据。
    football-data.org · 授权 : CC BY 4.0
  • the-odds-api.com — 用于多运营商比较和Value Bet检测的实时博彩公司赔率。已订阅商业计划,无抓取。
    the-odds-api.com · 授权 : 商业API(付费访问密钥)
  • IP地理定位 — 使用ipapi.co(免费、匿名)将Premium价格调整为访客的货币区域。不存储任何IP — 请求实时执行,结果在浏览器中缓存24小时。

技术栈

没有不透明的ML框架。没有在专有数据集上训练的模型。计算在服务器端用PHP(Poisson、ELO)和客户端JavaScript(用于交互)执行。可审计的栈,推理不依赖第三方。

  • WordPress + thème custom child d'Astra (~80 fichiers PHP)
  • PHP 8.x pour les modèles statistiques + l'API REST + le rendu serveur
  • JavaScript vanilla côté client (pas de React, pas de Vue, pas de jQuery global)
  • Stripe Payment Links pour le paiement Premium (PCI-DSS niveau 1, aucune donnée bancaire stockée chez nous)
  • MySQL via le `$wpdb` WordPress (utilisateurs, prédictions cachées, log inscriptions)
  • JSON multilingue pour l'i18n (17 langues, fallback chain langue → FR → EN → clé brute)

已认知的局限

智识诚实:统计模型不是先知。以下是Talacote工具做不到的事情,以及下注前应当谨记的内容。

  1. 伤病和最后一刻事件. 模型基于汇总结果训练。比赛前30分钟宣布的伤病要等到赛季结束才会反映出来。在确认下注之前,请始终查看最新新闻。
  2. 动机背景. 已晋级的球队在赛季末派出替补,动机超越统计平衡的德比 — 模型看不到这些变量。请在其上叠加你的定性判断。
  3. 方差与样本量. 60%的概率意味着在100场可比较的比赛中,约有60场以胜利告终 — 并非这场具体比赛会取胜。方差是游戏的一部分。只下注你能承担损失的金额。
  4. 校准与过度自信. 模型的强度取决于训练数据的质量。在大型赛事(欧洲Big 5)上,模型校准良好。在较小的联赛或较低的级别,样本量较小 — 置信度降低。

Talacote是一个决策支持工具,不是自动投注系统,也不保证盈利。体育博彩存在真实风险。请负责任地玩,限于自己的能力范围,如果感到失控请寻求帮助。

为什么可审计

以上三个模型已在同行评审期刊上发表了25至50年。任何拥有统计学本科背景的人都可以在几个小时内重新实现它们。参考论文如下所列。

如果你是研究人员、记者或学生,希望深入研究(重新实现、与另一模型对比、复现Talacote数字),请通过法律页面联系我们。

滚动至顶部