Neden küçük örneklem yanıltır?
Futbol düşük skorlu bir oyundur ve tesadüfün payı yüksektir. Bir takım tek maçta beklenenin çok üstünde gol atabilir veya bir kaleci olağanüstü bir gün geçirebilir. Bu tek seferlik sapmaları kalıcı bir beceri olarak okumak, analiz yaparken yapılan en yaygın hatadır.
Örneklem büyüklüğü, bir gözlemin kaç tekrara dayandığıdır. Ne kadar çok maç, o kadar az gürültü. Tek maç gürültü; birkaç maç eğilim; bir sezon ise sağlam bir profildir. Bir sayının güvenilirliği, dayandığı maç sayısıyla doğru orantılıdır.
Hangi metrik kaç maçta dengeye oturur?
Tüm metrikler aynı hızda güvenilir hale gelmez. Olayın sıklığı arttıkça metrik daha erken stabilize olur. Şut atmak, gol atmaktan çok daha sık gerçekleştiği için şut tabanlı metrikler daha erken anlam kazanır.
| Metrik | Sıklık | Güvenilirlik hızı |
|---|---|---|
| Şut / xG hacmi | Yüksek | Erken (birkaç maç) |
| xG farkı (xGD) | Orta | Orta dönem |
| Gerçek gol / sonuç | Düşük | Geç (uzun dönem) |
| Kaleci kurtarış oranı | Düşük | Geç ve oynak |
Bu yüzden raporlarda sonuç odaklı sayılar (gol, puan) yerine sürece dayalı sayılar (xG, şut kalitesi) daha erken ve güvenilir sinyaller olarak kullanılır.
Ortalamaya dönüş ne anlama gelir?
Ortalamaya dönüş (regression to the mean), aşırı iyi veya aşırı kötü bir dönemin ardından performansın zamanla kendi gerçek seviyesine yaklaşma eğilimidir. Beklentinin çok üstünde gol bulan bir takımın bu temposunu sürdürmesi istatistiksel olarak zordur.
- Gerçek skoru xG'sinin çok üstünde olan takım, ileride gol veriminde düşüş yaşayabilir.
- xG üretip gol bulamayan takımın golleri zamanla artma eğilimindedir.
- Uç bir kurtarış serisi yakalayan kaleci, ortalamasına dönerken daha fazla gol yiyebilir.
- Bu, 'şanssızlık bitti' demek değil; sürdürülemez sapmanın normale yaklaşmasıdır.
Sık sorulan sorular
Kaç maçlık veri 'yeterli' sayılır?
Metriğe bağlıdır. xG gibi şut tabanlı metrikler birkaç maçta yön verirken, gol ve sonuç gibi düşük sıklıklı veriler için sağlıklı bir profil genelde 10 maç ve üzerini gerektirir.
Sezon başında analiz güvenilir mi?
Sezon başında örneklem küçük olduğu için belirsizlik yüksektir. Bu dönemde önceki sezon verisi ve kadro değişiklikleri ek bağlam olarak kullanılır; güven skoru da bu belirsizliği yansıtır.
Ortalamaya dönüş bir kural mı?
Kesin bir kanun değil, güçlü bir istatistiksel eğilimdir. Uç performanslar genellikle sürdürülemez; ama bir takımın gerçek seviyesi gerçekten yükselmişse ortalaması da yükselir.
Kaynaklar ve ileri okuma
Sample size determination — Wikipedia