Bloga dönVeri Sözlüğü

Örneklem büyüklüğü: futbol verisinde kaç maç anlamlı sayılır?

Küçük örneklemin neden yanıltıcı olduğunu, hangi metriğin kaç maçta dengeye oturduğunu ve ortalamaya dönüş kavramını futbol verisi üzerinden öğrenin.

Neden küçük örneklem yanıltır?

Futbol düşük skorlu bir oyundur ve tesadüfün payı yüksektir. Bir takım tek maçta beklenenin çok üstünde gol atabilir veya bir kaleci olağanüstü bir gün geçirebilir. Bu tek seferlik sapmaları kalıcı bir beceri olarak okumak, analiz yaparken yapılan en yaygın hatadır.

Örneklem büyüklüğü, bir gözlemin kaç tekrara dayandığıdır. Ne kadar çok maç, o kadar az gürültü. Tek maç gürültü; birkaç maç eğilim; bir sezon ise sağlam bir profildir. Bir sayının güvenilirliği, dayandığı maç sayısıyla doğru orantılıdır.

Bir maç bir kanıt değildirBir takımın tek maçta 3.0 xG üretmesi, o takımın 'her maç böyle üretir' anlamına gelmez. Tek gözlem yön gösterir, hüküm vermez.

Hangi metrik kaç maçta dengeye oturur?

Tüm metrikler aynı hızda güvenilir hale gelmez. Olayın sıklığı arttıkça metrik daha erken stabilize olur. Şut atmak, gol atmaktan çok daha sık gerçekleştiği için şut tabanlı metrikler daha erken anlam kazanır.

Metriklerin yaklaşık stabilize olma hızı (genel eğilim)
MetrikSıklıkGüvenilirlik hızı
Şut / xG hacmiYüksekErken (birkaç maç)
xG farkı (xGD)OrtaOrta dönem
Gerçek gol / sonuçDüşükGeç (uzun dönem)
Kaleci kurtarış oranıDüşükGeç ve oynak

Bu yüzden raporlarda sonuç odaklı sayılar (gol, puan) yerine sürece dayalı sayılar (xG, şut kalitesi) daha erken ve güvenilir sinyaller olarak kullanılır.

Ortalamaya dönüş ne anlama gelir?

Ortalamaya dönüş (regression to the mean), aşırı iyi veya aşırı kötü bir dönemin ardından performansın zamanla kendi gerçek seviyesine yaklaşma eğilimidir. Beklentinin çok üstünde gol bulan bir takımın bu temposunu sürdürmesi istatistiksel olarak zordur.

  • Gerçek skoru xG'sinin çok üstünde olan takım, ileride gol veriminde düşüş yaşayabilir.
  • xG üretip gol bulamayan takımın golleri zamanla artma eğilimindedir.
  • Uç bir kurtarış serisi yakalayan kaleci, ortalamasına dönerken daha fazla gol yiyebilir.
  • Bu, 'şanssızlık bitti' demek değil; sürdürülemez sapmanın normale yaklaşmasıdır.
Metodolojinin özüİyi bir analiz, küçük örneklemden kesin sonuç çıkarmaz ve uç dönemlerin ortalamaya döneceğini hesaba katar. Bu, güven skorunun neden veri yeterliliğine bağlı olduğunu da açıklar.

Sık sorulan sorular

Kaç maçlık veri 'yeterli' sayılır?

Metriğe bağlıdır. xG gibi şut tabanlı metrikler birkaç maçta yön verirken, gol ve sonuç gibi düşük sıklıklı veriler için sağlıklı bir profil genelde 10 maç ve üzerini gerektirir.

Sezon başında analiz güvenilir mi?

Sezon başında örneklem küçük olduğu için belirsizlik yüksektir. Bu dönemde önceki sezon verisi ve kadro değişiklikleri ek bağlam olarak kullanılır; güven skoru da bu belirsizliği yansıtır.

Ortalamaya dönüş bir kural mı?

Kesin bir kanun değil, güçlü bir istatistiksel eğilimdir. Uç performanslar genellikle sürdürülemez; ama bir takımın gerçek seviyesi gerçekten yükselmişse ortalaması da yükselir.

Kaynaklar ve ileri okuma

Sample size determination — Wikipedia

Regression toward the mean — Wikipedia

Understat — Sezonluk xG ve performans verisi

Maç Strateji Analiz EkibiVeri bilimi & futbol analiziMaç Strateji Analiz Ekibi; veri bilimi, istatistiksel modelleme ve futbol analitiği üzerine çalışan analistlerden oluşur. xG, Poisson dağılımı, beklenen puan (xPts), PPDA ve piyasa verisi gibi metrikleri raporlara dönüştürür. İçerikler kamuya açık veri standartları (FBref, Understat, StatsBomb) referans alınarak hazırlanır.

Dijital analiz içeriği. Raporlar sonuç, gelir veya karar garantisi içermez; üçüncü taraf platforma yönlendirme yapılmaz.