[Home] - [About
us] [Termine] [Anlage]
[Training] [Tabellen]
[Sponsoren] [Gäste]
[Album] [Rangliste]
[Links]
Die Buschkrug-Elo
[Problem] [Ziel] [Lösung]
[Einfordern] [Regulär
Fordern] [Eintragen] [Bedeutung]
[Formeln] [Bemerkungen]
Squash in den Mai 2002 im Fit-Fun hat es zum wiederholten Male gezeigt: die
Deutsche als auch die Berliner Rangliste haben wenig Aussagekraft. Gerade die
Berliner Rangliste konnte man bisher leider nie erst nehmen (sorry Alex).
Wir möchten ein Berlin-weites Ranglisten-System schaffen, das die Spielstärke
repräsentiert und nicht "Turnier-Fleiß" und "Freilos-Quote". Unsere hausinterne
Rangliste befand sich durch den Aufstieg in die 2. Bundesliga und die
Kooperation mit mehreren Anlagen in einer Neuorientierung. Daher sollten
Spielstärken nicht nur intern, sonder auch zwischen anderen Anlagen und Vereinen
vergleichbar sein. Ranglisten in Gruppeneinteilung schienen uns zu unflexibel.
Die Wahl fiel auf die vom Schach bekannte Bewertung durch die Elo-Zahl.
Im Schach-Bereich macht dieses ausgereifte System schon seit Jahrzehnten Spieler
weltweit vergleichbar. In vielen anderen Sportarten wurde diese
Bewertungsmethode bereits erfolgreich adaptiert. Computerunterstützung macht das
mathematisch etwas kompliziertere System auch in der Praxis leicht handhabbar.
Die auf Prof. Arpad Elo zurückgehende Stärkekennziffer verschiebt bei völlig
freien Spielerpaarungen Punkte vom Verlierer zum Gewinner entsprechend der
Differenz zum erwarteten Ergebnis. Der Erwartungswert wird aus der bisherigen Elo-Zahl der Spieler ermittelt. Daraus kann die neue Elo-Zahl und das neue
Ranking direkt nach jedem Spiel z.B. in einer Excel-Tabelle neu berechnet
werden. Um mitzumachen muss also kein Spieler unbedingt wissen wie die Formel
lautet. Wer sich aber doch genauer dafür interessiert findet
hier die verwendeten Formeln. Ansonsten kann ich folgende externe Links
empfehlen:
Das System unterscheidet zwei Sorten von Forderungsspielen: Das initiale
Einfordern und das reguläre Forderungsspiel. Eine erste
Buschkrug-Elo erhält man durch Einfordern. Ist der Fordernde siegreich, kommt er
mit der gleichen Buschkrug-Elo wie sein besiegter Gegner in die Rangliste. Der
Fordernde kann beliebig Einforderungsversuche mit verschiedenen Gegnern
probieren, bis er erfolgreich ist. Die Punkte der Geforderten werden beim
Einforderungsspiel in keinem Fall beeinflusst.
Ansonsten lebt die Rangliste von möglichst vielen freien Forderungsspielen.
Es gibt keine Beschränkung der Forderungsmöglichkeiten. Stattdessen darf
der Geforderte die Forderung ein Mal ablehnen und kann einen "Getränkeeinsatz"
verlangen. Der Verlierer muss, entsprechend der Differenz zur Erwartung, Punkte
an den Gewinner abgeben (siehe Formeln). Forderungsspiele
können beliebig oft wiederholt werden. Unsere Empfehlung: Beim Training
Forderungsspiel vorher vereinbaren und sonst offizielle Begegnungen immer als
Forderungsspiel werten.
Unsere Website soll noch ein Interface bekommen, mit dem autorisierte
"Sportwarte" anderer Vereine die Ergebnisse der Forderungsspiele direkt
eintragen können. So lange müssen diese noch per email an
Micha.
Wer eine höhere Buschkug-Elo hat sollte auch der stärkere Spieler sein. Aber
um wie viel stärker? Die Buschkrug-Elo ist wie beim Schach so normiert, dass
eine Differenz von 200 jeweils einen "Klassenunterschied" bedeutet. Mathematisch
heißt das, die Siegerwartung liegt bei 25% für den schlechteren Spieler. Er
sollte also 1 von 4 Begegnungen für sich entscheiden. Jede weiteren 200 Punkte
multiplizieren diese Wahrscheinlichkeit. Bei einer Differenz von 400
Buschkrug-Elo liegt die Gewinnquote demnach bei 25%*25%=6,25%. Eine Differenz
von 1000 Buschkrug-Elo besagt also, dass der schwächere Spieler theoretisch nur
eines in 1024 Matches bzw. 0,25 hoch 5=0,098% gewinnen würde. Die Elo-Zahl ist
also nicht irgendeine Zahl, sondern hat eine genau definierte
Wahrscheinlichkeits-Aussage.
| Buschkrug-Elo (circa) |
Spielklasse (Herren) |
Spielklasse (Damen) |
| 400
|
kann kaum Schläger halten |
Anfängerin |
| 800
|
Anfänger im Verein |
Oberliga |
| 1000
|
Landesliga |
| 1200
|
Verbandsliga (in Berlin gibt es
nur Landesliga) |
Regionalliga |
| 1400
|
Oberliga |
| 1600
|
Regionalliga |
Bundesliga |
| 1800
|
2. Bundesliga |
| 2000
|
1. Bundesliga |
Weltelite |
| 2500
|
Weltelite (Großmeister) |
| Berechnung der neuen Elo |
Eloneu = Eloalt+
D · (Erggespielt
- Ergerwartet) |
| Erwartungswert |
Ergerwartet = 0,5 hoch (-EloDelta/K+1);
falls EloDelta negativ Ergerwartet
= 1-(0,5 hoch EloDelta/K+1); falls EloDelta
positiv |
| Elo-Differenz |
EloDelta = Eloselbst
- EloGegener |
| Ergebnis |
Erggespielt := 1 bei
gewonnen; 0 bei verloren |
| Klassendifferenz |
K := 200 |
| Dynamik |
D := 50 |

Abb. 1: Erwartetes Ergebnis über
der Differenz der Buschkrug-Elo. Durch diese Gewichtung erhält der schwächer
bewertete Spieler mehr Punkte im Falle eines unwahrscheinlicheren Sieges als bei
dem wahrscheinlicheren Sieg des stärker bewerteten. Auf lange Sicht soll die
Zahl über der Punktedifferenz der Spieler ihrem Spielverhältnis entsprechen.
- Die Formeln basieren auf folgender Annahme: Wenn A gegen B
25% gewinnt und B gegen C 25% gewinnt, dann sollte A
gegen C etwa 6,25% gewinnen (25%*25%). A, B und C unterscheiden sich
jeweils um eine Klasse. Dies scheint beim Schach zu stimmen. Für Squash macht
es zumindest den Eindruck als könnte es ungefähr ähnlich sein. Ggf. werden wir
die Wahrscheinlichkeitsverteilung und die Klassendifferenz anpassen müssen.
- Für welche Sportarten ist die Elo-Zahl geeignet? Im Prinzip für
alle. Doch die hier verwendete geometrische Wahrscheinlichkeitsverteilung
passt nur für Sportarten mit vernachlässigbar geringem "Zufallsgrad". Janghir
Kahn war fast eine ganze Generation lang ungeschlagen Weltmeister, Hansi Wiens
dominierte jahrelang die deutsche Squashszene. Ähnlich statisch ist sonst nur
Schach und Go. Für eine Fußball-Rangliste, generell wohl bei
Mannschaftssportarten, müsste eine andere Verteilung eingesetzt werden. Auch
für Skat, Poker oder Backgammon würde man eine deutliche Zufallskomponente
erwarten, mit der auch viel schwächere Spieler immer noch eine gewisse
Gewinnchance haben. Je geringer der Zufallsgrad, desto gesicherter ist der
Erwartungswert und damit umso präziser die Elo-Methode.
- D ist der "Dynamik-Faktor". Je häufiger gespielt wird und je
sicherer damit die Elo-Werte sind, desto kleiner kann D gewählt werden.
Fällt die Performance eines Spielers stark aus der durch die Elo-Zahl
repräsentierte Erwartung, existieren beim Schach Sondermethoden und
Gewichtungsregeln, die aber sehr kompliziert sind. Wir probieren es erstmal
mit konstant D=50. In Zukunft könnte eine flexible Zuordnung kommen.
- Schwächen: Das Elo-System funktioniert schlecht, wenn die
Anfangschätzung unpassend war, Spieler ihre Stärke schnell verändern, selten
spielen oder überwiegend gegen deutlich schwächere, deutlich stärkere oder
immer den selben Gegner spielen.
Bemüht Euch also, schon beim Einfordern etwa realistische Elo-Werte zu
erreichen und regelmäßig gegen verschiedene, ebenbürtige Spieler anzutreten.
- Der Durchschnitt über alle Spieler hängt davon ab, wie stark die
Spieler sind, die mitmachen. Er sollte aber etwa konstant bleiben, damit die
Normierung mit K=200 für einen Klassenunterschied passt und ein normierter
Vergleich der Elozahl über der Zeitachse möglich ist. Bundesliga sollte wie
beim Schach im 2000er Bereich liegen, Weltelite (Großmeister) bei 2500 Elo.
Gegebenenfalls müssen wir also etwas umskalieren.
- Damen: Beim Schach gibt es zwar wenige, aber in der Spielstärke zum Teil mit den
Herren vergleichbare Damen. Beim Squash erwarten wir zunächst 1-3 Klassen
Differenz.
- Größte und kleinste Elo-Zahl: Die Elo-Zahl ist im Prinzip nach oben offen. Ein "perfekter" Spieler mit
100% Gewinnsicherheit könnte theoretisch sehr langsam aber sicher eine
unendliche Elo-Zahl erreichen. Aber niemand ist perfekt. Beim Schach erreichte
Garry Kasparow mit 2800 Elo-Punkten die höchste je erlangte Wertung. Genauso
wie Spieler prinzipiell beliebig stark werden können, können andere beliebig
schwach sein. Es existiert also auch nach unten keine Grenze. Doch etwa 400 Elo-Punkte heißen beim Schach "kann kaum die Figuren richtig ziehen". Mal
sehen, ob wir vergleichbare Werte beim Squash haben werden...
- Crossover-Vergleich: Auch wenn in den jeweiligen Anlagen die Spieler eher untereinander
spielen, reichen relativ wenige übergreifende Vergleichsspiele für eine faire
Punkteverteilung. Es gibt wissenschaftliche Analysen, wie viel dieser
"Diffusion" tatsächlich nötig ist. Beim Schach funktioniert das in der Praxis
sehr gut und macht beispielsweise Schweizer auch mit Russen vergleichbar,
obwohl viel mehr Russen viel häufiger Schach spielen. Selbst Schachcomputer
lassen sich in die Rangliste einreihen und
treten bei Turnieren gesetzt mit ihrer Elo-Zahl an.
- Ist Elo optimal? Auch das Elo-System ist keineswegs optimal. Auf der Suche nach einer
optimalen Schätzung der Rangfolge müsste man nach der Maximum Likelyhood
Methode (optimale Methode aus der Statistik) die Rangfolge wählen, die für die
Stichprobe der Spielergebnisse die geringste Differenz vom Erwartungswert
liefert. Hierfür gibt es keinen polynomiellen Algorithmus (Fachbegriff für
"einfachen" Algorithmus), obwohl eine nicht-polynomielle Berechnung mit
heutigen Rechnern wahrscheinlich schon möglich wäre. Mal sehen ob ich an einem
ruhigen Wochenende mal sowas programmiere... Allerdings wäre solch ein
Algorithmus dann wirklich nicht mehr von Außenstehenden zu verstehen. Kurzum,
Elo ist eine anerkannte und erprobte Näherung mit vertretbarem Aufwand und
zumutbarer Transparenz (soll heißen "Verstehbarkeit").
Erstellt:
Peter Ibach,
10.05.2002. Letzte Änderung:
Peter Ibach,
23.10.2003