top of page

COMMUNAUTE FORGERON FR
"Sur tous les matchs que l'on gagne, on en perd aucun !"
explication du classement glicko
par birdace
Après un premier article en présentant les résultats, c’est le moment de vous expliquer la méthode derrière le classement « Glicko-2 » et ses applications possibles.
Glicko, quésaco ?
Certains d’entre vous connaissent peut-être le classement Elo, un système d’évaluation créé en 1960 par le professeur de physique Arpad Elo pour estimer la force des joueurs d’échec.
Le principe est d’attribuer un nombre de « points Elo » à chaque joueur selon ses performances passées puis de faire augmenter ou diminuer ce total après chaque match de manière proportionnelle à l’écart de classement entre les deux adversaires. Un joueur obtiendra ainsi plus de points en remportant une victoire contre un adversaire mieux classé que lui.
Prenons comme exemple chiffré un joueur A avec un Elo de 2160 affrontant un joueur B avec un Elo de 2405. Une victoire du joueur A le ferait passer à 2184 (+24 points) alors qu’il descendrait « seulement » à 2154 (-6 points) en cas de défaite. Si la rencontre se conclue par un match nul, c’est aussi lui qui en sortirait gagnant (+9 points).
Ce système s’est répandu à d’autres disciplines comme le jeu de go ou certains jeux vidéo compétitifs (League of Legends, Overwatch) mais également au sein de Magic pendant longtemps avant d’être remplacé par les « Planeswalker Points » correspondant mieux à l’utilisation que veux en faire Wizards of the Coast. Le classement continue tout de même d’exister via l’excellent site www.mtgeloproject.net.
Le classement Glicko que j’utilise est une amélioration du Elo qui ajoute un paramètre d’écart-type permettant de mesurer la fiabilité de l’évaluation. Plus un joueur a de matchs à son compteur, plus le système se considère comme sûr de son niveau. A l’inverse, l’incertitude augmente après une période d'inactivité. Un joueur avec un classement de 2160 et un d’écart-type de 78 est estimé avoir une force réelle comprise entre 2082 et 2238 avec une probabilité de 95 %.
Utiliser cette formule permet donc de plus ou moins récompenser un joueur selon les adversaires rencontrés là où le pourcentage de victoires est « aveugle » à ce paramètre. Place à quelques exemples d’applications.
Kanzan > Birdace
L’utilisation qui vient en premier à l’esprit est de pouvoir comparer le niveau de plusieurs joueurs et c’est bien l’usage historique à MtG. On a de la chance en Forgeron d’avoir archivé les résultats en tournoi depuis le début, une vraie mine d’information. C’est moins le cas concernant les matchs « amicaux » mais on préfère de toute façon prendre en compte uniquement les rencontres réalisées dans un cadre compétitif.
Si on applique cette méthode aux différents formats de Forgeron (Forgeron « Classic », Forgebrawl, Forgecube, Tribal Wars, Trufflesnout, Forgeron Equipe) et que l’on filtre sur les joueurs avec 20 games ou plus à leur actif, on obtient le classement suivant :
On a Segailla en roi des forgerons MAIS attention à la colonne « Deviation » qui indique une forte incertitude sur la note réelle (de par le manque de données et/ou les adversaires affrontés) qui se situerai donc entre 2486,8 et 2828,2. Une hypothèse basse un peu extrême mais qui le placerai 5ème, par exemple.
Ça met aussi en avant un défaut potentiel du système, la note ne diminue pas avec le temps. Ce qui explique la présence de noms que l’on n’a plus vu depuis longtemps. C’est à ça que sert la colonne « Lag » qui indique le nombre de rounds de tournois disputées depuis la dernière participation. On a donc l’option de filtrer sur une valeur maximale pour n’afficher que les participants récents.
A noter aussi qu’il y a plus de joueurs au-dessus de la moyenne (la barre de séparation noire) qu’en-dessous. C’est logique puisque ceux qui persistent dans le format (et donc passent le seuil des 20 games) sont ceux qui réussissent le mieux (biais des survivants) ou dont le taux de victoire va grimper au fur et à mesure de la montée en expérience.
Si on se penche sur la relation entre le classement Glicko et le pourcentage de victoire, on observe que celle-ci est très élevé mais certains cas particuliers apparaissent tout de même, notamment Segailla évoqué plus tôt. Les forgerons au-dessus de la droite ont un winrate supérieur à ce que leur Glicko laisserait penser et inversement.
Avant de passer à la suite, un mot sur le classement prenant en compte uniquement les tournois en Forgeron BO3 dit « Classic » (uniquement par moi mais chut…) qui est un peu l’épreuve reine. En tout cas, c’est intéressant de le séparer de formats plus « funs » ou en limité qui font appel à des qualités différentes. Et il se trouve que l’on a assez d’historique pour que ça soit viable aussi (à l’inverse du Trufflesnout et de son unique occurrence, au grand regret de Bôf).
Ça n’a cependant rien à voir avec de quelconques menaces de la part de Kanzan, lui qui a enfin détrôné L3oL3 et ses 81,8% de winrate (!!) après une série de 10 victoires consécutives sur les deux derniers tournois. Il n’a même goûté que deux fois à la défaite en 2021, les deux fois contre Bocchi armé de Izzet Drakes.
Informations datant d’avant le tournoi du 25/04/2021.
David Méta
Il était une fois l’histoire d’un enfant d’une gaieté si communicative que les rires résonnaient systématiquement dans son sillage. Adoré de ses camarades, il ne manquait jamais de partenaire de jeu. Ça tombait bien puisque le prénommé David adorait tout ce qui avait attrait au jeu mais s’il en existait un qui accaparait tout particulièrement son esprit : Magic The Gathering. Alors oui, peut-être qu’il ne connaissait pas toutes les règles mais ça ne l’avait jamais empêché de s’amuser. En tout cas, jusqu’à ce jour funeste où il perdit son innocence…
C’était une semaine après son arrivé au lycée et il avait convaincu deux de ses amis de longue date de rejoindre avec lui l’association dédié à son jeu de cartes préféré. Mais, lui qui était tellement excité à l’idée de se faire de nouveaux compagnons de jeu, ne put qu’assister sans puissance à l’humiliation de ses camarades par les magiciens chevronnés, et un brin sadiques, du club. Son tour arriva ensuite mais il ne fit pas plus illusion devant les decks bien mieux construits et puissants de ses adversaires du jour. Ce n’est pas la défaite qui le marqua mais les remarques désagréables des joueurs plus âgés qui redoublèrent d’insultes et de quolibets.
En sortant de la salle, ses amis avaient perdu le goût de jouer à Magic. Ils laissèrent tomber au sol leurs decks et rentrèrent chez eux, la tête basse. David tomba à genoux devant le tas de cartes abandonnées et se fit alors une promesse : plus jamais il ne perdrait un match à cause de son choix de deck.
De longs mois durant il ne quitta plus sa chambre, développant un système permettant de noter les différents archétypes existants. Finalement, ses recherches terminées, l’heure de la vengeance avait sonné. Armé de son nouveau deck « approuvé scientifiquement », il retourna à son école. Les membres du club de l’avait pas oublié et c’est par un nouveau flot d’insultes, plus ou moins inventives, qu’il fut accueilli. Mais David ne se laissa pas démonter et rétorqua, la tête haute : « Qui de vous veut se faire éclater en premier ? ». Les sourires disparurent, l’atmosphère devint électrique. Puis David perdit tous ses matchs car il n’était juste pas très bon…
THE END
De la même manière qu’avec les joueurs, il est possible de prendre en compte l’historique des confrontations entre les différents archétypes pour établir un classement. La méthode est donc exactement la même sauf que je rajoute les parties disputées en « amical ».
Sans plus attendre, voilà ce que ça donne :
Il y a donc 41 archétypes avec au moins 25 matchs au compteur avec pas mal de variété dans le style et les colorités. Deux decks se sont échappés (Izzet Drakes et Boros Cycling) suivi de Selesnya Aura puis d’un nouvel écart assez important avant un groupe de 4 autres decks (4C Gates, MonoU Tempo, MonoW Aura et Golgari Food) en poursuivants si on continue la métaphore cycliste.
On a ensuite les premières surprises avec MonoR qui affiche même un winrate de 67,1% (mais avec seulement 9 victoires sur 53 contre des decks du top 7 de ce classement), Simic Ondins capable de sorties boule de neige ou le récent Esper Party.
A l’inverse, les decks Sacrifice sous-performent peut-être par rapport à ce qu’on imagine être leur place mais on les projette sans doute trop haut à cause de leurs performances récentes dans d’autres formats.
On peut aussi citer MonoB Zombies qui a créé une certaine effervescence après 2 victoires assez rapprochées en tournoi avant de voir son winrate chuter après une série de matchs contre des matchups moins favorables.
Est-ce qu’il serait intéressant de cumuler les deux modèles pour pondérer le classement des joueurs selon le niveau du deck utilisé ? Clairement. Est-ce que je bosse déjà dessus ? Du calme !
Le poids des mots, le choc des photos
Pour finir en douceur après ce pavé de texte, voilà quelques images pour présenter ces données sous un angle différent. On peut visualiser l’évolution du classement d’un joueur au fil du temps.
Et c’est également vrai pour les archétypes.
Ça permet notamment de mettre en contexte un classement qui dénote avec le pourcentage de victoire historique mais s’explique par une tendance plus ou moins récente.
Merci d'avoir lu jusqu’ici et à bientôt pour un nouvel article !
Birdace







bottom of page