Statistiques saison 2008-2009

moyennes-selon-type-du-matchCela faisait un bon moment que je souhaitais rédiger un article bilan de la saison 2008-2009 en termes de statistiques.
Cela m’a pris davantage de temps que je ne le pensais mais je peux vous proposer aujourd’hui quelques résultats intéressants.

Pour cette étude, j’ai souhaité faire un comparatif de quelques joueurs internationaux. J’ai choisi Dick Jaspers, Martin Horn, Marco Zanetti, Torbjorn Blomdahl, Frédéric Caudron, Eddy Merckx, Roland Forthomme.
Les données que j’ai utilisées sont issues des fiches joueurs de Kozoom. Il manque bien entendu des matches (pour moi comme pour les autres) mais les données sont assez significatives pour pouvoir tirer des conclusions.

Plusieurs parties à cette étude statistique:
1) comparatif de moyennes : générale, sur les matches en 50 points, sur les matches en sets
2) proportion des types de matches: 50 points, sets, 40 points
3) répartition des moyennes de chaque joueur en segments de largeur 1/10

moyennes-generales

cliquez sur l’image pour agrandir

D’un point de vue moyenne générale, je termine la saison à 1.491.
Cela me place environ au même niveau que Roland; il me semblait donc judicieux de comparer nos performances.
Le palier supérieur correspond à Martin Horn avec environ 1.600 de moyenne. Marco est légèrement au dessus (1.627) mais il est plus délicat d’en tirer des conclusions en raison d’un nombre de matches joués (plus exactement “utilisés pour l’étude”) bien plus faible que les autres.
Eddy et Torbjörn ont sensiblement la même moyenne générale (1.680) alors que Dick domine avec 1.837 devant Frédéric à 1.751.

Rentrons davantage dans le détail de ces moyennes tout d’abord en décomposant les matches en 2 catégories: ceux en 50 points et ceux qui se jouent en sets.
Le graphe des moyennes est le suivant:

moyennes-selon-type-du-match1

cliquez sur l’image pour agrandir

Un premier constat apparaît: les moyennes sont bien meilleures pour les matches en 50 points que pour ceux en sets. Seul Marco fait exception. (remarque: ma moyenne sur les matches en 40 points est de 1.469 et est donc à rapprocher de celle des matches en sets)

Avant de faire cette analyse chiffrée, j’avoue que ce résultat ne me paraissait pas évident. Je savais qu’il s’appliquait à mon cas mais je ne doutais pas qu’il était quasi général.
On peut bien entendu trouver certaines explications: les matches en sets sont interrompus à la fin de chaque set et par conséquent la série en cours du joueur est stoppée;  le match en 50 points donne le sentiment au joueur d’avoir un peu de temps avant le sprint final et favorise sans doute un peu l’attaque, alors qu’au contraire chaque point de chaque set est ultra important et peut se révéler directement décisif pour le gain du set et, par suite, de la rencontre. A noter que le match en 50 points laisse davantage de temps au joueur pour  rentrer dans la partie que celui en 40 points, qui reste tout de même une distance assez courte.  Il semble donc que le principal avantage procuré par la formule en sets, à savoir le fait de jouer plusieurs fois le point de départ, ne permette pas -loin de là- de compenser les avantages de la formule en 50 points.

Le corollaire de ce constat est donc qu’à niveau équivalent entre 2 joueurs, celui qui disputera le plus grand nombre de matches en 50 points affichera une moyenne générale  supérieure à l’autre.
Voyons donc le graphe de répartition des matches selon leurs types:

repartition-des-matches-par-types

cliquez sur l’image pour agrandir

Vous pouvez remarquer que je suis le seul joueur pour lequel sont comptabilisés des matches en 40 points ( tournois individuels nationaux et première phase du championnat de France Masters). Ce qui ne signifie pas que les autres ne disputent pas de rencontres en 40 points mais l’étude des moyennes étant basée sur les données  Kozoom, il était nécessaire de les prendre en compte.

Il apparaît clairement sur ce graphe qu’avec moins de 30% de matches joués en 50 points, je suis loin derrière tous les autres, le second étant Marco avec 47.62% puis Torbjörn avec 56.76% de matches en 50 points. Roland, Fred et Eddy mais également Martin sont autour de 70%! Cette différence de pourcentage vient directement du fait que ces joueurs participent aux championnats de Hollande et de Belgique par équipes, ce qui leur ajoute 44 matches (s’ils jouent tous les matches) en 50 points.

J’ai aussi voulu étudier un peu plus en détail la répartition des moyennes selon les joueurs en les découpant en segments de 0.100. Un petit coup d’œil sur le graphe suivant sera plus explicite: (les 2 graphes représentent la même chose, seule la présentation est différente)

repartition-moyennes_v1repartition-moyennes_v3

Cliquez sur une image pour l’agrandir

Il apparaît clairement une différence entre ma répartition et celle des autres joueurs: je n’ai aucun match au-delà de 2.300 de moyenne!
Dick a réalisé près de 20% de ses matches à plus de 2.500 de moyenne!!! (14 matches sur 74)
Avec ce découpage, cela correspond à son pourcentage le plus grand. Tout comme Fréd.
Dick réalise même environ 42% de ses parties à plus de 2  de moyenne. Environ 32% pour Fréd. 24% pour Martin. Un peu moins de 15% pour Roland. A peu près 10.5% en ce qui me concerne.

C’est de toute évidence un prochain palier à franchir: être capable de réaliser de très grosses parties.
On constate sur le graphe me correspondant que, globalement, je réalise assez peu de parties loin de ma moyenne générale de 1.491.

C’est ce qui m’amène à évoquer la notion de dispersion des moyennes.
Pour cela, j’ai calculé pour chaque joueur l’écart moyen par rapport à sa moyenne générale pour savoir s’il s’éloigne beaucoup de cette dernière. (exemple de Torbjörn qui a une moyenne générale de 1.680: match contre Jae Ho Cho à 1.487 soit un écart de 0.193; je fais ce même calcul pour tous ses matches puis je fais la moyenne de tous les résultats obtenus).
Ce premier résultat donne déjà un aperçu mais le plus juste et logique est de mettre en relation cet écart moyen avec la moyenne générale : c’est le coefficient de dispersion (écart moyen divisé par moyenne générale). En effet, s’éloigner en moyenne de 0.4 quand on joue à une moyenne générale de 1.8 ne signifie pas la même chose que lorsque l’on joue à 0.800!

Voici donc le graphe correspondant:

dispersion-moyennes

Cliquez sur l’image pour agrandir

On constate que je suis celui qui a le coefficient de dispersion le plus faible à 0.17. Cela signifie qu’en moyenne, sur un match, je m’écarte de 17% par rapport à ma moyenne générale.
Eddy a la dispersion la plus grande, réalisant souvent des parties à moyenne très élevée mais assez régulièrement aussi des parties bien moins bonnes.

Dick, quant à lui, a un coefficient de 0.214, ce qui le situe dans la moyenne par rapport aux autres. La différence est donc qu’il réalise souvent de très grosses parties…mais cela correspond à son niveau moyen!!!

J’ai mis pas mal de temps à établir ces résultats statistiques permettant de me comparer à d’autres joueurs internationaux de premier plan. J’espère que vous aurez trouvé cet article intéressant quoique sans doute un peu trop long…

N’hésitez pas à laisser vos commentaires!

Comments 14

  1. Pas trop long, non ! Très intéressant par contre ! En plus, maintenant que tu as constitué la base de données, il ne suffira plus qu’à l’alimenter pour suivre ces paramètres !!! Et tu le sais bien : Seules les choses mesurables (et mesurées) peuvent être améliorées !
    Juste une remarque: les tableaux sur les moyennes découpées par segments de 100 sont très difficile à lire….
    Je te trouvais un peu trop muet ces derniers temps… Te voilà bien excusé !

    A plus

    1. Bonjour à tous et merci pour vos commentaires

      @JJ: la réalisation d’un tel article prend énormément de temps, tu t’en doutes. Je remettrai sans doute le couvert un de ces jours! Par contre, pour les “tableaux sur les moyennes découpées”, j’aurais pu les afficher dans une taille supérieure mais tout le monde n’a pas un écran avec une résolution importante; et l’intérêt est de pouvoir afficher l’intégralité des graphes sans avoir à scroller verticalement pour avoir une bonne vue d’ensemble. Je ne pouvais donc pas faire mieux..sauf à augmenter la qualité de l’image mais le fichier aurait été trop lourd. T’a pas une loupe au fond de ton tiroir? 😉

      @DM: comme tu dis, “ampleur de la tâche”…. Merci pour le lien!

      @Gillles Hoyer: “je suggérerais en complément une analyse sur la répartition des moyennes (ex: par 1/10ème)par type de match (set ou 50)” N’est-ce pas ce que j’ai fait? Je vous ai peut-être mal compris… Pour ce qui est de votre mail sans réponse, j’ai beau cherché à la fois dans les commentaires et dans les formulaires de contact, je ne retrouve rien à ce sujet… Pourtant, j’ai toutes nos conversations comportant toutes les réponses aux questions que vous avez pu me poser.

  2. Excellent, instructif, belle analyse.
    Je me demande si ça peut être un argument contre les matchs en sets, si toutefois vous, joueurs professionnels, n’êtes pas favorable à cette pratique.

  3. merci jérémy pour cette étude qui sent bon les maths que j’ai moi-même pratiqués il y a bien longtemps en IUT de mesures physiques.

    Rien d’étonnant sur les conclusions de ta démonstration :

    -les parties longues avantagent la moyenne.

    -tu es un joueur des plus réguliers.

    -Marco est un guerrier qui ne joue jamais aussi bien que quand il est menacé.

    -Dick est le plus fort. Hélas, les incertitudes de cette discipline l’empêchent de le confirmer par plus de titres.

    Un seul souhait, te voir atteindre son niveau. Tu n’es pas trés loin…………..

  4. J’avais envisagé de faire un truc comme ça pour Kozoom avec écart type et tout et tout, mais devant l’ampleur de la tâche, j’avais courageusement renoncé :-))))

    Merci, excellent sujet… Ca vaut un lien depuis Kozoom que les gens aillent lire ça.

  5. Analyse pertinente et instructive a bien des égards : je suggérerais en complément une analyse sur la répartition des moyennes (ex: par 1/10ème)par type de match (set ou 50)

    Jusqu’a quelle distance peut-on pousser le raisonnement avnat de voir retomber la MG?

    Dans les années 70 les “honneurs” jouaient en 60

    Merci

    PS : j’aurais aimé que vous répondiez à mon mail qui vous demandait avec combien de systèmes vous jouez et à quel % vous estimez les points calculés sur un match en 50

  6. Interessant et instructif, pas trop long en tout cas.
    Les matchs de l’Agipi tour ont-ils été entrés ?
    En effet, je soupçonne un autre phénomène d’avoir une influence plus forte encore que la distance elle même pour expliquer la diference de moyenne entre les parties en 40 et les parties en 50, il s’agit du niveau des adversaires rencontrés en 40 (nottament en eliminatoires FFB) lesquels seraient logiquement nettement moins fort que ceux affrontés en 50 (Top Ligue, phases finales FFB et …Agipi tour?). Hors, mecaniquement, quand on est en forme tout va bien, en 40 comme en 50, par contre quand ça va moins bien, un fort mettra un point final a notre calvaire plus rapidement (avec un point bleu certes, mais la MG n’en tient pas compte) grace à ça les mauvaises parties pesent donc globalement moins de reprises que contre des joueurs plus faibles lesquels sont moins suceptibles de cloturer un “mauvais match” rapidement et risquent même de ne pas le cloturer du tout.

  7. Bonjour Jérémy,

    Il me semble que non : la moyenne générale de chaque joueur est calculée et répartie dans votre analyse suivant les matchs en 50 ou Set. Il serait interressant de regarder la distribution des moyennes particulières constituant la moyenne générale de chaque joueur en fonction de la nature des matchs joués(graphe vert avec répartition set et 50)
    pour voir par exemple quel type de match à la plus grande proportion de moyenne particulière entre 1,5 et 1,6.
    Ma seconde interrogation reste!
    Je vous souhaite une belle saison sportive (dans les 5 au ranking mondial!!!)

  8. très interessant en effet ces analyses
    je me suis toujours demandé si on pouvait mesurer le degré de qualité de “défense” d’un joueur en calculant la moyenne réalisée par l’adversaire contre un joueur en comparaison de sa moyenne habituelle?
    par contre je suppose que ce demande une base assez fournie de matchs…
    Cdt

  9. @Gilles: effectivement, je n’avais pas poussé jusque là… J’y songerai pour la prochaine fois. Merci de votre remarque.
    Pour votre seconde interrogation:
    je n’utilise que peu de systèmes (environ 5 dont 3 qui ne servent que très rarement). Pour ce qui est du pourcentage, je ne me suis jamais “amusé” à quantifier cela… à vue de nez, je dirais moins de 20%…mais c’est très approximatif; c’est peut-être beaucoup moins!

    @Bastien: salut Bastien! Ta remarque est pertinente. Je pense que ça doit donner une idée, à condition d’avoir un nombre de matches suffisamment important pour que ce soit significatif. Il y en aurait des analyses à faire à partir des moyennes…!

  10. Bravo pour ton analyse très complète.
    Je suis certain que notre grand gourrou de Delphicenter s’inspirera de tes graphes de dispersion pour agrémenter les fiches individuelles.
    Une base telle que Delphi ne demande qu’à être exploitée.

    Il me semble juste que tu as fait une petite erreur en présentant l’écart à la moyenne dans l’exemple. Il me semble que tu cite plutôt l’écart avec l’adversaire.
    Cordialement.

  11. Des stats, enfin un joueur de haut niveau qui aborde les choses scientifiquement, normal cela dit pour un prof de maths.
    Je regrette cependant qu’aucune mention ne soit faite de la moyenne réelle (voir mon article dans le livre de Caudron) et qu’on utilise encore cette “moyenne” sans fondement mathématique, qui d’une part, rappelons-le, ne tient pas compte du joueur ayant débuté la partie et donc du nombre réel de reprises jouées par le perdant, et qui d’autre part fausse les écarts réels entre les joueurs.
    Cette étude va dans le bon sens mais il faudrait l’approfondir et la préciser pour qu’elle devienne autre chose qu’un article, sympathique au demeurant.

Leave a Reply

Your email address will not be published. Required fields are marked *