← Retour au blog

Le premier mot parfait au Wordle n’existe pas : la preuve mathématique

C’est la question qui obsede tous les joueurs de Wordle : quel est le meilleur premier mot ? Des millions de discussions en ligne, des articles de presse, des analyses informatiques ont tenté d’y répondre. RAINE, SUERA, TAIRE, CRANE, ADIEU... Les candidats ne manquent pas, et chacun a ses défenseurs passionnés. Mais la vérité mathématique est plus subtile, et probablement plus fascinante, que n’importe quelle réponse définitive : le premier mot parfait, universellement optimal, n’existe pas. Et on peut le prouver.

🎮 Jouer au Wordle

Pourquoi la question semble avoir une réponse

L’intuition suggère qu’un mot de départ devrait maximiser la quantité d’informations obtenues. On connaît la fréquence des lettres en français, on connaît la liste des mots possibles : il devrait suffire de calculer quel mot élimine le plus de candidats en moyenne. Plusieurs chercheurs et programmeurs ont fait exactement ce calcul, et ils ont obtenu... des résultats différents.

Ce désaccord n’est pas un problème de calcul. Les algorithmes sont corrects. Le problème est plus fondamental : la notion même de « meilleur premier mot » dépend de critères qui ne sont pas universels. Et c’est là que les mathématiques deviennent passionnantes.

La théorie de l’information et l’entropie de Shannon

Pour comprendre pourquoi le mot parfait n’existe pas, il faut d’abord comprendre comment on mesure la qualité d’un premier mot. L’outil principal est l’entropie de Shannon, un concept fondamental de la théorie de l’information inventé par Claude Shannon en 1948.

L’entropie mesure la quantité d’incertitude dans un système. Au Wordle, avant le premier essai, l’incertitude est maximale : le mot cible peut être n’importe lequel de la liste. Après le premier essai, les indices (lettres vertes, jaunes, grises) réduisent cette incertitude. Un bon premier mot est un mot qui, en moyenne, réduit le plus cette incertitude.

Mathématiquement, l’entropie d’un essai se calcule ainsi : pour chaque pattern de couleurs possible (vert-gris-jaune-gris-vert, par exemple), on calcule la proportion de mots candidats qui produiraient ce pattern. L’entropie est la somme des -p × log2(p) pour chaque pattern, où p est la probabilité d’obtenir ce pattern. Plus l’entropie est élevée, plus le mot divise efficacement les candidats en groupes égaux, et plus il est informatif.

Le problème des 243 patterns

Avec cinq positions et trois couleurs possibles par position (vert, jaune, gris), il existe 3&sup5; = 243 patterns théoriques pour chaque essai. Mais tous ne sont pas également probables. Un mot idéal répartirait les mots candidats uniformément entre ces patterns. En pratique, aucun mot n’y parvient. Certains patterns concentrent des centaines de candidats tandis que d’autres n’en contiennent que quelques-uns. C’est cette inégalité de distribution qui rend impossible l’existence d’un mot universellement parfait.

Les trois objectifs incompatibles

Le cœur du problème est que les joueurs de Wordle poursuivent des objectifs différents, même s’ils n’en sont pas toujours conscients. Et ces objectifs sont mathématiquement incompatibles.

Minimiser le nombre moyen d’essais

Le premier objectif est le plus intuitif : trouver le mot en aussi peu d’essais que possible, en moyenne. Un mot de départ qui mène à une moyenne de 3,42 essais est meilleur qu’un mot qui mène à 3,51. Pour cet objectif, les analyses informatiques ont identifié des candidats solides. En français, des mots comme TAIRE ou RAINE performent généralement bien, car ils combinent des voyelles fréquentes (A, I, E) avec des consonnes répandues (T, R, N).

Minimiser le pire cas

Le deuxième objectif est différent : s’assurer de toujours trouver le mot, même dans le scénario le plus défavorable. Un joueur qui vise cet objectif préfère un mot de départ garantissant de trouver en 5 essais maximum, même si sa moyenne est de 3,6, plutôt qu’un mot avec une moyenne de 3,4 mais qui échoue parfois en 6 essais. Cette approche, inspirée de la théorie des jeux (stratégie minimax), favorise des mots différents.

Maximiser la probabilité de trouver en un ou deux essais

Le troisième objectif est celui du joueur audacieux : maximiser les chances de résolutions éclairs. Pour trouver en deux essais, le premier mot doit être un mot susceptible d’être lui-même la réponse (contrairement à un mot « explorateur » qui n’est jamais la cible) et qui, en cas d’échec, génère des patterns très discriminants. Cette approche favorise des mots courants et centraux dans le dictionnaire.

Le point clé est que le mot optimal pour chacun de ces trois objectifs n’est pas le même. Il n’existe aucun mot qui soit simultanément le meilleur pour la moyenne, le meilleur pour le pire cas et le meilleur pour les résolutions rapides. C’est une impossibilité mathématique.

Le problème de la liste de mots

Même si l’on fixe un objectif unique, le mot optimal dépend encore d’un paramètre crucial : la liste de mots cibles. Et c’est un problème plus épineux qu’il n’y paraît.

Le Wordle original de Josh Wardle utilisait une liste soigneusement curée de mots anglais courants. Le Wordle français utilise une liste différente, qui varie selon les implémentations. Chaque modification de cette liste - ajouter un mot, en retirer un, changer les pondérations - modifie le mot de départ optimal. Un mot qui est le meilleur pour une liste de 2 000 mots cibles ne sera pas nécessairement le meilleur pour une liste de 3 000 mots.

Cette dépendance à la liste est fondamentale. Elle signifie que quiconque affirme avoir trouvé « le meilleur mot » devrait préciser : le meilleur mot pour cette liste spécifique, selon ce critère spécifique. L’universalité est une illusion, comme le montrent les travaux de linguistique computationnelle appliquée au Wordle.

🎮 Jouer au Wordle

L’analyse des candidats français

Malgré l’impossibilité d’un mot parfait, certains mots sont objectivement meilleurs que d’autres. Voici une analyse des candidats les plus discutés pour le Wordle français.

TAIRE

Contient T, A, I, R, E : trois voyelles parmi les plus fréquentes et deux consonnes dominantes. Son entropie est élevée car ces lettres apparaissent dans une très large proportion des mots français de cinq lettres. Sa faiblesse : aucune consonne rare, donc les patterns obtenus laissent parfois de grands groupes de candidats indifférenciés.

SUERA

Contient S, U, E, R, A : remplace le I et le T par un S et un U. Le S est la consonne la plus fréquente en début de mot français, et le U est précieux pour identifier les combinaisons QU- et les mots en -URE. Compétitif avec TAIRE sur la plupart des métriques, mais légèrement inférieur pour le pire cas.

RAINE

Contient R, A, I, N, E : remplace le T de TAIRE par un N. Le N est extrêmement fréquent en fin de mot français (-TION, -AIN, -EN). Ce mot excelle pour identifier les terminaisons courantes mais sacrifie le T, essentiel pour les mots en T- et les formes verbales en -TE.

CRANE

Contient C, R, A, N, E : introduit le C, une consonne moins fréquente mais très discriminante. Quand le C est présent, il élimine massivement les candidats. Quand il est absent, il élimine aussi un bon nombre de mots. Ce pouvoir de discrimination compense la moindre fréquence globale du C.

Aucun de ces mots n’est objectivement supérieur aux autres dans tous les scénarios. Le choix entre eux dépend de votre stratégie, de votre gestion des essais suivants, et même de votre intuition personnelle. Les mots trompeurs et homophones du Wordle français ajoutent une couche de complexité supplémentaire que les analyses purement statistiques ne capturent pas toujours.

La stratégie adaptative : mieux qu’un mot parfait

Si le mot parfait n’existe pas, qu’est-ce qui différencie un joueur moyen d’un joueur expert ? La réponse n’est pas dans le choix du premier mot, mais dans la stratégie globale.

Les recherches en théorie de l’information montrent que la différence de performance entre le meilleur et le dixième meilleur premier mot est de l’ordre de 0,05 essai en moyenne. C’est négligeable. En revanche, la différence entre une bonne et une mauvaise stratégie pour les essais suivants peut atteindre un essai complet. Autrement dit, ce que vous faites après le premier mot importe vingt fois plus que le premier mot lui-même.

La stratégie adaptative optimale consiste à :

Ce que Shannon nous apprend sur le Wordle

L’impossibilité du mot parfait illustre un principe fondamental de la théorie de l’information : il n’existe pas de code universellement optimal indépendant de la source. L’efficacité d’un outil de communication (ou d’un mot de départ) dépend toujours du contexte dans lequel il est utilisé. Shannon l’avait démontré en 1948 pour les télécommunications. Le Wordle le rend tangible pour des millions de joueurs.

Comme l’explore notre article sur le Wordle et les neurosciences, le cerveau humain excelle précisément là où les algorithmes fixes échouent : dans l’adaptation contextuelle. Un joueur humain intègre inconsciemment des facteurs que l’entropie pure ne capture pas : la « plausibilité » d’un mot, les habitudes du créateur de la liste, les mots récemment utilisés. Cette intelligence adaptative est ce qui rend le Wordle si satisfaisant : il récompense non pas la connaissance d’un fait unique (« le meilleur mot »), mais une compétence continue de raisonnement.

Libéré de la quête du mot parfait

La preuve mathématique de l’inexistence du mot parfait est, paradoxalement, une libération pour le joueur de Wordle. Vous n’avez pas à trouver le mot ultime. Vous n’avez pas à angoisser sur votre choix initial. N’importe quel mot parmi la dizaine de meilleurs candidats fera l’affaire. Ce qui compte vraiment, c’est ce que vous faites ensuite : la rigueur de votre raisonnement, la qualité de vos déductions, votre capacité à naviguer dans l’incertitude.

Le Wordle n’est pas un jeu de réponse unique. C’est un jeu de processus. Et aucun algorithme, aucune formule, aucun mot magique ne remplacera jamais le plaisir de raisonner soi-même, essai après essai, vers la solution.

À lire aussi

← Retour au blog Jouer au Wordle