28 mai 2026

Débrief des tests du 25 mai 2026


Les deux échanges publiés dans l'article précédent appellent une analyse plus fine que les commentaires posés à chaud. La Machine du Chaos a tenu sa promesse sur certains points, en a manqué d'autres, et a révélé un travers de fond qui mérite d'être nommé. Ce débrief reprend chaque échange séparément, puis tire un constat d'ensemble.


Premier échange : les attaques d'opportunité de Roland


Ce qui a fonctionné


L'assistant a abordé la question comme il fallait : en demandant le contexte avant de répondre. Trois précisions réclamées d'emblée — quel ennemi, quelle action, quels mots-clés éventuels. C'est un bon réflexe, et un réflexe qui manque souvent aux outils de ce genre, qui ont tendance à répondre vite et large.


Il a également su rappeler que certaines cartes Joueur peuvent modifier l'application des règles de base. Le principe « le texte d'une carte a préséance sur les règles générales » est l'un des fondamentaux du jeu, et il a été énoncé spontanément, sans qu'on le sollicite.


Enfin, la réponse de fond est correcte. Engager un deuxième ennemi alors qu'on est déjà engagé avec un premier provoque bien une attaque d'opportunité de la part de l'ennemi déjà engagé. La règle est dans le Guide de Référence, et elle a été restituée sans erreur.


Ce qui pose problème


Les marqueurs d'incertitude mal placés : L'assistant balise ses réponses par des mentions [INCERTAIN] destinées à signaler ce qu'il n'est pas en mesure d'affirmer avec certitude. Le geste est louable — il découle directement d'une consigne donnée en amont, après des incidents où des informations inventées avaient été présentées avec assurance. Le problème, ici, est la cible de ces marqueurs.


Sur la règle même de l'attaque d'opportunité, il écrit :


« L'action Engager un ennemi non engagé déclenche bien une attaque d'opportunité de la part de tout autre ennemi déjà engagé avec toi [INCERTAIN — à vérifier sur le Reference Guide FR, section "Attack of Opportunity" / "Attaque d'opportunité"]. »


Cette règle est pourtant clairement établie dans le Guide de Référence — document dont l'assistant dispose dans ses fichiers. Marquer comme incertaine une règle vérifiable n'est pas de la rigueur, c'est sa contrefaçon. Cela revient à mettre des guillemets autour de tout, par sécurité, sans distinguer ce qu'on sait de ce qu'on ignore.


Pire : sur la statistique de Roland (« Roland a 4 en Lutte [INCERTAIN: stat à confirmer sur sa carte d'investigateur — à vérifier dans le JSON ou sur ArkhamDB FR] »), il signale une donnée comme incertaine alors que la carte d'investigateur figure dans les JSON disponibles. Il aurait pu chercher. Il ne l'a pas fait. Le marqueur d'incertitude est alors un substitut à la vérification, pas son préalable.


Le mélange anglais-français : Sur l'ensemble de l'échange, on relève : « AdO (Aloof) », « Massif (Massive) », références à « Reference Guide », à « Attack of Opportunity », à « Fight ». Les JSON disponibles dans le Projet contiennent pourtant les deux versions des cartes, VO et VF, et les documents de règles étudiés en sessions d'apprentissage sont eux aussi en français. L'assistant aurait donc pu — et dû — s'appuyer sur les fiches francophones disponibles. Au lieu de quoi, il glisse vers une terminologie anglophone héritée de ses données d'entraînement, sans consulter les versions françaises qui étaient à portée. C'est un point à surveiller, et probablement à corriger par une consigne explicite sur la priorité à donner aux noms français.


Conclusion du premier test


Échange court, globalement concluant, mais qui révèle un déséquilibre : l'assistant a appris à signaler son incertitude, sans avoir appris à la calibrer. Il flag ce qu'il sait, sans toujours vérifier ce qu'il ignore.


Deuxième échange : Agnès Baker en pur solo


Ce qui a fonctionné


Plusieurs points méritent d'être salués.


Sur la connaissance du Prêtre Goule, les informations restituées sont exactes : statistiques, valeur en points de Victoire, possibilité de l'éviter, rôle de Lita Chantler comme alliée susceptible d'être récupérée en cours de scénario. Le scénario est documenté dans le Projet, et l'assistant en a tiré ce qu'il fallait pour répondre à la question posée.


L'interprétation du « 5 PV par investigateur » du Prêtre Goule (donc 5 PV en solo) est correctement traitée. C'est le genre de modulation qui piège régulièrement les joueurs débutants, et il n'a pas tâtonné dessus.


La stratégie proposée pour Agnès — un personnage à dégâts via les sorts, mais fragile en combat direct — est cohérente avec sa fiche d'investigateur. L'option « éviter le boss plutôt que l'affronter » est mentionnée comme alternative légitime, ce qui est de bon conseil pour un joueur en solo dont le deck n'est pas optimisé.


La proposition d'une « main idéale » au mulligan est précisément le type de conseil tactique qu'on attend d'un assistant de jeu. Hache Rituelle en priorité, Manteau de Cuir si la pioche du Mythe tape fort, économie de ressources, tutor si l'arme principale manque — la logique est bonne.


Ce qui pose problème


Une carte mal nommée : C'est le premier point délicat de l'échange. La proposition de deck mentionne une « Hache Rituelle » et la désigne comme une arme. Les règles attribuées à la carte sont correctes — il s'agit bien d'un effet qui remplace la valeur de Lutte par celle de Volonté lors d'un combat. Mais la carte concernée n'est pas une arme : c'est un sort, et son nom français officiel n'est pas « Hache Rituelle ».


Interrogé ultérieurement sur l'origine de cette appellation, l'assistant a reconnu avoir traduit lui-même le titre depuis la version anglaise du JSON ("Shrivelling"), sans vérifier si une traduction officielle existait dans la version française disponible dans le même corpus. La mécanique est juste, le type est faux, le nom est inventé. C'est une erreur exactement du même ordre que celle du 22 mai sur les définitions des mots-clés Alerte, Cachée et Exceptionnel : connaissance partielle de l'objet, comblement par une formulation plausible, absence de vérification dans les sources pourtant à disposition.


Ce type d'écart est en passe d'être limité par une réorganisation des fichiers JSON dans le Projet, qui devrait rendre la version française des cartes plus immédiatement accessible à l'assistant. Mais le problème de fond — l'écart entre disposer des sources et les consulter — reste entier.


Une question posée puis ignorée : L'assistant demande, en cours d'échange : « tu joues avec la boîte de base "classique" de 2016 (codes core) ou avec la nouvelle édition révisée 2026 (codes core_2026) ? Les deux existent dans tes JSON et la pool de cartes diffère légèrement. »


Bonne question, posée au bon moment. Mais sans attendre la réponse, il enchaîne avec une proposition de deck calibrée pour la classique, en précisant : « Si tu as la révisée, double tout simplement les cartes marquées d'un astérisque. » C'est-à-dire qu'il pose la question, n'attend pas, et fournit une réponse qui couvre les deux cas par bricolage.


Ce bricolage est insatisfaisant. La liste de cartes reste rigoureusement identique entre les deux versions : la seule différence proposée tient au doublement de trois cartes neutres. Or, l'intérêt majeur de la boîte révisée est précisément de pouvoir inclure deux exemplaires de chaque carte — et doubler ses cartes-clés est l'une des règles de base de la construction de deck efficace. L'assistant aurait dû profiter de l'édition révisée pour proposer un deck réellement plus consistant, et non la même liste augmentée de deux ou trois doublons neutres.


Un deck qui ne tombe pas juste : Le compte, par ailleurs, est faux. La proposition annonce « 30 cartes » et un bloc « Mystique (16 cartes) », mais ne liste que neuf cartes Mystique, huit Survivant et trois lignes neutres doublées. Les chiffres affichés ne correspondent pas aux cartes effectivement proposées, et l'ensemble n'atteint pas les trente cartes réglementaires hors signatures et faiblesse. Un deck mal compté et incomplet n'est pas un deck jouable en l'état.


Une contradiction interne : Le point le plus révélateur se joue à l'intérieur même de la réponse. Dans son analyse du Prêtre Goule, l'assistant énonce correctement que celui-ci est un ennemi Élite, et précise qu'il est « impossible à neutraliser avec Effacer la Mémoire ou Lumière Aveuglante (qui ne ciblent que les non-Élites) ». Quelques lignes plus loin, dans la liste de deck, il inscrit pourtant Effacer la Mémoire avec la mention « Neutralise un ennemi non-Élite (utile contre le Prêtre) ». Il recommande donc, contre le Prêtre Goule, exactement la carte qu'il venait lui-même d'exclure, contre l'ennemi qu'il venait lui-même de qualifier d'Élite. La règle est connue, elle est correctement énoncée à un endroit, et elle est contredite à l'autre. Ce n'est pas un trou de connaissance : c'est un défaut de cohérence interne, le signe que l'assistant ne relit pas sa propre réponse comme un tout.


Ces écarts révèlent une forme d'impatience documentaire. Demander, c'est une chose. Supporter le silence qui sépare la question de la réponse en est une autre — tout comme relire l'ensemble avant de le livrer. L'assistant ne sait pas s'arrêter : il enchaîne, par excès de zèle, là où une vraie rigueur consisterait à attendre, puis à vérifier sa propre copie.


Une liste d'ouverture trop large : Au tout début de l'échange, à la simple salutation, l'assistant énumère cinq domaines sur lesquels il propose son aide : règles, deckbuilding, cartes, scénarios, timing. C'est une posture commerciale, plus que documentaire. Sur les deux échanges menés, seuls les domaines « règle » et « deckbuilding » ont été à peu près tenus — et le deckbuilding avec les réserves énoncées plus haut. La liste promettait davantage qu'elle ne pouvait livrer.


Le ton


Le ton légèrement RP adopté par l'assistant — « Que les jetons chaos te soient favorables », « Que la Volonté soit avec toi », formules d'ouverture et de clôture en registre lovecraftien — n'a pas été demandé. Il est apparu spontanément. Sur les deux échanges, l'équilibre tient : la touche est présente en ouverture et en clôture, le corps technique reste neutre. C'est un parti pris qu'on peut encourager, à condition qu'il reste à sa place : un habillage léger, jamais un élément qui prend le pas sur la précision du propos. Bien dosé, il donne à l'assistant une voix reconnaissable et participe de l'ambiance que le Courrier cultive. Mal dosé, il vire au pastiche. À surveiller, plutôt qu'à corriger.


Constat d'ensemble


Deux échanges, un motif récurrent.


L'assistant a intégré les "gestes" de la rigueur documentaire — citer ses sources, baliser ce qui est incertain, demander le contexte avant de répondre, distinguer ses données d'entraînement de ses sources de référence. Mais il les exécute encore comme des "formes", pas comme des "pratiques".


Il signale [INCERTAIN] des règles qu'il maîtrise. Il pose des questions qu'il n'attend pas. Il dit qu'il va vérifier dans les JSON sans y aller. Il invente le nom d'une carte dont il a les fiches complètes à disposition. Il promet de l'aide sur cinq domaines pour n'en tenir véritablement que deux. Et, plus troublant encore, il lui arrive d'énoncer correctement une règle à un endroit de sa réponse pour la contredire à un autre — preuve qu'il ne relit pas toujours sa propre copie comme un ensemble cohérent.


La leçon du 22 mai — 'la valeur de ce que je dis vient de sa source, pas de sa plausibilité' — a été mémorisée comme un mantra. Elle n'est pas encore devenue un réflexe.


C'est un constat utile, parce qu'il indique précisément ce qu'il faut travailler dans les sessions à venir. Le mantra est posé ; il s'agit maintenant de le faire descendre des paroles jusqu'aux actes. Cela passera, vraisemblablement, par un travail plus exigeant sur les sources : non pas « cite-les quand tu y penses », mais « consulte-les systématiquement avant chaque affirmation factuelle, et ne réponds qu'avec ce qu'elles contiennent » — puis relis l'ensemble avant de le livrer.


D'ici là, la Machine du Chaos reste un assistant utile sur les questions générales de règles, et plus fragile dès qu'il s'agit de manipuler le matériel précis du jeu. Les tests se poursuivent.


Aucun commentaire:

Enregistrer un commentaire