Utiliser l’IA comme copilote méthodologique

Recherche bibliographique, raisonnement diagnostique, décision thérapeutique : comment utiliser les grands modèles de langage comme copilotes méthodologiques, sans les confondre avec une expertise clinique ?

La plupart d’entre nous a testé l’intelligence artificielle (IA) générative lors de son explosion médiatique fin 2023. La déception fut fréquente : diagnostics erronés, références inventées, affirmations fausses formulées avec aplomb. Beaucoup de cliniciens ont, à juste titre, mis cette technologie à distance [1]. Pour comprendre leurs limites, il faut saisir le fonctionnement de base derrière les grands modèles de langage (LLM).

La brique technologique de base derrière ces modèles leur donne la capacité de prédire le terme statistiquement le plus probable pour compléter un texte. Répétée plusieurs fois, cette opération permet de générer un texte complet. Lorsqu’on leur pose une question, la réponse est donc grammaticalement correcte et contextuellement cohérente avec la question sans aucune garantie de véracité. Ils répondent quelque chose de proche de ce qu’ils connaissent et ont vu dans leurs données d’entraînement. Cette forme de pensée pourrait être assimilable à une sorte de pensée intuitive par association. Ce fonctionnement les rend structurellement enclins aux “hallucinations” (l’invention de faits), d’autant plus trompeuses qu’elles sont formulées avec la même assurance que les réponses correctes. Depuis, trois avancées ont changé la nature même de ces outils.

La première est la chaîne de pensée Chain of Thought [2] : les modèles récents décomposent leur raisonnement en adoptant une structure proche du raisonnement hypothético-déductif. Ils commencent par analyser la requête de l’utilisateur, énoncent des hypothèses, établissent une stratégie de résolution avant de finalement donner une réponse plus affinée à l’utilisateur. Ce processus est visible et auditable à l’écran sous la mention “Thinking”, ce qui permet au clinicien de vérifier le cheminement logique ayant mené à la conclusion du LLM.
La deuxième est la connexion à des outils externes via des protocoles ouverts comme le Model Context Protocol (MCP) [3] : le modèle peut désormais interroger internet, PubMed en temps réel au lieu de puiser dans une mémoire figée, ce qui réduit considérablement le risque d’hallucination factuelle.
La troisième est l’orchestration agentique : un modèle principal analyse la requête puis délègue chaque sous-tâche à des agents spécialisés, y compris des modèles spécialisés d’analyse d’image. C’est sur ce dernier point que l’ophtalmologie se heurte à un obstacle majeur. En analyse de texte et en recherche bibliographique, les gains sont déjà tangibles. Mais en interprétation d’examens complémentaires (OCT, angiographie, ERG), les modèles généralistes[...]