Je logue, donc j'écris
Des chercheurs de Carnegie Mellon viennent de mettre au point une variante du test de Turing qui pourrait enfin venir en aide aux grands projets de bibliothèque « open source », tel Gutenberg. Le principe est simple. Beaucoup de blogs, wiki, forums, outils de messagerie web, services « on line » utilisent un procédé dit « captcha » destiné à éliminer les outils automatiques et autres robots de pillage d'adresses qu'affectionnent les spammeurs. Seul un humain est capable de lire les caractères déformés d'une suite de chiffres ou de lettres, et de reconnaître dans une anamorphose psychédélique le mot « boeuf-bourguignon » ou « nabuchodonosor ».
Utilisons donc, espèrent ces chercheurs, et par le biais d'un réseau interdépendant et néanmoins mondial, cette « intelligence de reconnaissance humaine » pour aider à décoder les saisies OCR un peu douteuses. En d'autres termes, je passe au scanner le dernier Best Seller de Ronsard (Pierre de, pour les intimes), lequel ne connaissait pas encore l'ordinateur et écrivait
Je vous envoie un bouquet, que ma main
Vient de trier de ces fleurs épanouies,
Qui ne les eut à ces vêpres cueillies,
Tombées à terre elles fussent demain.
Que la typographie de l'époque, en Janson hasté, ne plaise pas au programme de reconnaissance optique semble presque normal. Le fin lettré qu'est l'homo-informaticus logens saura, lui, distinguer les « vêpres » des « vêprées », et lèvera un doute quant à la bonne saisie d'un texte et son futur reversement dans la bibliothèque de l'honnête internaute.
Les esprits chagrins verront en cette adaptation d'un mécanisme de sécurité une faille inquiétante : le test de Turing ne repose-t-il pas précisément sur le fait que l'ordinateur générant le « challenge » est capable de savoir si la « response » est exacte à la lettre près? Or, comme dans ce cas précis, la machine requérante ne connait pas la réponse à la question qu'elle pose elle-même, comment pourrait-elle donc assumer sa tâche de filtrage ? A cette remarque, les Mellicarnégiens * expliquent que non, l'ordinateur-questionneur n'est pas totalement ignorant de la réponse attendue. Il en connait au moins une partie, et peut comparer le résultat communiqé à une suite logique de mots pouvant figurer dans un dictionnaire ou un thésaurus, puis se voir confirmer la chose par échantillonnage statistique en fonction d'autres réponses fournies par d'autres humains « testdeturingés ». Faisons confiance à ces universitaires, ils ont déjà « inventé » les systèmes de calcul distribué, la recherche d'extra-terrestres dans le bruit thermique spatial et les serveurs d'authentification Radius ... entre autres choses.
Avec un peu de chance, ce serait là une contre-attaque à la boulimie de saisie de Google, plus efficace qu'une protestation d'Universitaire bibliophile.
*Note de la Correctrice : Il semblerait que cet usage des mécanismes patronymiques ne soit pas franchement académique. Mais passons ... l'on parle ici des habitants de Carnegie-Mellon.