Captchas : bonne et mauvaise discrimination

le 06/05/2008, par Marc Olanié, Actualités, 908 mots

La discrimination peut être une bonne chose. Surtout si celle-ci tend à limiter le spam, cette lèpre qui ronge Internet, son trafic smtp, sa bande passante, son énergie. Et la première des discriminations salvatrice, c'est celle des Captcha qu'utilisent les principaux serveurs qui filtrent ainsi les robots des polluposteurs. Las, on est en droit de se demander si ces mesures ont une quelconque efficacité. « Le spam a 30 ans, et on n'est pas prêt de le voir disparaitre » titre d'ailleur John Leyden du Reg. 95 % des échanges e-mail sont constitué de pourriel, et, estiment les analystes de Sophos (dont la suite logicielle comporte un antispam), le «taux de réussite » des propositions commerciales douteuses ainsi véhiculées atteindrait 11%. Un chiffre fort plausible... le taux de réponse à une campagne marketing légitime et à grande échelle ne dépasse pas parfois le seuil des 1 à 3% de retour. Mais le spam opère une pression, une sollicitation permanente. C'est une campagne marketing qui multiplie infatigablement les relances et change constamment de méthode d'approche. Nick Kelly, de l'Avert Lab, nous fait d'ailleurs l'historique de cette calamité, en oubliant un peu l'origine réelle du mot. Mais revenons aux mesures discriminatoires offertes par Captcha. Tout le monde peut lire et interpréter un captcha... parfois même les robots-spammeurs eux-mêmes... Sauf les aveugles, bien entendu Il ne fait pourtant de tord à personne Sauf aux daltoniens que çà empoisonne Non le captcha n'est pas si fort Il occasionne bien des tords Dans son blog « Discussions de derrière le comptoir », Evan Schuman nous narre les difficultés d'une chaine de pharmacies/épiceries américaine, Rite Aid, qui, malgré d'importants effort pour les non et malvoyants puissent visiter leurs sites Web, se heurte à l'épineux problème du filtrage des robots spammeurs. Comment, effectivement, un aveugle peut-il lire un captcha ? car si son lecteur braille interprète la donnée, c'est qu'elle transite numériquement sur le réseau... et est donc susceptible d'être interprétée par un automate. Ainsi, une mesure de « bonne discrimination » peut, dans certains cas, faire preuve discrimination négative. Il suffit d'utiliser des Captcha « audio »imagine alors Google. Une fausse bonne idée qui a fait long feu. Car, outre le fait que cette technique entrave également les personnes sourdes et aveugles -encore un exemple de « mauvaise discrimination »-, elle peut, estime Rubén Santamarta,« reverse engineer » chez Wintercore, être parfaitement décodée sur seule analyse du signal audio. Ce n'est pas là un scoop... cela fait quelques années que l'analyse temps-fréquence (Time domain, pour être plus précis) d'une enveloppe vocale permet de retrouver une personne précise parmi des milliers de voix. Comprendre ce que dit cette voix est presque plus trivial. Ce qui, après quelques jours de réflexions, donne quelques idées à notre « reverse engineer » : Si l'utilisation d'une information sonore brute n'est pas à conseiller, rien n'interdit de construire un Captcha reposant non plus sur la forme précise du message (le signifiant), mais sur ce qu'il véhicule comme idée (le signifié). Prenons, explique-t-il, l'exemple sonore suivant : une voix féminine égrène des chiffres les uns à la suite des autres (voilà qui va rappeler des souvenirs aux amoureux d'ondes courtes). Le « chalenge-response » pourra être le suivant : Question 1 : que représente ce son ? Réponse :ben... une fille en train de dire des nombres Ou bien Réponse : une nana qui compte Charge au « challenger » de posséder un important dictionnaire de synonyme. Il faut toutefois préciser que ces tests, théoriquement destinés à déterminer le degré d'humanité situé derrière un clavier, ne possède strictement aucun sens de l'humour, de la périphrase et de la métaphore*. Que l'un des interrogé réponde « C'est ma baronne en train de fouiller dans mon larfeuille » ou « Voilà une barbouze Est-Allemande qui vocalise ses messages de liaison sur ondes courtes » se soldera par un échec cuisant. L'humour ou la référence ethno-historique sont le propre de l'homme, et il est paradoxal de confier à une machine, dépourvue de ces capacités, le fait de déterminer le degré d'humanité de ses interlocuteurs. D'ailleurs, le Captcha serait sur le point de devenir totalement inutile, car de plus en plus de polluposteur utilisent de véritables humain pour décoder les captchas en quantités industrielles. Le captcha semble donc en passe de disparaitre, tout comme ont pratiquement disparu les « claviers virtuels anti-keyloggers », lesquels furent officiellement hackés avant même d'être adoptés par les banquiers français (en toute connaissance de cause, ce qui relève tout de même d'un certain cynisme). Achevons ce rapide survol de l'actualité en précisant que Captcha signifie Completely Automated Public Turing test to tell Computers and Humans Apart. Autre paradoxe, le père de ce test, Alan Turing, fut perpétuellement en butte à des mesures discriminatoires anti-homosexuelles. Ce fut probablement d'ailleurs, pensent les historiens, l'une des principales raisons de son suicide. Si les machines parviennent encore mal à éliminer leurs semblables dans le cadre d'un filtrage, les humains, pour leur part, y arrivent fort bien depuis la nuit des temps.

*NdlC Note de la Correctrice : Oserais-je rappeler ce dialogue d'Audiard -J'ai bon caractère mais j'ai le glaive vengeur et le bras séculier. L'aigle va fondre sur la vieille buse. -Ça c'est chouette comme métaphore. -Ce n'est pas une métaphore c'est une périphrase. -Ah fait pas chier ! -Ça c'est une métaphore Ce qui pourrait donner quelques belles idées de Captchas du genre Question : « J'ai l'impression qu'on n'est pas dans la merde ». Est-ce : une métaphore, une périphrase, une litote ou un euphémisme » Réponse : « vous pouvez répéter la question ? » Conséquence : Bienvenue sur « Les nuits intimes d'Elvira », le seul serveur strictement interdit aux licenciés en lettres et aux agrégés de cinéma.

T-Mobile authentifie de manière forte 15000 employés via leur mobile

L'opérateur mobile T-Mobile authentifie 15 000 collaborateurs via leurs téléphones mobiles. Les employés de T-Mobile

le 05/02/2013, par Jean Pierre Blettner, 341 mots

La cybercriminalité va faire l'objet d'un énième rapport du ministère...

Le ministère de l'intérieur entend mieux piloter la lutte contre la cybercriminalité. Le ministre de l'intérieur Manu

le 30/01/2013, par Jean Pierre Blettner, 222 mots

Mega déjà mis en cause pour violation de propriété intellectuelle

Le site de stockage et de partage de fichiers Mega a supprimé du contenu violant la propriété intellectuelle le

le 30/01/2013, par Véronique Arène et IDG News Service, 832 mots

Dernier dossier

Les white-box sont-elles l'avenir de la commutation réseau ?

Et si vous pouviez gérer vos commutateurs de centres de données et vos routeurs de la même façon que vos serveurs et ainsi réduire les coûts des dépenses en capital ? C'est la promesse des white-box qui amènent des systèmes d'exploitation réseau open source fonctionnant sur du matériel courant.Pour en avoir le coeur net, nous avons testé Cumulus...

Dernier entretien

Céline Polo

DRH du groupe iliad

"Nous recrutons dans des métiers en tension, en particulier sur l'infrastructure réseau, pour lesquels il y a...