YaCy : un moteur de recherche réparti et open-source

le 29/11/2011, par Jacques Cheminat avec IDG News Service, Infrastructure, 478 mots

Des partisans du logiciel libre viennent de lancer un moteur de recherche Peer-to-Peer pour concurrencer Google, Bing, Yahoo... Un projet baptisé YaCy.

YaCy : un moteur de recherche réparti et open-source

La Free Software Foundation Europe (FSFE) a publié  la version 1.0 de son moteur de recherche YaCy qui adopte une approche différente de la recherche. Plutôt que d'utiliser un serveur central, les résultats proviennent d'un réseau de « pairs » indépendant qui sont les utilisateurs qui ont téléchargé le logiciel YaCy. L'objectif est qu'aucune structure ne décide quel sera le positionnement des résultats qui apparaissent. « La plupart de ce que nous faisons sur Internet implique la recherche. Il est le lien vital entre nous et les informations. Pour une fonction aussi essentielle, nous ne pouvons pas compter sur quelques grandes entreprises qui risque de compromettre notre vie privée avec leur processus», a déclaré Michael Christen, chef du projet YaCy. Ce réseau compte actuellement environ 600 « pairs », mais les membres à l'origine de l'idée s'attendent à ce que ce nombre augmente. Ils se réfèrent à d'autres projets de logiciels libres qui visent à remplacer des services centralisés. Par exemple, identi.ca (status.net) offre une alternative à Twitter ou diaspora (joindiaspora.com) à Facebook.

Le projet est soutenu par la Free Software Foundation Europe (FSFE), qui s'inquiète du contrôle et du pouvoir des moteurs de recherche dominants sur les informations trouvées par les internautes. « Ces entreprises peuvent ainsi connaître vos centres d'intérêt et les utiliser », explique Karsten Gerloff, président de la FSFE et d'ajouter « la publicité ciblée est seulement l'utilisation la plus bénigne de ces données». Pour éviter ces risques, le dirigeant propose de « s'éloigner de l'idée que ce type de services doit être centralisé. Il est important d'être indépendant et de créer une infrastructure qui ne dispose pas d'un seul point ».

Un modèle distribué et en P2P

Sur le plan technique, YaCy est un moteur de recherche complet composé d'une interface utilisateur pour la recherche et d'une autre pour l'administration, la configuration et le monitoring. Le "crawler" (l'outil d'analyse) de YaCy récupère les données à partir du web, les analyse et les stocke sous forme de texte dans un index local. Lorsqu'une requête est lancée sur le moteur, la recherche se fait non-seulement sur l'index local, mais aussi sur ceux des autres « pairs » du réseau YaCy. Les pairs s'échangent en permanence des fragments d'index via une table de hachage distribuée en mode P2P.

Tout le monde peut essayer le moteur de recherche en allant sur ce site.  Les utilisateurs peuvent faire partie du réseau YaCy en installant le logiciel sur leurs propres ordinateurs. Comme il s'agit d'un logiciel libre, n'importe qui peut l'utiliser, l'étudier, le partager et l'améliorer. Il est actuellement disponible pour Linux, Windows et MacOS. Le projet cherche également des développeurs et autres contributeurs.

Il y a une semaine, un mathématicien italien a présenté un projet volunia.com qui souhaite concurrencer Google sur le moteur de recherche.



Kneron vise l'ermbarqué avec sa puce KL730 taillée pour l'IA

Axée sur l'image, la puce d'intelligence artificielle KL730 de Kneron devrait permettre de nombreuses améliorations dans les domaines de l'edge computing, de la sécurité et de l'automobile. Dénommée KL730,...

le 22/08/2023, par Jon Gold / Network World (adaptation Jean Elyan), 533 mots

Volumez repense le stockage cloud en misant sur la performance...

Fondé par des vétérans dans l'industrie du stockage, Volumez promeut un logiciel d'orchestration du stockage qui exploite des ressources Linux pour exécuter des charges de travail exigeantes en utilisant une...

le 23/06/2023, par Serge LEBLAL, 939 mots

Des serveurs Lenovo edge pour l'IA et le traitement des données

Les serveurs Lenovo ThinkEdge offriront une plus grande capacité de traitement là où les données sont générées et permettront aux entreprises d'effectuer de l'inférence en temps réel à la périphérie. Au cours...

le 20/06/2023, par Andy Patrizio, IDG NS (adapté par Jean Elyan), 565 mots

Dernier dossier

Les white-box sont-elles l'avenir de la commutation réseau ?

Et si vous pouviez gérer vos commutateurs de centres de données et vos routeurs de la même façon que vos serveurs et ainsi réduire les coûts des dépenses en capital ? C'est la promesse des white-box qui amènent des systèmes d'exploitation réseau open source fonctionnant sur du matériel courant.Pour en avoir le coeur net, nous avons testé Cumulus...

Dernier entretien

Céline Polo

DRH du groupe iliad

"Nous recrutons dans des métiers en tension, en particulier sur l'infrastructure réseau, pour lesquels il y a...