ParStream passe le Big Data à la moulinette

le 06/12/2013, par Jean Pierre Soulès, Data, 545 mots

Les opérateurs télécoms devraient être bien placés pour tirer parti du big data, à condition de savoir monétiser l'augmentation des volumes qu'ils transportent sur leurs réseau. Ils en sont encore loin faute d'être suffisamment centré sur leurs données et de disposer de modèles décisionnels légers et agiles.

ParStream passe le Big Data à la moulinette

Qui dit Big Data suppose des montagnes de données de toutes origines, structurées ou non : textes, messages électroniques... Des algorithmes permettent de retrouver rapidement une information dans cette caverne d'Ali Baba. Le problème est que cette base est alimentée en permanence par des flots de données nouvelles.  Il est parfois indispensable de comparer ou  de corréler instantanément celles-ci aux anciennes bases et de détecter si un seuil d'alerte n'a pas été franchi. On retrouve ce genre de problématique, notamment de la supervision de réseau, dans la détection de tentatives de fraude, ou dans l'optimisation de processus.

L'éditeur allemand ParStream s'est fait une spécialité de cette recherche instantanée et de cette association entre des données arrivant à l'instant T et d'autres déjà stockées. Basée à Cologne, elle compte une cinquantaine de personnes dont plus des deux tiers se consacrent à la recherche et au développement. Elle vient d'ouvrir un bureau à Paris et compte recruter trois ingénieurs destinés aux solutions clients. Parmi ces derniers : Coface Services (expert dans les risques commerciaux) et l'INRA MGP (biotechnologies). Plus généralement, sa solution intéresse les secteurs du marketing digital, de l'ecommerce, de la distribution B2C, des télécommmunications et de la recherche.

Une grappe de serveurs en peer-to-peer

L'architecture de la solution ParStream est fondée sur une grappe de serveurs, éventuellement distribués, qui fonctionnent en peer-to-peer. Elle est indépendante du type de machine physique, à condition qu'elle tourne sur Linux et soit dotée de processeurs multicoeurs. Sur chacun des serveurs est installé un logiciel ParStream, mais l'un d'eux orchestre le tout : il contient la liste des autres machines, leur rôle et le catalogue de services. S'il tombe en panne, un autre serveur prend immédiatement le relais. Lorsqu'une requête arrive, le logiciel l'analyse et la dirige vers un ou plusieurs serveurs selon sa nature. Ce traitement se fait en parallèle, c'est-à-dire que les coeurs des processeurs travaillent en parallèle et chacun envoie au(x) serveur(s) destinataire(s) les demandes qui le concernent.

L'une des caractéristiques de ParStream réside dans son algorithme de compression et d'indexation. Il est en effet possible de rechercher des informations sans avoir à décompresser les données, ce qui raccourcit considérablement le temps de traitement. « Imaginez que vous imprimiez des données jusqu'à ce que les feuilles mises bout à bout fassent le tour de la terre,  nous déclare Michael Hummel (en photo),  le P-DG.  La recherche d'une information prendrait moins de 1/10e de seconde.  »

Créé en 2008 sur les fonds propres des trois fondateurs, dont Michel Hummel,  la société a levé 5,6 millions de dollars en août 2012 auprès d'un groupe d'investisseurs mené par Khosla Ventures, à la fois pour financer sa recherche et développement, ainsi que pour renforcer sa présence aux États-Unis. En octobre dernier, un second tour de table a permis à ParStream d'ajouter 8  millions de dollars, toujours sous la houlette de Khosla Ventures. Pour le moment, ParStream n'envisage pas de passer en bourse.  « Nous voulons garder encore quelques années notre indépendance pour mieux maîtriser nos choix technologiques », conclut Michael Hummel. 
  

Cisco dope ses performances réseaux Intent-based grâce à l'IA

En intégrant l'intelligence artificielle et l'apprentissage machine à ses réseaux, Cisco compte optimiser les performances de ses réseaux intent-based. Usage des données temps réel et recueil des métadonnées...

le 06/06/2019, par Michael Conney, Network World (adapté par Jean Elyan), 1422 mots

Le big data au service du Tour de France

C'est le groupe sud-africain Dimension Data qui s'est chargé de collecter et d'analyser l'ensemble des données du Tour de France 2015. Entre le camion « big data », les hélicoptères et les capteurs placés sur...

le 29/07/2015, par Oscar Barthe, 538 mots

ParStream passe le Big Data à la moulinette

Les opérateurs télécoms devraient être bien placés pour tirer parti du big data, à condition de savoir monétiser l'augmentation des volumes qu'ils transportent sur leurs réseau. Ils en sont encore loin faute...

le 06/12/2013, par Jean Pierre Soulès, 545 mots

Dernier dossier

Les white-box sont-elles l'avenir de la commutation réseau ?

Et si vous pouviez gérer vos commutateurs de centres de données et vos routeurs de la même façon que vos serveurs et ainsi réduire les coûts des dépenses en capital ? C'est la promesse des white-box qui amènent des systèmes d'exploitation réseau open source fonctionnant sur du matériel courant.Pour en avoir le coeur net, nous avons testé Cumulus...

Dernier entretien

Céline Polo

DRH du groupe iliad

"Nous recrutons dans des métiers en tension, en particulier sur l'infrastructure réseau, pour lesquels il y a...