Posts in big data

RDD : Qu'est Ce Que C'est

left-small

Spark est un framework qui a de plus en plus le vent en poupe et le fait qu'il ait été promu en top-level project par la fondation Apache qu'il a rejoint récemment (en juin 2013) montre bien de l'intérêt qu'il succite (cela est d'aileurs confirmé par son intégration avec des solutions comme celles de DataStax (cf. ici) ou mapR (cf. ici).

Un des points central de Spark est son utilisation des RDDs (Resilient Distributed Datasets).

Cet article tentera d'expliquer un peu plus précisément ce que sont ces fameux RDDs (enfin, pour être plus précis, il ne s'agit (comme à mon habitude) que d'une pseudo-traduction du papier de recherche expliquant ses tenants et aboutissants).

in big data, rdd, spark Read on →