Logo Blogo

Disco: massive data, minimal code

Pubblicato: 21 lug 2010 da Lpt on fire!


Disco è una piattaforma open source per l’analisi di una gran quantità di dati.

Il framework supporta l’esecuzione parallela su normali computer di più computazioni su insiemi di dati molto grandi. Supporta varie implementazioni fra cui anche il sistema MapReduce.

Il nucleo di Disco è scritto in Erlang, un linguaggio che ben si adatta alla creazione di applicazioni distribuite e fault-tolerant. Gli utenti della piattaforma possono scrivere i propri job da eseguire in Python rendendo molto rapido lo sviluppo di programmi che gestiscono una grande mole di dati.

Questo progetto è nato nel Nokia Research Center come per rendere più facile la gestione del calcolo distribuito. Da allora è stato usato in molti ambiti: parsing, analisi di log, data mining, full-text indexing, modelli probabilistici, machine learning ed altro ancora.

Via | DiscoProject

1 stelle2 stelle3 stelle4 stelle5 stelle (nessun voto)
condividi condividi
0 commenti

Inserisci per primo un commento a questo articolo.

L'email è richiesta ma non verrà mostrata ai visitatori.
Commenta questo articolo

Registrati per riservare il tuo nickname preferito su tutti i blog di Blogo e per caricare il tuo avatar. Se sei già registrato, effettua il login per usare il tuo nickname.

Si No
I commenti sono sottoposti alle linee guida per la moderazione.

Anteprima del commento