Logo Blogo

Ebot, un crawler scritto in Erlang

Pubblicato: 03 gen 2011 da Lpt on fire!

Ebot

Ebot è un Web crawler scritto in Erlang dall’italiano Matteo Redaelli.

I vari indirizzi vengono raccolti dai vari crawler ed inviati in coda attraverso AMQP. I dati vengono salvati all’interno di database NoSQL come Apache CouchbDB o Riak. Con questa architettura è possibile far girare molti crawler in parallelo e fermarli o farne partire altri senza alcun problema.

Gli indirizzi ed i domini possono essere filtrati, riscritti o normalizzati utilizzando espressioni regolari o funzioni. Il codice è rilasciato sotto licenza GPLv3+.

1 stelle2 stelle3 stelle4 stelle5 stelle (nessun voto)
condividi condividi
0 commenti

Inserisci per primo un commento a questo articolo.

L'email è richiesta ma non verrà mostrata ai visitatori.
Commenta questo articolo

Registrati per riservare il tuo nickname preferito su tutti i blog di Blogo e per caricare il tuo avatar. Se sei già registrato, effettua il login per usare il tuo nickname.

Si No
I commenti sono sottoposti alle linee guida per la moderazione.

Anteprima del commento