L’esecuzione di Hadoop su un Raspberry Pi 2 cluster

0
303

Zero

Sono stato coinvolto con cluster computing mai dal DEC introdotto gruppo vaxcluster nel 1984. In quei giorni, tre nodo gruppo vaxcluster un costo di circa $1 milione. Oggi è possibile costruire una molto più potente cluster per meno di $1.000, fra cui molto più spazio di quanto chiunque possa permettersi di allora.

Hadoop è la versione open-source di Google Map/reduce e Google File System (GFS), ampiamente utilizzata per le grandi applicazioni di data crunching. Si tratta di un cluster shared-nothing, il che significa che quando si aggiungono i nodi del cluster, prestazioni scale up senza problemi.

Raspberry Pi: Hands-on con il Pi-kit per Desktop | Raspberry Pi è più piccolo, più economico rivale: NanoPi Neo Plus2 pesa $25 | Questo è il motivo per cui avete bisogno di imparare il Raspberry Pi 3 (ZDNet Accademia) | Costruzione di un 300 nodo Raspberry Pi supercomputer | Raspberry Pi: Google piani più AI progetti da seguire fai da te di riconoscimento vocale kit | Raspberry Pi cluster di calcolo: Quello che io sto usando per fare, e quello che ho aggiunto

Nella carta, Prestazioni di Basso Costo Cluster Hadoop per l’Analisi di Immagine, i ricercatori Basit Qureshia, Yasir Javeda, Anis Kouba, Mohamed-Foued Sritic, e Maram Alajlan, costruito a 20 nodi RPi Modello 2 cluster, ha portato la Hadoop su di esso, e lo ha utilizzato per la sorveglianza drone di analisi di immagine. Essi, inoltre, di riferimento il RPi cluster a fronte di un 4-PC-nodo di cluster basato su 3 ghz Intel i7, ciascuno con 4 GB di RAM.

Configurazione

Il 20 nodi del cluster è stato diviso in quattro, 5-nodo subnet, ciascuno collegato a 16 parametri porta, a sua volta, è inserito nella rete managed 24 porte core switch. Extra porte switch permettono un facile cluster di espansione.

Ogni 700MHz RPi B esegue Raspbian, un BRACCIO, una versione ottimizzata di Linux Debian. Ogni RPi è una Classe 10 da 16 GB SD card è in grado di fino a 80 mb/s velocità di lettura/scrittura. Un’immagine del sistema operativo con Hadoop 2.6.2 è stato copiato sulla SD card. Hadoop nodo Master, che implementa il nome del nodo, è stato installato su un PC con Ubuntu 14.4 e Hadoop.

TechRepublic: Raspberry Pi computer portatile? Ecco un super-semplice kit si può costruire | 20 sciocca Raspberry Pi progetti | Windows 10 face-off: Raspberry Pi thin client vs moderno computer portatile | Raspberry Pi: crea il tuo turbo cluster con OctaPi | Come dare il vostro Raspberry Pi ‘stato dell’arte della computer vision’ utilizzo di Intel Neurale Compute Stick | Raspberry Pi add-on permette di costruire il proprio assistente AI alimentato da Amazon, Google e Microsoft | Raspberry Pi Zero W: smart persona guida

I risultati delle prestazioni

Ci si aspetterebbe un cluster di 64-bit, 3 ghz Cpu x86 per essere molto più veloce di 700MHz, 32-bit ARM Cpu, e avreste ragione. Il gruppo ha condotto una serie di test che sono stati a) compute-intensive (il calcolo di Pi), b) intensivo di I/O (documento word conta), e, c) sia (file immagine numero di pixel).

Ecco il conteggio dei risultati, preso da una figura di carta.

hadooprpiperf.jpg
Per gentile concessione degli autori

In generale, la x86 cluster è 10-20 volte più veloce. Tuttavia, la capacità di mettere un cluster Hadoop in uno zaino con una batteria, apre nuove possibilità per potente bordo di calcolo, come il drone di pre-elaborazione video gli autori di esplorare nella loro carta. Anche oggi abbiamo la RPi Modello 3, con un processore con quasi il doppio della velocità di clock del RPi testato dai ricercatori.

L’Archiviazione Bit prendere

Mobile edge cluster non sono una cosa di oggi, ma che sarà, perché la nostra capacità di raccogliere dati a bordo di una crescita molto più veloce di larghezza di banda di rete a bordo. Dovremo pre-processo, per esempio, IoT dati su compact per la trasmissione in rete.

Quando sarà economicamente sostenibile? Tre cose che devono accadere:

Mobile, processori di andare più veloci, mentre la restante potenza efficiente. Più potenza efficiente della memoria – se di bassa potenza DRAM, o NVRAM – deve consentire di memoria maggiore cacacities su processori mobili. Universal Flash Storage (UFS) supporto a processori mobili, eliminando l’attuale collo di bottiglia di archiviazione di micro-SD card.

Tutti e tre accadrà nei prossimi cinque anni. Quindi zaino cluster essere in grado di vero e proprio lavoro in modo selvaggio.

Cortesi i commenti sono benvenuti, naturalmente.

0