
GAIA: GPU Appliance per l’Intelligenza Artificiale
L’appliance ready-to-go
GAIA è una soluzione potente che utilizza hardware esclusivamente di fascia alta: CPU a molti core, fino a 2TB di RAM, tecnologia NVMe per i dischi e multi-GPU interconnesse alla massima velocità.
L’end-user ha la possibilità di accedere a una serie di ambienti di lavoro containerizzati, per lo sviluppo di applicazioni di Data Analytics, Machine Learning e Deep Learning che utilizzano al meglio l’hardware sottostante. GAIA supporta, inoltre, i principali framework open-source (Rapids.AI, Tensorflow, PyTorch, MXnet,…).
Ingegnerizzata, non assemblata
GAIA fornisce un’interfaccia interattiva multiutente semplice da usare (basata su tecnologia notebook).
É una soluzione aperta, in cui è semplice integrare i container di terze parti (Nvidia, DockerHub,…). Inoltre, grazie ad aggiornamenti e integrazioni periodiche a cura di E4 Analytics, la soluzione fornita si mantiene allo stato dell’arte per la Data Science.
L’approccio GAIA
GAIA (GPU Artificial Intelligence Appliance) è la piattaforma abilitante per carichi di lavoro di Machine Learning e Deep Learning ad alte prestazioni e scalabili.
GAIA è la soluzione disegnata dai professionisti di E4 Analytics per massimizzare la produttività dei data scientist che devono raccogliere, ripulire e trasformare i dati aziendali, implementare e testare i più avanzati algoritmi di Machine Learning e mettere in produzione i servizi necessari per fruire dei risultati dell’analisi di grandi basi di dati (Big Data) in modo da trasformarli in valore per l’azienda.
POTENTE
La componente hardware di GAIA è un super server che integra CPU fino a 64 core, RAM fino a 2 TB, storage capiente e veloce basato su tecnologia NVMe e può ospitare fino a 8 GPU interconnesse all-to-all.
CONTAINERIZZATA
Gli ambienti di lavoro sono sempre implementati attraverso immagini di container: l’end user dispone di una molteplicità di ambienti di lavoro, studiati per eseguire al meglio i diversi stage del tipico workflow della Data Science, senza alcun compromesso in termini di prestazioni.
PRONTA ALL’USO
GAIA è una soluzione pronta all’uso che integra un’interfaccia web multi-utente basata sui Jupyter Notebook, per integrare codice con testo descrittivo, formule, visualizzazione grafica e contenuti multimediali, il tutto in modalità interattiva.
A PROVA DI FUTURO
Il mondo della Data Science è in costante e rapida evoluzione. Attraverso la sottoscrizione dei servizi di E4 Analytics, lo stack software di GAIA viene periodicamente aggiornato e arricchito con le proposte più innovative provenienti dal mondo open source.
Progettata per dare il meglio: sempre
Advanced Analytics e Artificial Intelligence: sistemi di supporto alle decisioni.
Business Intelligence: comprendere cosa è accaduto nel passato.
Artificial Intelligence: fare previsioni e generare raccomandazioni per il futuro.
Con l’utilizzo di queste tecnologie i computer vengono addestrati a svolgere attività specifiche tramite l’elaborazione di grandi quantità di dati e il riconoscimento dei modelli presenti nei dati stessi. Per questo vengono utilizzate componenti altamente performanti quali server accelerator (GPU e FPGA), networking e storage ad alte prestazioni.
Scopri tutti i vantaggi
Layout della soluzione
Caratteristiche tecniche
Cosa è E4AI-PLATFORM
E4AI-PLATFORM è lo stack software che integra le componenti necessarie per implementare l’intero workflow dell’AI.
• KUBERNETES Single Node: orchestrazione dei Container
• NVIDIA GPU Operator: supporto al GPU Computing
• DirectPV: data persistence per i container
• MinIO Object Storage: Servizio per il Data Storage condiviso
• ICE4AI ambiente di lavoro interattivo basato su Notebook Services: insieme di servizi necessari per implementare ed automatizzare il workflow dell’AI
Cosa è ICE4AI
• ICE4AI è un ambiente di computing interattivo (Interactive Computing Environment) per lo sviluppo in Python e non solo
• ICE4AI è basato sulla tecnologia dei Jupyter Notebook
• ICE4AI è studiato e configurato per lavorare in ambito Data Analysis, Machine Learning e Deep Learning
• ICE4AI può essere configurato per offrire all’end-user risorse di calcolo dedicate
• ICE4AI è facilmente integrabile con i principali container NVIDIA (NGC)
Componenti
GAIA 2022 working enviroments

GAIA 2022 | extended Jupiterlab UI

ICE4AI: la struttura dei Container
Il punto d’accesso agli ambienti offerti da ICE4AI è una versione customizzata di JupyterHub, necessario per fornire multiutenza allo stack software. L’utente finale dispone di un’interfaccia per scegliere sia l’ambiente di lavoro da utilizzare, da una lista di immagini di container, che le risorse di calcolo da allocare, sulla base di una serie di profili d’utilizzo predisposti dall’amministratore del sistema.
Oltre alle immagini di base, ICE4AI include i seguenti ambienti di lavoro:
• DASK, un framework per il calcolo distribuito orientato alla Data Science, che fornisce allo sviluppatore le stesse API di Numpy, Pandas e Scikit-Learn, ma che è in grado di utilizzare tutti i core dell’insieme dei container su cui è istanziato.
• RAPIDS.AI, un framework sviluppato e mantenuto da NVIDIA che offre le stesse API dei tipici strumenti di Data Analysis in Python (Numpy, Pandas, Scikit-learn,…), ma in versione totalmente GPU based, consentendo così, ad esempio, di utilizzare il GPU computing anche per le attività di preparazione, trasformazione ed arricchimento dei dati, spesso necessarie prima di utilizzare modelli specifici di Apprendimento Automatico.
• Tensorflow2, una “piattaforma open source end-to-end per il Machine Learning” dotata di un ecosistema completo e flessibile di strumenti e librerie stato dell’arte nel Machine Learning;
• PyTorch, un framework ad alte prestazioni per lo sviluppo applicazioni di Deep Learning che comprende una serie di strumenti e librerie che estendono i moduli PyTorch di base per supportare lo sviluppo di applicazioni di Artificial Vision, di Processing del Linguaggio Naturale e di Time Series Analysis basate sul Deep Learning.
• MXnet, un framework snello, flessibile e ultra-scalabile per lo sviluppo di modelli di Deep Learning, gestito dalla Apache Software Foundation, che include anche i moduli Gluon ad alte prestazioni per Computer Vision, NLP e Analisi delle Serie Temporali.
Vantaggi architetturali
HIGH PERFORMANCE APPLIANCE
GAIA è una soluzione pronta all’uso e ad alte prestazioni, per lo sviluppo, il testing ed il deployment di applicazioni di Data Analytics, Machine Learning e Deep Learning scalabili. É la soluzione ideale per estrarre valore dai dati disponibili in azienda.
VERSATILE
GAIA consente di avere online diverse versioni per ciascuno degli ambienti di lavoro integrati e garantisce all’end user la possibilità di crearne ulteriori personalizzati secondo le proprie esigenze.
OPEN SOURCE
GAIA integra esclusivamente tecnologie Open Source sviluppate presso le più rilevanti comunità attive in ambito Data Science.
SCALABILE
L’architettura di GAIA consente di rispondere a esigenze crescenti in termini di risorse di calcolo, permettendo la creazione di un cluster costituito da più GAIA in funzione di worker node.
Perché scegliere la soluzione E4
READY-TO-USE
Appliance ready-to-use dotata di Interactive Computing Environment multiutente specifici per la data science.
I diversi ambienti di lavoro inclusi sono stati integrati per massimizzare la produttività dei data scientist.
VALIDATA
Vengono eseguiti dei test di performances su tutti i server che comporranno la soluzione, prima del rilascio al cliente. Oltre ai consueti firmware check, homogeneity check, sanity check e setup check utilizziamo ulteriori strumenti specifici per verificare che le effettive prestazioni corrispondano ai requisiti espressi dal cliente. Tra i vari test utilizzati segnaliamo HPL (High Performance Linpack) per la misura della potenza di calcolo della singola macchina in termini di FLOPs; STREAM per misurare la banda di accesso alla memoria espressa in MB/s; IOzone per misurare la velocità di accesso ai dischi espressa in MB/s e IOPS.
COLLAUDATA
I singoli componenti vengono collaudati tramite test di burn in sviluppati in E4 per un periodo fino a 120 ore per garantire un unico sistema perfettamente ingegnerizzato e funzionante, abbattendo in questo modo sia il DoA (Dead on Arrival) che la “early failure rate” dei sistemi dopo il rilascio. Viene così ottenuto un significativo miglioramento dell’affidabilità complessiva della soluzione marchiata E4.
SERVITA
E4 è fra le poche aziende che attualmente erogano servizi di altissimo livello in grandi infrastrutture sia accademiche che private oltre che in centri di ricerca nazionali e internazionali di grande complessità e rilevanza, con i quali ha collaborato per la progettazione, configurazione e messa in esercizio di soluzioni estremamente sofisticate per l’elaborazione di grandi basi dati (Big Data) con soluzioni altamente performanti.
SERVIZI BASE
Servizi data scientist
– per attività
– a pacchetti di “x” giornate a consumo
– a progetto
Training funzionale sull’ambiente E4AI-Platform
SERVIZI AVANZATI
Consulenza senior data scientist
– sessione online (costo a ore)
– sessione onsite (a giornata)
– a progetto
Personalizzazione piattaforma E4AI-Platform.
Moduli aggiuntivi | Nuove funzionalità in arrivo
NUOVE FUNZIONALITA’
• Gaia integrerà il supporto per lo sviluppo nei linguaggi R e Julia
• Gaia integrerà direttamente alcuni container NVIDIA (NGC)
• Gaia versione enterprise con E4 VStone
GPU Appliance