
Urania: la soluzione cloud native per la Data Science
La proposta ready-to-go di E4
per la Data Science
Urania è una soluzione end-to-end per Big Data Analytics e Artificial Intelligence su larga scala orchestrata con Kubernetes, che include i principali sistemi distribuiti di data processing e i più diffusi framework open-source per Machine Learning e Deep Learning.
Fornisce servizi per il calcolo interattivo in tecnologia Jupyter Notebook in grado d’interfacciarsi con i sistemi distribuiti di Data Processing e include un cloud-native batch scheduler ideale per lanciare job di Data Processing distribuiti su più nodi, in scenari multi-utente.
Ingegnerizzata, non assemblata
Urania è la soluzione abilitante per carichi di lavoro di Data Science ad alte prestazioni e scalabili.
Caratterizzata da un approccio intuitivo, è di facile gestione e fornisce la flessibilità dei sistemi di ultima generazione.
Urania è una soluzione aperta che viene aggiornata semestralmente per garantirne l’utilizzo allo stato dell’arte e senza compromessi in qualunque ambito della Data Science.
L’approccio di Urania
Urania è la soluzione per la cloud-native Data Science disegnata da E4 Analytics, che si compone di due moduli principali: la componente di infrastruttura (Kaptain multi nodo) che offre servizi di orchestrazione ad alte prestazioni dei container, e la componente di piattaforma (E4DS-PLATFORM) che abilita servizi e funzionalità specifici della Data Science, utilizzabili sia in modalità interattiva che batch.
CLOUD-NATIVE
Urania è la soluzione end-to-end per Big Data Analytics e Artificial Intelligence su larga scala orchestrata con Kubernetes, che include i principali sistemi distribuiti di data processing e i più diffusi framework open-source per Machine Learning e Deep Learning
INTERATTIVA
Urania prevede servizi multiutente per il calcolo interattivo in tecnologia Jupyter Notebook che includono il supporto dei più diffusi framework open-source per la Data Science. Tali servizi sono configurati per utilizzare i sistemi di Data Processing sottostanti
POTENTE
Urania Include un cloud-native batch scheduler disegnato per carichi di lavoro di tipo number crunching, che sono convertiti in workload Kubernetes e sottomessi a code batch per ottimizzare il throughput dei risultati
A PROVA DI FUTURO
Il mondo della Data Science è in costante e rapida evoluzione. Attraverso la sottoscrizione dei servizi di E4 Analytics, lo stack software di Urania viene periodicamente aggiornato e arricchito con le proposte più innovative provenienti dal mondo open-source
Progettata per dare il meglio: sempre
“I dati sono il nuovo petrolio” (Clive Humby, 2006), ma per essere trasformati da dati grezzi a fonte di valore necessitano di un sofisticato processo di raffinazione: le tecniche di Big Data Analytics e il Data Modeling con Machine Learning.
Grazie all’Analisi Dati fondata sull’Apprendimento Automatico, le organizzazioni più innovative sono in grado di migliorare i propri processi interni, fare crescere il portafoglio prodotti, arricchire i servizi offerti ai clienti, ottimizzare la catena di approvvigionamento, abbassare i costi operativi e molto altro.
Ma per ottenere risultati efficaci occorre poter contare su una soluzione che fornisca alte prestazioni, scalabilità, semplicità di utilizzo, flessibilità intrinseca e moderne tecnologie cloud-native.
Urania riunisce tutte queste caratteristiche ed è progettata in modo da fornire all’utilizzatore una soluzione flessibile, sempre aggiornata e adattabile alle nuove, diversificate e crescenti esigenze dell’organizzazione che la utilizza, indipendentemente dal campo specifico in cui opera.
Scopri tutti i vantaggi
Layout della soluzione
Caratteristiche tecniche
Urania si compone di due moduli principali: la componente di infrastruttura (Kaptain multi nodo) che offre servizi di orchestrazione ad alte prestazioni dei container, e la componente di piattaforma (E4DS-PLATFORM) che abilita servizi e funzionalità specifici della Data Science.
Kaptain multi nodo
Kaptain è la soluzione Kubernetes multi nodo disegnata per carichi di lavoro intensivi dal punto di vista computazionale, che include una web UI.
E4DS-PLATFORM
E4DS-PLATFORM è lo stack software che integra tutte le componenti necessarie per implementare l’intero workflow della Data Science.
E4DS-PLATFORM garantisce la convivenza nella medesima infrastruttura di diversi ambienti ad alte prestazioni per il processing distribuito dei dati (Apache Spark, Dask e Ray) e supporta i principali framework per l’analisi dati e l’apprendimento automatico
- ICE4DS è un ambiente di Computing Interattivo (Interactive Computing Environment) configurato per lavorare in ambito Big Data Analytics, Machine Learning e Deep Learning
- ICE4DS è basato sulla tecnologia dei Jupyter Notebook e include VSCode
- ICE4DS include diversi ambienti di lavoro: pyData XXL (supporta lo sviluppo in Python, Julia e R), Rapids.AI, PyTorch, Tensorflow, MxNet, HuggingFace, Spark, Dask e Ray
- ICE4DS è disegnato per utilizzare i sistemi distribuiti di Data Processing integrati in E4DS-Platform
- ICE4DS può essere configurato per offrire all’end-user risorse di calcolo dedicate
Vantaggi architetturali
L’ARCHITETTURA CHE FA LA DIFFERENZA
READY-TO-GO DATA SCIENCE
Soluzione end-to-end per Big Data Analytics e Artificial Intelligence su larga scala orchestrata con Kubernetes.
VERSATILE
Urania consente di avere online diverse versioni per ciascuno degli ambienti di lavoro integrati e garantisce all’end user la possibilità di crearne ulteriori personalizzati secondo le proprie esigenze.
OPEN SOURCE
Urania integra esclusivamente tecnologie Open Source sviluppate presso le più rilevanti comunità attive in ambito Data Science.
SCALABILE
L’architettura di Urania consente di rispondere a esigenze crescenti in termini di risorse di calcolo.
Perché scegliere la soluzione E4
END-TO-END
Soluzione end-to-end per Big Data Analytics e Artificial Intelligence su larga scala orchestrata con Kubernetes. I diversi ambienti di lavoro inclusi sono stati integrati per massimizzare la produttività dei data scientist
VALIDATA
Vengono eseguiti dei test di performance su tutti i nodi che compongono la soluzione, prima del rilascio al cliente. Oltre ai consueti firmware check, homogeneity check, sanity check e setup check utilizziamo ulteriori strumenti specifici per verificare che le effettive prestazioni corrispondano ai requisiti espressi dal cliente. Tra i vari test utilizzati segnaliamo HPL (High Performance Linpack) per la misura della potenza di calcolo della singola macchina in termini di FLOPs; STREAM per misurare la banda di accesso alla memoria espressa in MB/s; IOzone per misurare la velocità di accesso ai dischi espressa in MB/s e IOPS.
COLLAUDATA
I singoli componenti vengono collaudati tramite test di burn in sviluppati in E4 per un periodo fino a 120 ore per garantire un unico sistema perfettamente ingegnerizzato e funzionante, abbattendo in questo modo sia il DoA (Dead on Arrival) che la “early failure rate” dei sistemi dopo il rilascio. Viene così ottenuto un significativo miglioramento dell’affidabilità complessiva della soluzione marchiata E4.
SERVITA
E4 è fra le poche aziende che attualmente erogano servizi di altissimo livello in grandi infrastrutture sia accademiche che private oltre che in centri di ricerca nazionali e internazionali di elevata complessità e rilevanza.
Supporto sistemistico e personalizzazione della soluzione
• a giornata
• a pacchetti di “x” giornate a consumo
• a progetto
*minimo fatturabile 1/2 giornata
Consulenza data science
• a giornata
• a pacchetti di “x” giornate a consumo
• a progetto
*minimo fatturabile 1/2 giornata
Training funzionale sull’ambiente E4DS-Platform
Moduli aggiuntivi | Nuove funzionalità in arrivo
Urania è in grado di ospitare container di terze parti, in particolare le immagini disponibili in NVIDIA NGC Catalog, una vasta collezione di modelli pre-addestrati, toolkit AI e kit di sviluppo (SDK) specifici per diversi casi d’uso. I contenuti disponibili in NGC semplificano la costruzione, la personalizzazione e l’integrazione nei flussi di lavoro di software ottimizzati per GPU, accelerando il time to solution per gli utenti finali di Urania.
In aggiunta alle caratteristiche presenti nella configurazione base, Urania può essere arricchita con una serie di funzionalità aggiuntive, alcune integrate nella soluzione e altre disponibili on demand. Contattaci per le date di rilascio.
CLOUD-NATIVE DATA SCIENCE