• Vai alla navigazione primaria
  • Passa al contenuto principale
  • Passa al pié di pagina
E4 Computer Engineering

E4 Computer Engineering

HPC and Enterprise Solutions

  • It
  • En
  • Soluzioni
    • HPC
    • AI
    • Kubernetes
    • Virtualization
    • Cloud
  • Chi siamo
    • Team
    • E4 Analytics
    • E4 Aerospace & Defence
    • Case history
    • Progetti europei
    • Competenze
    • Certificazioni
    • Partner
    • Lavora in E4
  • News
    • Blog
    • Eventi
  • Contatti

Kaptain: il cluster kubernetes ad alte prestazioni

YouTube Twitter Linkedin

#whenperformancematters

La soluzione basata su container
per il Number Crunching

KAPTAIN è configurato per offrire ai container GPU Computing e reti ad alte prestazioni. La soluzione integra un servizio di block storage distribuito per la data persistence dei container e include anche un object storage S3 ad alte prestazioni basato su MinIO.

Ingegnerizzata, non assemblata

KAPTAIN include una moderna web UI sia per l’amministratore che per l’utente finale, da cui si accede anche a un articolato catalogo di applicazioni open-source pronte all’uso.​ Inoltre, può essere configurato per garantire alta affidabilità (HA) per i servizi core di Kubernetes.

L’approccio KAPTAIN

Kaptain è un cluster Kubernetes “ready-to-use”, disegnato per garantire semplicità d’uso e alte prestazioni: la sua configurazione standard integra il supporto a GPU e network RDMA, servizi distribuiti di block storage e object storage per la data persistence dei container e una moderna interfaccia web per creare, gestire e monitorare le diverse tipologie di workload che un cluster Kubernetes può ospitare. Kaptain è l’infrastruttura ideale per utilizzare le metodologie DevOps.

POTENTE
KAPTAIN integra solo worker node high-end e supporta nativamente GPU e reti ad alte prestazioni

CONTEINERIZZATA
KAPTAIN è l’infrastruttura ideale per ospitare carichi di lavoro implementati con architettura a microservizi scalabile

PRONTA ALL’USO
KAPTAIN è una soluzione pronta all’uso in termini di componenti di calcolo, di storage e di networking e integra una potente UI web based per l’amministratore e l’utente finale

A PROVA DI FUTURO
Le componenti software che implementano KAPTAIN e il suo add-on per la Data Science vengono periodicamente aggiornati e arricchiti con le proposte OpenSource più innovative

Progettata per dare il meglio: sempre

Le applicazioni di nuova generazione sono disegnate come architetture a micro-servizi e spesso implementate attraverso un insieme di container, ciascuno dei quali assolve a una specifica funzione. Il cluster Kubernetes è oggi l’infrastruttura standard per ospitare applicazioni multi container, perché garantisce una distribuzione su più server affidabile ed efficiente dei diversi container e offre funzionalità per gestire con semplicità le operazioni di deployment, di scheduling e di load balancing, anche negli scenari applicativi più complessi.

Robottino mascotte Facciamo due chiacchere

Scopri tutti i vantaggi

Layout della soluzione

Il core dell’architettura è la ControlPlane:
• gestione ed orchestrazione dei container
• fornisce l’interfaccia (API) verso l’esterno
La configurazione standard di Kubernetes prevede:
• un Master Node, che ospita la ControlPlane
• un insieme di Worker Node, dedicati all’esecuzione dei workload utente containerizzati.
I server dell’infrastruttura sono interconnessi da:
• una Rete Interna, dedicata alla comunicazione tra la ControlPlane ed i Worker Node
• una Rete Esterna, dedicata all’accesso ad applicazioni ed servizi in esecuzione sui Worker Node.

Configurazioni di Kaptain in HA

La configurazione Iper Convergente prevede complessivamente 3 server, ciascuno dei quali svolge sia il ruolo di Master Node che di Worker Node del Cluster.
In questa configurazione ognuno dei 3 server dell’infrastruttura ospita anche i servizi di block storage distribuito, cioè svolge anche il ruolo di Storage Node.
É la minima configurazione in grado di garantire alta affidabilità a Kubernetes.

High Performance Cluster Kubernetes

La Configurazione Convergente prevede 3 o 5 server dedicati al ruolo di Master Node. I restanti server assolvono contemporaneamente il ruolo di Worker Node e Storage Node. É la configurazione ideale per chi prevede una crescita contemporanea, nel tempo, delle capacità di calcolo e storage necessarie.

High Performance Cluster Kubernetes

La Configurazione Distribuita prevede 3 o 5 server dedicati al ruolo di Master Node ed i restanti server sono dedicati al ruolo di Worker Node oppure al ruolo di Storage Node.
É la configurazione di massime prestazioni, perché, oltre a prevedere server dedicati alla ControlPlane, consente: di implementare il distributed block storage cloud native sul numero di Storage Node ideale, per ottimizzare le prestazioni in funzione dello spazio disco netto necessario; di scegliere il numero di Worker Node esclusivamente in base ai requisiti dei workload utente e delle relative capacità di scaling orizzontale.

High Performance Cluster Kubernetes
Caratteristiche tecniche
Componenti principali di Kaptain

Kaptain è un cluster Kubernetes “ready-to-use”, disegnato per garantire semplicità d’uso e alte prestazioni: la sua configurazione standard integra il supporto a GPU e network RDMA, servizi distribuiti di block storage e object storage per la data persistence dei container e una moderna interfaccia web per creare, gestire e monitorare le diverse tipologie di workload che un cluster Kubernetes può ospitare. Kaptain è l’infrastruttura ideale per utilizzare le metodologie DevOps.

High Performance Cluster Kubernetes
Rancher server: le web UI di Kaptain

Le principali funzionalità offerte all’utente finale dal Cluster Explorer di Rancher Server sono:
Cluster Viewer: per accedere alle informazioni sullo stato del cluster e dei nodi che lo costituiscano che il ruolo dell’utente prevede siano consultabili.
Workload Manager: per creare, gestire e monitorare tutte le tipologie di workload che un cluster Kubernetes permette di utilizzare: Deployment, CronJob, DaemonSet, Job e StatefulSet; il tutto, ovviamente, nei limiti consentiti dal ruolo dell’utente dell’interfaccia; in questa sezione l’utente ha, altresì, piena visibilità dello stato di tutti i pod di sua proprietà che sono configurati sul cluster.
Service Discovery: per accedere ai servizi associati ai propri workload o ad ulteriori workload utente o di sistema, resi visibili dalle relative policy associate.
Storage Manager: per gestire il ciclo di vita di tutti i Persistent Volume di proprietà dell’utente, indipendentemente dal fatto che siano ancora legati a workload attivi; in questo contesto l’utente del Cluster Explorer può gestire Secret e ConfigMap di sua proprietà.
Apps & Marketplace: per accedere ad un vasto catalogo (configurabile dall’amministratore di sistema) di applicazioni e servizi predisposti per essere avviate e gestite in modalità self provisioning.

Cluster Kubernetes
Nvidia Operators

Gli operator di Nvidia abilitano alle alte prestazioni:
NVIDIA GPU OPERATOR automatizza la gestione di tutti i componenti software NVIDIA necessari per il provisioning della GPU ai container.
NVIDIA NETWORK OPERATOR abilita le reti ad alte prestazioni in Kubernetes, consentendo di utilizzare RDMA e GPUDirect per i carichi di lavoro ospitati nel cluster.

Longhorn: il block storage distribuito di Kaptain

• Longhorn è un sistema di storage a blocchi distribuito leggero, affidabile e potente per Kubernetes
• Longhorn crea un controller dedicato per ogni volume di storage a blocchi e lo replica in modo sincrono su più Storage Node
• Longhorn archivia i dati di backup su storage esterno di tipo NFS o S3
• Longhorn prevede procedure di upgrade che garantiscono costante accesso ai volumi persistenti
• Longhorn dispone di una UI di management accessibile da web

Longhorn
MinIO: l’object storage ad alte prestazioni

MinIO è un sistema di storage ad oggetti distribuito ad alte prestazioni.
MinIO è una soluzione progettata per fornire solo servizi di object storage che risulta, allo stesso tempo, performante, scalabile e leggera.
MinIO eccelle in casi d’uso tipici dell’object storage quali lo storage secondario, il disaster recovery e il backup.
MinIO è una soluzione unica per il livello data storage per l’analisi di grandi moli di dati e dell’apprendimento automatico.

Object storage
Vantaggi architetturali

HIGH PERFORMANCE KUBERNETES READY-TO-GO
KAPTAIN è una soluzione pronta all’uso e ad alte prestazioni, disegnata per lo sviluppo, il testing e il deployment di applicazioni di Data Analytics, Machine Learning e Deep Learning scalabili.

FLESSIBILE
KAPTAIN consente di avere online diversi sistemi per il data processing distribuito e garantisce all’end user la possibilità di creare ambienti interattivi personalizzati secondo le proprie esigenze.

OPEN SOURCE
KAPTAIN integra esclusivamente tecnologie Open Source sviluppate presso le più rilevanti comunità attive in ambito Data Science.

SCALABILE
L’architettura di Kaptain assicura al cliente una infrastruttura in grado di scalare e rispondere così a esigenze crescenti nel tempo.

Perché scegliere la soluzione E4

Ready-to-use
Cluster Kubernetes ready-to-use dotato di UI web based per l’amministratore e l’utente finale
• Dotata di Interactive Computing Environment multiutente specifici per la data science
• I diversi ambienti di lavoro inclusi sono stati integrati per massimizzare la produttività dei data scientist

Validata
Validata ad ogni livello per verificare le prestazioni effettive di ciascun sistema.
Vengono eseguiti dei test di performances su tutti i server che comporranno la soluzione, prima del rilascio al cliente. Oltre ai consueti firmware check, homogeneity check, sanity check e setup check utilizziamo ulteriori strumenti specifici per verificare che le effettive prestazioni corrispondano ai requisiti espressi dal cliente. Tra i vari test utilizzati segnaliamo HPL (High Performance Linpack) per la misura della potenza di calcolo della singola macchina in termini di FLOPs; STREAM per misurare la banda di accesso alla memoria espressa in MB/s; IOzone per misurare la velocità di accesso ai dischi espressa in MB/s e IOPS.

Collaudata
Collaudata in ogni singolo componente per ridurre early failure rate e DoA (Dead on Arrival). I singoli componenti vengono collaudati tramite test di burn in sviluppati in E4 per un periodo fino a 120 ore per garantire un unico sistema perfettamente ingegnerizzato e funzionante abbattendo in questo modo sia il DoA (Dead on Arrival) che la “early failure rate” dei sistemi dopo il rilascio. Viene così ottenuto un significativo miglioramento dell’affidabilità complessiva della soluzione marchiata E4.

Servita
Servita da sistemisti che operano nelle più complesse infrastrutture di calcolo italiane ed europee e da un team di data scientist altamente qualificato.
E4 è fra le poche aziende che attualmente erogano servizi di altissimo livello in grandi infrastrutture sia accademiche che private oltre che in centri di ricerca internazionali di complessità e rilevanza nazionale e internazionale con i quali ha collaborato per la progettazione, configurazione e messa in esercizio di soluzioni estremamente sofisticate per l’elaborazione di grandi basi dati (Big Data) con soluzioni altamente performanti.

SERVIZI BASE
Servizi data scientist
– per attività
– a pacchetti di “x” giornate a consumo
– a progetto
Training funzionale sull’ambiente E4DS-PLATFORM

SERVIZI AVANZATI
Consulenza senjor data scientist
– sessione online (costo a ore)
– sessione onsite (a giornata)
– a progetto
Personalizzazione piattaforma E4DS-PLATFORM

Moduli aggiuntivi | Nuove funzionalità in arrivo

I DISTRIBUTED DATA PROCESSING SYSTEMS INCLUSI IN E4DS-PLATFORM

E$DS Platform

E4DS-PLATFORM garantisce la convivenza nella medesima infrastruttura di diversi ambienti ad alte prestazioni per il processing distribuito dei dati:
– Apache Spark è un motore multi linguaggio per carichi di lavoro di data engineering, data science e machine learning che scala dal singolo server al cluster multi nodo
– Distributed Dask rende facilmente scalabili le librerie Python più note come NumPy, Pandas e Scikit-Learn
– Ray Project semplifica la parallelizzazione del codice di una singola macchina: passa da una singola CPU a multi-core, multi-GPU o multi-nodo con modifiche minime al codice.

Kaptain garantisce la convivenza nella medesima infrastruttura di diversi ambienti per la data preparation, il percorso che conduce dalla raccolta del dato grezzo a un dataset utile per i processi di analisi.

I SERVIZI DI INTERACTIVE COMPUTING INCLUSI IN E4DS-PLATFORM
ICE4DS l’ambiente interattivo per la data science distribuita.
– ICE4DS è un ambiente di Computing Interattivo in grado di dialogare con i sistemi di processing distribuito dei dati inclusi in E4DS-PLATFORM
– ICE4DS è basato sulla tecnologia dei Jupyter Notebook
– ICE4DS è configurato per lavorare negli ambiti Data Analysis, Machine Learning e Deep Learning distribuiti

I DATA SERVICES INTEGRABILI IN E4DS-PLATFORM
Kaptain è in grado di ospitare anche l’insieme dei servizi che completano il tipico workflow della Data Science:
– Workflow Manager
– Sistemi di acquisizione dati
– Servizi di database SQL e noSQL
– Servizi per l’inferenza su larga scala

Datasheet

E4 CONTAINER PLATFORM

Contattaci per informazioni

    Dichiaro di aver letto e accettato la Privacy Policy di questo sito e acconsento al trattamento dei dati personali ai sensi dell’art. 13 del Regolamento (UE) 2016/679

    Footer

    Via Martiri della Libertà, 66
    42019 Scandiano (RE) – Italy

    +39 0522 991811
    info@e4company.com

    • Youtube
    • Twitter
    • LinkedIn
    • SOLUZIONI
    • HPC
    • AI
    • Kubernetes
    • Virtualization
    • Cloud
    • CHI SIAMO
    • Team
    • E4 Analytics
    • E4 Aerospace & Defence
    • Case History
    • Competenze
    • Progetti europei
    • Partner
    • Certificazioni
    • Lavora in E4

    NEWS

    • Blog
    • Eventi

    Iscriviti alla Newsletter

    Scarica il Company Profile

    © 2002–2023 E4 COMPUTER ENGINEERING S.p.A. - P.IVA/VAT No. IT 02005300351 - R.A.E.E. IT0802 000 000 1117 - CAP. SOC. EURO 150.000,00 I.V. - Privacy policy - Cookie Policy - Impostazioni Cookie

    WebSite by Black Studio