
Kaptain: il cluster kubernetes ad alte prestazioni
La soluzione basata su container
per il Number Crunching
KAPTAIN è configurato per offrire ai container GPU Computing e reti ad alte prestazioni. La soluzione integra un servizio di block storage per la data persistence dei container.
Ingegnerizzata, non assemblata
KAPTAIN include una moderna web UI sia per l’amministratore che per l’utente finale, da cui si accede anche a un articolato catalogo di applicazioni open-source pronte all’uso. Inoltre, può essere configurato per garantire alta affidabilità (HA) per i servizi core di Kubernetes.
L’approccio KAPTAIN
KAPTAIN integra solo nodi worker di fascia alta e supporta nativamente GPU e reti ad alte prestazioni. Queste caratteristiche ne fanno l’infrastruttura ideale per ospitare i carichi di lavoro tipici di un’architettura a microservizi per il calcolo intensivo.
Il risultato è una soluzione “ready-to-use” in termini di componenti informatici, storage e networking, facilmente raggiungibile attraverso una potente interfaccia web sia dall’amministratore che dall’utente finale.
Inoltre, i componenti software di KAPTAIN vengono regolarmente aggiornati e arricchiti con le soluzioni più innovative sviluppate dalle comunità dell’area Cloud Native Technologies.
POTENTE
KAPTAIN integra solo worker node high-end e supporta nativamente GPU e reti ad alte prestazioni
CONTEINERIZZATA
KAPTAIN è l’infrastruttura ideale per ospitare carichi di lavoro implementati con architettura a microservizi scalabile
PRONTA ALL’USO
KAPTAIN è una soluzione pronta all’uso in termini di componenti di calcolo, di storage e di networking e integra una potente UI web based per l’amministratore e l’utente finale
A PROVA DI FUTURO
Le componenti software che implementano KAPTAIN vengono periodicamente aggiornati e arricchiti con le proposte OpenSource più innovative
Progettata per dare il meglio: sempre
Le applicazioni di nuova generazione sono disegnate come architetture a micro-servizi e spesso implementate attraverso un insieme di container, ciascuno dei quali assolve a una specifica funzione. Il cluster Kubernetes è oggi l’infrastruttura standard per ospitare applicazioni multi container, perché garantisce una distribuzione su più server affidabile ed efficiente dei diversi container e offre funzionalità per gestire con semplicità le operazioni di deployment, di scheduling e di load balancing, anche negli scenari applicativi più complessi.
Scopri tutti i vantaggi
Layout della soluzione
Il core dell’architettura è la ControlPlane:
- gestione ed orchestrazione dei container
- fornisce l’interfaccia (API) verso l’esterno
La configurazione standard di Kubernetes prevede:
- un Master Node, che ospita la ControlPlane
- un insieme di Worker Node, dedicati all’esecuzione dei workload utente containerizzati
I server dell’infrastruttura sono interconnessi da:
- una Rete Interna, dedicata alla comunicazione tra la ControlPlane ed i Worker Node
- una Rete Esterna, dedicata all’accesso ad applicazioni ed servizi in esecuzione sui Worker Node
CONFIGURAZIONI DI KAPTAIN IN HA
HYPER CONVERGED
La configurazione Iper Convergente prevede complessivamente 3 server, ciascuno dei quali svolge sia il ruolo di Master Node che di Worker Node del Cluster.
In questa configurazione ognuno dei 3 server dell’infrastruttura ospita anche i servizi di block storage distribuito, cioè svolge anche il ruolo di Storage Node.
É la minima configurazione in grado di garantire alta affidabilità a Kubernetes.
CONVERGED
La Configurazione Convergente prevede 3 o 5 server dedicati al ruolo di Master Node. I restanti server assolvono contemporaneamente il ruolo di Worker Node e Storage Node. É la configurazione ideale per chi prevede una crescita contemporanea, nel tempo, delle capacità di calcolo e storage necessarie.
DISTRIBUTED
La Configurazione Distribuita prevede 3 o 5 server dedicati al ruolo di Master Node ed i restanti server sono dedicati al ruolo di Worker Node oppure al ruolo di Storage Node.
É la configurazione di massime prestazioni, perché, oltre a prevedere server dedicati alla ControlPlane, consente: di implementare il distributed block storage cloud native sul numero di Storage Node ideale, per ottimizzare le prestazioni in funzione dello spazio disco netto necessario; di scegliere il numero di Worker Node esclusivamente in base ai requisiti dei workload utente e delle relative capacità di scaling orizzontale.
Caratteristiche tecniche
COMPONENTI PRINCIPALI DI KAPTAIN 2.0
Kaptain è un cluster Kubernetes “ready-to-use”, disegnato per garantire semplicità d’uso e alte prestazioni: la sua configurazione standard integra il supporto a GPU e network RDMA, servizi di block storage per la data persistence dei container e una moderna interfaccia web per creare, gestire e monitorare le diverse tipologie di workload che un cluster Kubernetes può ospitare. Kaptain è l’infrastruttura ideale per utilizzare le metodologie DevOps.
I componenti principali di Kaptain sono:
- Distribuzione Kubernetes di seconda generazione basata su container, certificata dalla CNCF (Cloud Native Computing Foundation), configurata per usare nodi bare-metal
- Gli operatori Kubernetes di NVIDIA garantiscono ai container ospitati nell’infrastruttura la possibilità sia di accedere direttamente alle GPU presenti sui Worker Node sia di utilizzare le funzionalità del Network RDMA
- Cloud Native (distributed) Block Storage, implementa i servizi necessari per fornire data persistence ai container istanziati sull’infrastruttura
- Rancher Manager Web UI consente all’amministratore di gestire e monitorare il sistema e le attività degli utenti e, a questi ultimi, di effettuare il deployment e monitorare l’esecuzione dei propri workload containerizzati.
LE POSSIBILI CONFIGURAZIONI DEL SOTTOSISTEMA DI STORAGE:
Configurazione di storage centralizzato
Il Master Node ospita il Control-plane di Kubernetes e un NFS RDMA Server, configurato come back-end storage per la Storage Class predefinita di Kubernetes.
Configurazione di storage distribuito
I Worker Node sono configurati anche come nodi di archiviazione: i loro dischi secondari sono aggregati in una risorsa di archiviazione a blocchi distribuita a livello di cluster, utilizzata per garantire la persistenza dei dati ad alta disponibilità per i container.
Vantaggi architetturali
HIGH PERFORMANCE KUBERNETES READY-TO-GO
KAPTAIN è una soluzione pronta all’uso per l’orchestrazione dei container, progettata per ospitare carichi di lavoro ad alta intensità computazionale.
FLESSIBILE
KAPTAIN comprende un ampio catalogo di applicazioni e servizi che l’utente finale può configurare e gestire in base alle proprie esigenze
OPEN SOURCE
KAPTAIN integra esclusivamente tecnologie Open-Source sviluppate all’interno delle comunità più attive nell’area delle tecnologie Cloud Native
SCALABILE
L’architettura di KAPTAIN garantisce un’infrastruttura di container scalabile e in grado di rispondere ai cambiamenti dei requisiti del cliente nel tempo.
Perché scegliere la soluzione E4
READY-TO-USE
KAPTAIN è un cluster Kubernetes pronto all’uso dotato di un’interfaccia utente basata sul web sia per l’amministratore che per l’utente finale.
VALIDATA
Controllata ad ogni livello per verificare le prestazioni effettive di ogni sottosistema.
TESTATA
Ogni singolo componente viene testato per ridurre i tassi di guasto precoce e il DoA (Dead on Arrival).
SERVITA
L’assistenza sistemistica e consulenziale viene erogata da personale che opera abitualmente all’interno di infrastrutture tra le più complesse in Italia e in Europa e da un team di data scientist altamente qualificati.
Supporto sistemistico e personalizzazione della soluzione
• a giornata
• a pacchetti di “x” giornate a consumo
• a progetto
*minimo fatturabile 1/2 giornata
Consulenza cloud-native technologies
• a giornata
• a pacchetti di “x” giornate a consumo
• a progetto
*minimo fatturabile 1/2 giornata
Training funzionale sull’ambiente Kaptain
Moduli aggiuntivi | Nuove funzionalità in arrivo
- Gestione dell’identità e degli accessi basata su Keycloak; fornisce autenticazione (compatibile con 2FA), autorizzazione e gestione degli utenti.
- Cloud Native Batch Scheduler per l’esecuzione di carichi di lavoro ad alte prestazioni su Kubernetes con framework di dominio come TensorFlow, Spark, PyTorch e MPI.
- MINIO: servizio di Object Storage ad alte prestazioni, distribuito e resiliente che offre una risorsa di storage multi-tenant accessibile con il protocollo S3.
- Storage convergente per garantire la persistenza dei dati altamente disponibili ai container in esecuzione nell’infrastruttura.
- La Control-Plane di Kubernetes ad alta disponibilità è una configurazione di cluster con 3/5 nodi master. Una StorageClass basata su NFS deve utilizzare un solo server esterno.
E4 CONTAINER PLATFORM