Adatközpont / HPC

A modern adatközpontok működése ma már jóval összetettebb, mint pusztán szerverek és infrastruktúrák üzemeltetése.
A compute, storage, hálózati, energia- és workload-rétegek folyamatos kölcsönhatásban működnek, ahol egy kisebb lokális eltérés is komplex működési hullámokat és koordinációs instabilitást okozhat.
Az AVA-Stabilis observer-only működéselemzési pilotjai az adatközponti környezetek mögötti működési dinamikát vizsgálják.
Nem infrastruktúrát optimalizálunk közvetlenül, nem avatkozunk be a runtime működésbe, és nem módosítjuk a meglévő workflow-kat.
A célunk: érthetőbbé tenni, hogyan viselkedik maga a működés.
Vizsgálataink során többek között elemezzük:
– workload-torlódások kialakulását
– backlog- és latency-hullámok terjedését
– koordinációs veszteségeket
– rejtett kapacitásveszteségeket
– scheduling és workflow-instabilitásokat
– energia- és működési rezonanciákat
– valamint a komplex rendszerek strukturális működési mintázatait
Pilotjaink observer-only szemléletben készülnek read-only kapcsolódással:
– minimális és kontrollált adatigénnyel
– anonim és aggregált működési nyomok alapján
– operatív beavatkozás nélkül
– szolgáltatáskiesési kockázat nélkül
Az ezen az oldalon található anonimizált vizsgálati jegyzőkönyvek különböző infrastruktúra- és működési környezetekhez készített observer-only működéselemzési pilotok és modellezett vizsgálati példák.
A dokumentumok célja, hogy leendő partnereink konkrét képet kapjanak arról, hogyan közelítjük meg a komplex működési rendszerek elemzését, milyen típusú működési mintázatokat vizsgálunk, és milyen operational analysis és synchronization-modeling módszereket alkalmazunk különböző valós infrastruktúra-környezetekben.
A publikált anyagok: anonimizált, részben modellezett, és demonstrációs célú működéselemzési példák, amelyek a platform kutatási és elemzési irányait szemléltetik.
Pilot jegyzőkönyvek:
1. HPC működési stabilitás, PDF
4. Osztott informatikai architektúra, PDF
5. HTC működési környezet, PDF
6. Adatintenzív feladatok, PDF
7. Heterogén klaszter (CPU+GPU+speciális node-ok), PDF
8. Energia- és hűtéshatékony üzemeltetés, PDF
9. Ütemező / szabályalapú rendszer, PDF
10. Karbantartási és üzemeltetői műveletek, PDF
11. Csúcsidőszaki / szakaszos üzemmód (határidő-vezérelt HPC), PDF
12. Felhő-HPC hibrid üzemeltetés, PDF

English