A modern adatközpontok működése ma már jóval összetettebb, mint pusztán szerverek és infrastruktúrák üzemeltetése.

A compute, storage, hálózati, energia- és workload-rétegek folyamatos kölcsönhatásban működnek, ahol egy kisebb lokális eltérés is komplex működési hullámokat és koordinációs instabilitást okozhat.

Az AVA-Stabilis observer-only működéselemzési pilotjai az adatközponti környezetek mögötti működési dinamikát vizsgálják.

Nem infrastruktúrát optimalizálunk közvetlenül, nem avatkozunk be a runtime működésbe, és nem módosítjuk a meglévő workflow-kat.

A célunk: érthetőbbé tenni, hogyan viselkedik maga a működés.

Vizsgálataink során többek között elemezzük:

– workload-torlódások kialakulását
– backlog- és latency-hullámok terjedését
– koordinációs veszteségeket
– rejtett kapacitásveszteségeket
– scheduling és workflow-instabilitásokat
– energia- és működési rezonanciákat
– valamint a komplex rendszerek strukturális működési mintázatait

Pilotjaink observer-only szemléletben készülnek read-only kapcsolódással:
– minimális és kontrollált adatigénnyel
– anonim és aggregált működési nyomok alapján
– operatív beavatkozás nélkül
– szolgáltatáskiesési kockázat nélkül

Az ezen az oldalon található anonimizált vizsgálati jegyzőkönyvek különböző infrastruktúra- és működési környezetekhez készített observer-only működéselemzési pilotok és modellezett vizsgálati példák.

A dokumentumok célja, hogy leendő partnereink konkrét képet kapjanak arról, hogyan közelítjük meg a komplex működési rendszerek elemzését, milyen típusú működési mintázatokat vizsgálunk, és milyen operational analysis és synchronization-modeling módszereket alkalmazunk különböző valós infrastruktúra-környezetekben.

A publikált anyagok: anonimizált, részben modellezett, és demonstrációs célú működéselemzési példák, amelyek a platform kutatási és elemzési irányait szemléltetik.

Pilot jegyzőkönyvek:

1. HPC működési stabilitás, PDF

2. MI – gépi tanulás, PDF

3. MI Inference, PDF

4. Osztott informatikai architektúra, PDF

5. HTC működési környezet, PDF

6. Adatintenzív feladatok, PDF

7. Heterogén klaszter (CPU+GPU+speciális node-ok), PDF

8. Energia- és hűtéshatékony üzemeltetés, PDF

9. Ütemező / szabályalapú rendszer, PDF

10. Karbantartási és üzemeltetői műveletek, PDF

11. Csúcsidőszaki / szakaszos üzemmód (határidő-vezérelt HPC), PDF

12. Felhő-HPC hibrid üzemeltetés, PDF