Az SPOF (single point of failure), azaz egyetlen/kritikus meghibásodási pont az IT rendszer olyan nem redundáns része, amely működésképtelensége esetén az egész rendszer meghibásodását okozza. Tehát az SPOF azt a potenciális kockázatot jelöli ki, amely a teljes rendszer működésének leállásának oka lehet. Az SPOF megléte veszélyezteti a magas rendelkezésre állást a szoftverekben vagy hálózatokban, ami által a termelékenység és az üzletmenet folytonossága csökken, a működés biztonsága pedig veszélybe kerül.
Az SPOF meghatározása elsősorban azokban a rendszerekben fontos, amelyek magas rendelkezésre állást és megbízhatóságot igényelnek, mint például az ellátási láncok, hálózatok és szoftveralkalmazások.
Ha egy magas rendelkezésre állású szoftverben egy rendszerelem meghibásodik, azonnal másik komponensnek kell átvennie a helyét az üzletmenet folytonossága érdekében. Ebből adódóan kulcsfontosságú azonosítani a kimaradásokat okozó szoftverhibákat, és lényeges kiküszöbölni a szoftveralapú kritikus meghibásodási pontokat a felhőarchitektúrában is.
Számos potenciális SPOF létezik, melyekről gyakran a rendszergazdáknak sincs elég információjuk. Az adatközpontokban például gyakorlatilag minden egyes összetevő – akár az összetett szoftverrendszerek egyes elemei is – meghibásodási pont lehet.
Mi történne, ha egy fontos rendszer-összetevő meghibásodna, és nincs alternatív, tartalék szoftver, amely elvégezné az így kieső szoftver tevékenységét? Ez növelné a szervezet bizonyos tevékenységei leállásának kockázatát. Ezen beláthatatlan eredménnyel járó szituáció elkerülésének a kulcsa, hogy azonosítjuk a lehetséges meghibásodási pontok, azaz SPOF-ek kockázatait, és azelőtt mérsékeljük, hogy működésbeli kiesést okoznának, és megzavarnák a vállalat üzleti tevékenységét.
Bizonyos SPOF-eket viszonylag egyszerű azonosítani, más esetben némi „nyomozást” követel a folyamat. Az egyes meghibásodási pontok kontrollálása érdekében első lépéseként azonosítani szükséges a potenciális kockázatokat. Az SPOF elemzés során számos kritikus elemet kell azonosítani. Az SPOF elemzés legfontosabb lépéseként az informatikai csapatnak meg kell keresnie minden, redundanciával nem rendelkező szoftver- vagy hardverrendszert, valamint azokat a munkatársakat, akiket vészhelyzetben nem lehet lecserélni, mert üzleti szempontból olyan kritikus feladatokat végez, amelyeket senki más nem tud kezelni. Emellett a különféle hálózati összetevőknél fel kell mérni, mi veszne el, ha az adott elem tönkremenne.
A meghibásodási problémák enyhítésére vonatkozó néhány javaslat:
Minden szervezetnél vannak olyan meghibásodási pontok, amelyek a magas működési kockázatuk miatt megérik a megelőzés költségeit, ráadásul mérsékelhetők, sőt ki is küszöbölhetők. Ezek miatt érdemes azonosítani az SPOF jelenlétét a különféle informatikai rendszerekben.