Palvelimet osoittavat kuolevaisuutensa

Tomi Terentjeff // Olen parin viikon aikana huomannut, miten palvelimet ovat olleet henkitoreissaan. Ensin palvelimemme Louhella päätti heittää totaalivoltit. Se oli alhaalla yli vuorokauden. Palvelimesta oli hajonnut levyjärjestelmä, joten tietojen palauttaminen entiselleen vei pitkään. Louhi lupasi kolme eri ajankohtaa jolloin palvelimen piti nousta. Näistä vasta viimeinen piti paikkansa. Lopullinen downtime oli reilu 1,5 vrk, mikä on anteeksiantamatonta. Harkitsin palvelimien siirtämistä esimerkiksi Nebulalle, mutta kuinkas kävikään:

"18.08.2008

Päivitys: Sähkönsyötössä ongelmia lauttasaaressa

Nebulan Lauttasaaren konesalissa UPS-järjestelmiä syöttävä pääkeskus vaurioitui kello 18:54. Valmistusvian takia ylikuumentunut pääkytkin suli ja katkaisi yhden vaiheen sähkönsyötön. Vika esti sähkönsyötön UPS-järjestelmille ja tämän vuoksi sähkönsyttö katkesi osaan palvelimista akkukapasiteetin loputtua. UPS-järjestelmät pitivät sähkönsyötön toiminnassa noin klo 20:00 asti. Uudelleenjärjestelyt aloitettiin välittömästi ja ne jatkuvat edelleen."

Sattuu sitä "paremmissakin piireissä". Gemilon palvelin on edelleen alhaalla, vaikka valtaosa palvelimista ilmeisesti on jo kunnossa. Onko tällainen vain hyväksyttävä vai onko siirrettävä palvelunsa pakosta Googlen App Engineen tai Amazon Web Serviceen? Puolen päivän downtime ei sekään ole hyväksyttävää, varsinkin jos kyseessä on palvelu, jota käytetään 24/7.

Nämä tapaukset ovat harvinaisia, mutta sattuessaan todellä ikäviä yrityksille.

comments powered by Disqus