Cum sa iti tratezi clientii

Dupa cum spuneam, toata ziua de ieri datacenter-ul ines a fost jos. Tot. Motivul? Electrica a pompat “un pic” mai multa energie decat trebuia, asa ca s-au ars ceva echipamente in Data Center. Spun “un pic” pentru ca cei de la ines folosesc 3 nivele de securitate pentru a proteja echipamentele.

Fast forward un pic, eOk, vertimo si BrainTV au fost la pamant pentru 18 ore. Ieri am sunat la ines din 15 in 15 minute. Misha a petrecut ziua de ieri instaland un server de backup in biroul Brainient.

Astazi s-a rezolvat. Cele 3 servere de la eOK n-au patit nimic, dar la 2 servere BrainTV s-a ars controller-ul RAID. Dupa cateva telefoane insistente au mutat hdd-urile pe alte servere si s-a rezolvat.

Cu toate aceste probleme, nu sunt foarte suparat pe ines. Pentru ca au comunicat, pentru ca au raspuns la telefon, pentru ca in cursul zilei de azi m-au sunat de 5 ori ca sa le confirm ca totul e ok, si pentru ca in seara asta mi-au dat un email in care au explicat ce s-a intamplat.

Am dat copy-paste mai jos cu email-ul de la ei.

Stimate client,

Ieri 30.03.2008 in jurul orei 15:15 a avut loc o intrerupere aalimentarii echipamentelor din Data Center iNES.

Astazi impreuna cu ingineri de specialitate de la firmele care ne-auproiectat sistemul de alimentare cu energie electricasi au furnizat echipamentele, am refacut care a fost succesiuneaintimplarilor, am verificat de ce operatiunile de reporniremanuala nu au functionat OK si am definit masurile care trebuiesc luatepentru a evita asemenea situatii pe viitor.

Avaria s-a datorat unei supratensiuni venite din reteaua de medietensiune a Electrica, supratensiune care a produsstrapungerea a 3 nivele de securitate care protejeaza echipamentele Dvsdin Data Center. Ca masura de protectie, sistemeleUPS aflate in Data Center au blocat alimentarea echipamentelor din avalpentru a le proteja.

Repunerea in functiune a sistemelor de siguranta s-a putut face numaipartial de catre personalul iNES; restabilireaintegrala a functionarii s-a facut doar dupa interventia echipei de laElectrica la tabloul transformatorului 20KV in jurul orei 17:45.

Desi alimentarea cu energie electrica a fost refacuta in aproximativ 2ore, repornirea tuturor sistemelor a durat considerabil mai mult.Cu ocazia acestei avarii am constatat deficiente in comunicarea cuclientii si informarea lor:- in scop de monitorizare, este foarte important sa permiteti traficICMP dinspre adresa X.X.X.X catre echipamentele Dvs.In absenta acestei monitorizari, au fost echipamente depre care nu amstiut daca au repornit corect la reluarea alimentarii cu energieelectrica si a durat destul de mult pina la reluarea functionarii lor- capacitatea noastra de a prelua apeluri telefonice a fost micadeoarece era weekend. A fost decizia noastra ca personalul tehnicsa se concentreze pe rezolvarea problemelor tehnice si sa nu seintrerupa pentru a raspunde la apeluri pina nu se reia alimentareacu energie si functionarea sistemelor critice

Va rugam sa verificati faptul ca toate serviciile relevante pentruserverul Dvs (de exemplu serviciul web, baze de date etc) suntconfigurate sa porneasca automat in timpul procesului de boot (secventade initializare a sistemului). Daca aveti nevoie de asistentatehnica in acest sens va rugam sa ne contactati.

Ne cerem scuze pentru neplacerile create si va asiguram ca lucram intenspentru a evita astfel de probleme pe viitor.In acest sens, vom face in curind o lucrare de mentenanta anuntata si osimulare de avarie cu scopul de a verifica faptul ca procedurile delucru si noile solutii tehnice adoptate sint corecte.

–Lucian BîlãiNES GROUP – Sales Director

Asa da. Felicitari ines. Si no hard feelings, dar saptamana asta o sa comand si un server la GTS, for safety reasons :).

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s