sobota, maja 23, 2009

Niezawodność

W czwartek padło Gadu-Gadu. Informacja o tym wyrosła na naszą lokalną informację dnia.Śrubowanie liczby 9
Zadanie:
mamy komputery, które statystycznie pracują dobrze przez 90% [jedna 9] czasu swojej pracy, jak przy ich pomocy zbudować system, który będzie pracował bez kłopotów przez 99.999% [pięć 9] czasu?
Rozwiązanie:
Jeżeli 1 komputer pracuje dobrze przez 90% czasu, to dostawienie drugiego, który będzie pracował w pozostałych 10% czasu sprawi, że cały system będzie pracował przez 99% czasu, jeżeli więc dostawimy jeszcze 3 maszyny to w taki sposób osiągniemy pięć 9 :-)

Oczywiście w trakcie trwania awarii i po niej stada użytkowników i "expertów" zaczęły ujadać w kierunku Gadu-Gadu, jego adminów, właścicieli i wszystkiego związanego z Gadu-Gadu......

Przyznam, że nie wiem czemu.

Zacząć należy od tego, że każdemu się może zdarzyć. Każda serwerowania jest tak odporna jak jej najsłabsze ogniwo. Nie znam szczegółów, ale jestem niemal pewien, że nawaliła jakaś mała część, o której nikt nigdy nie pomyślał.
Oczywiście, że mogli wszystko zdublować, czy też wprowadzić potrójną redundancję na wszystkie elementy. Przecież tak się robi wszystkie śrubowania liczby 9.
Ale to podnosi koszty.
Tutaj pojawia się problem: jakie wydatki na stabilność całego systemu są opłacalne?
Z jednej strony każda godzina przestoju oznacza straty, bo to mniej reklam pokazanych użytkownikom, bo to mniej pieniędzy zarobionych na innych usługach.
Z drugiej każde dodatkowe zabezpieczenie to wydatki. Może być tak, że każda następna 9 to podwojenie wydatków na stabilność.
Z trzeciej strony ;-) reklamodawcy i klienci oczekują niezawodności w myśl zasady "płace i wymagam".
Rozwiązaniem jest więc wybór takiego poziomu niezawodności, w którym zysk będący różnicą wpływów od klientów, a kosztami, będzie największy. I co nie jest zaskakujące ;-) ten zysk nie jest wcale największy przy najwyższej niezawodności.
Chodzi o to by zejść z niezawodnością [a więc i jej kosztami] do najniższego dopuszczalnego przez klientów poziomu.

Zresztą to jest chyba clue kapitalizmy. Obniżyć jakość, czyli koszt produktu lub usługi na tyle by trafić z ceną w ten obszar w którym najwięcej ludzi kupi nasz produkt lub naszą usługę.
Nie chodzi wcale o to by zadowolić jak najbardziej konsumentów, a by zadowolić ich jak największą ilość.
Stąd popularność Biedronki, Manty i innych tanich marek. Stąd popularność kultury masowej.

I teraz wracając do Gadu-Gadu.... nic za to nie płacimy, działają przez większość czasu.... to co się kurde ludzie rzucacie, gdy im się zdarzyła katastrofa? Im naprawienie problemu zajęło chyba mniej niż 10 godzin. Dla porównania na początku 2008 roku w Szczecinie awarię prądu, za który płacą wszyscy, usuwano 2 dni ;-)

Podobne postybeta
SpaceX - jak można być innowacyjnym, nie będąc innowacyjnym? ;-)
Programik > Równanie ;-)
11. Nie będziesz używał komunikatorów innych...
Żarówki kolekcjonerskie ;-)
Opowieść o "zmotywatorach" ;-)

2 komentarze:

  1. Gadu padło... czas przejść na jabbera. Zero reklam, te same funkjonalności i jeszcze trochę więcej i całość nadal za darmo.

    Co do samej awarii to tylko pokazała jak duża jest grupa dzieci neo, które w takim przypadku nie znają żadnych innych rozwiązań.

    OdpowiedzUsuń
  2. Ja jabbera w ten czy inny sposób używam już od ładnych paru lat :-)
    Jednak mimo tego nadal najwięcej kontaktów mam na GG.

    OdpowiedzUsuń