Pentru cine nu este familiarizat cu expresia, lebăda neagră reprezintă un eveniment neașteptat cu impact major. Termenul vine din convingerea generală a Europei medievale că toate lebedele sunt albe, asta până la descoperirea Cygnus Atratus în Australia în secolul al XVII-lea. Vineri 15.02, lebăda neagră a zburat pe deasupra Amazon.com și a ciocănit nițel un datacenter.

Căci ambițiile lor sunt mult mai mari decât vânzarea de cărți, DVD-uri și prăjitoare de pâine. Ceea ce dorește Amazon.com este să înlocuiască pur și simplu serverele fizice ale diferitelor afaceri online cu serviciile oferite de ei prin Internet … la un preț … aparent modic. La nivel conceptual, oferta se înscrie undeva la “cloud computing” sau “hardware as a service”. Teoretic, bătăile de cap cu administrarea parcului de servere și gestiunea capacității încetează, tot ce are de făcut programatorul este să-și “arunce” site-ul web pe aceste servicii și ca prin minune acesta va funcționa, proprietarul site-ului urmând să plătească apoi doar numărul de procesoare înmulțite cu durata utilizării plus spațiul de stocare folosit și banda Internet consumată. Nu mai este nevoie de administrare, nu mai sunt necesare negocieri istovitoare cu comercianții de servere și de bandă. Plătești fix cât consumi, sau consumi în limitele planificate.

Teoria este desigur atrăgătoare dar practica e mult mai îmbâcsită. Ceea ce nu-i împiedică pe cei de la Amazon să se afle într-o continuă ofensivă marketing, chiar acum câteva zile Forbes publicând The Death Of Hardware, un articol triumfalist de-a dreptul care nu se sfiește să vorbească despre “următoarea revoluție în high-tech” și “marjele solide de profitabilitate” ale Amazon. În treacăt articolul pomenește despre IBM, EMC, Microsoft, Yahoo sau Sun care [citez] “se luptă” ca să ajungă din urmă firma lui Jeff Bezos.

No single point of failure” este unul dintre punctele tari ale sistemului lor – și anume funcționarea serviciilor nu poate fi întreruptă de o cădere punctuală (cum ar fi un server web, un echipament de rețea sau o bază de date). Vineri însă lebăda neagră a venit să-i contrazică într-un mod destul de vehement, odată cu un downtime de aproximativ 3 ore a unei părți din serviciul de stocare S3, primul incident cu adevărat serios de la lansarea de acum 2 ani. Site-urile mai multor startupuri care se bazează pe S3 – printre care Twitter, 37Signals și AdaptiveBlue – au fost afectate. SLA-ul pe februarie a scăzut deja la 99.55% față de cei 99.9% promiși contractual. Deja, mulți furnizori “clasici” de servicii de hosting se pot lăuda cu SLA-uri mai bune. La naiba, cunosc servicii de găzduire de 15$/lună care au un uptime mai bun !

Îmi permit să trag câteva concluzii din această mică întâmplare:

  • paradigmele la modă nu implică automat stabilitatea unui serviciu,
  • odată cu externalizarea serverelor, pregătește-te să “externalizezi” și căderile,
  • cei mai buni oameni din industrie nu au fost capabili să prevadă că un server de autentificare se poate bloca atunci când foarte mulți utilizatori doresc să se conecteze simultan, dovadă că arhitectura unui “cloud” nu e chiar atât de simplă pe cât credem din diagramele colorate ale lui Werner Vogels, CTO Amazon,
  • în spatele “cloud”-ului sunt tot niște oameni care nu sunt scutiți de greșeli.

cloud_computing1.gif