dimanche 7 mars 2010

Le Disaster Recovery selon Google

Cet article est une traduction non officielle de la récente annonce de Google concernant la mise en oeuvre du Disaster Recovery pour les Google Apps.

Serez-vous prêt quand le désastre frappera ? C'est une question difficile pour de nombreux administrateurs IT, parce qu'y répondre avec assurance requiert en général à la fois de l'argent, une très grande complexité, et de croiser les doigts. Heureusement il y a plus simple.

En prenant pour exemple la messagerie, regardons quelques moyens utilisés par les entreprises pour protéger leurs données. Idéalement une petite entreprise réalise des backups de ses mails. Elle possède un serveur de mail, et copie les données chaque jour ou chaque semaine vers une bande. Si quelque chose se passe mal, il faut retourner cherche la bande et restaurer les données sauvegardées lors du dernier backup. Mais les informations créées après le plus récent backup sont définitivement perdues.


Les entreprises plus grandes ajouteront un SAN (Storage Area Network), qui est un emplacement  consolidé de tous les stockages. Les SANs sont coûteux, et même avec cela, vous ne résolvez pas votre problème si votre data center tombe. Les plus grande entreprises construisent donc un autre data center à un autre endroit, avec un nouvel ensemble de serveurs mails identiques, un autre SAN et du personnel pour les gérer.


Mais si, par malheur, le désastre frappe vos deux data centers, c'est fichu (A voir cette expérience d'un client avec un feu). C'est pourquoi les grandes entreprises vont souvent construire le deuxième data center très loin, dans une "zone de risque" différente, ce qui crée encore plus de problèmes de management. Ensuite il faudra s'assurer que le SAN primaire est connecté au SAN backup, il faudra donc mettre en place une bande passante suffisamment robuste pour faire circuler l'information sans handicaper le réseau. Il y a d'autres solution de backup, mais l'histoire reste la même : Quand la redondance augmente, les coûts et la complexité sont multipliés.


Les clients de Google Apps n'ont aucun besoin de se soucier de tout cela pour les données qu'ils créent et stockent sous Google Apps. Ils bénéficient de ce qui se fait de mieux en matière de Disaster recovery gratuitement, qu'elle que soit leur taille. C'est l'une des nombreuses raisons qui ont décidé la ville de Los Angeles à choisir Google.


Comment savoir si une solution de disaster recovery est suffisamment robuste ? C'est en principe mesuré selon deux axes : RPO (Recovery Point Objective) et RTO (Recovery Time Objective). Le RPO est la quantité de données que l'on accepte de perdre si les choses se passent mal, et RTO est le temps qui s'écoule entre le désastre et le rétablissement du service.


Pour une grande entreprise utilisant des SANs, les cibles RTO et RPO sont égales ou inférieures à une heure: Plus c'est cher, moins c'est long. Cela peut signifier qu'une grande entreprise qui dépense beaucoup d'argent pour ses sauvegardes, souhaite perdre tous les mails envoyés pendant une heure après la chute du système, et ne peut pas utiliser son système de mail pendant une heure. Les entreprises sans SANs devront transporter les bandes entre les data center, on peut donc imaginer que leurs RPOs et RTOs doivent atteindre des jours. Comme pour les petites entreprises, ils doivent souvent tout redémarrer de zéro.


Pour les clients de Google Apps, notre cible RPO est zéro (aucune perte de données), et notre cible RTO est le temps de basculement. Nous réalisons cela grâce à une réplication synchrone : Chaque action réalisée dans GMail est répliquée simultanément dans deux data centers, ce qui fait que si un data center tombe, nous pouvons instantanément transférer les données sur l'autre, qui a également répliqué les actions.


Notre objectif est de ne perdre aucune donnée lors du transfert d'un data center à l'autre, et de transférer les données si vite que l'on ne se rende même pas compte qu'il y a eu une interruption. Bien entendu, aucune solution de backup n'est absolument parfaite, mais nous avons consacré énormément d'énergie à nous en approcher.


Il ne s'agit pas uniquement de préserver les comptes GMail. Le même niveau de réplication des données est appliqué à toutes les principales applications de la suite Apps : Google Calendar, Google Docs et Google Sites.


Certaines entreprises ont également adopté la réplication synchrone, mais cela est encore plus couteux que tout ce que l'on a déjà mentionné. Pour un backup de 25 Go de données en réplication synchrone, une entreprise peut facilement dépenser de 150$ à plus de 500$ en stockage et en coûts de maintenance, et cela pour chaque employé. Cela ne prend même pas en compte le coût des applications. Le prix exact dépend d'un grand nombre de facteurs, tels que le nombre de fois où les données sont répliquées, et le choix du fournisseur.


A minima, une entreprise peut limiter le nombre de réplications, au mieux elle peut réaliser plusieurs copies pour toutes les données. Nous répliquons également les données plusieurs fois, et les 25 Go de données GMail par employé sont sauvegardées gratuitement. De plus des espaces de stockage sont mis à disposition via les applications Google Docs, Google Sites et Google Vidéo. Il se peut que d'autres éditeurs proposent également des solutions en Cloud computing, mais n'imaginez pas qu'ils sauvegardent les données dans plusieurs data center.


Voici quelque une des raisons qui nous permettent d'offrir ce niveau de service. Premièrement, nous exploitons un grand nombre de puissants data centers simultanément pour des millions d'utilisateurs, ce qui nous aide à réduire les coûts tout en accroissant la robustesse et la redondance. Deuxièmement, nous ne gaspillons pas d'énergie et d'argent à laisser un data center en "stand by" jusqu'à ce que quelque chose se passe mal - Nous pouvons répartir la charge entre  les data centers selon le besoin.


Pour finir, nous avons des connexions extrêmement rapides entre nos data centers, ce qui nous permet de transférer les données très rapidement d'une ferme de serveurs à une autre. Cela nous permet de répliquer en même temps de grandes quantités de données.


L'un des avantages les plus convaincants du Cloud Computing est sa capacité à faciliter l'accès à la technologie. Que se soit pour disposer d'une boîte mail de 25 Go, de la vidéo pour l'entreprise, de la réplication synchrone, ou de quantité d'autres services, Google Apps donne aux entreprises de toutes tailles l'accès et des technologies qui n'étaient jusqu'à présent accessibles qu'à des grandes entreprises. Et cela est disponible pour un coût considérablement moins élevé que les alternatives sur site, sans les soucis habituels de montée de version, de patch et autres actions de maintenance du logiciel.


Personne n'aime se préparer au pire des scénarios. En utilisant Google Apps, vous n'avez plus à vous soucier de cela.




"Posted by Rajen Sheth, Senior Product Manager, Google Apps".  *article original en Anglais.




Autres articles relatifs à Google Apps