Agence web » Actualités du digital » Comment configurer Auto Scaling sur Google Cloud Platform

Comment configurer Auto Scaling sur Google Cloud Platform

La mise à l'échelle automatique est une fonctionnalité proposée par de nombreux fournisseurs de cloud comme AWS et Google Cloud Platform, qui gérera automatiquement la création et la suppression de nouveaux serveurs dans votre réseau, vous permettant ainsi de faire évoluer votre application pour répondre à différentes charges.

Qu'est-ce que la mise à l'échelle automatique?

Supposons que vous ayez deux serveurs derrière un équilibreur de charge, tous deux gérant de manière égale la moitié de votre trafic. Si vous devez gérer plus de demande, vous ajoutez un autre serveur. Cependant, cette demande est souvent cyclique, culminant chaque jour avec une charge plus élevée, il serait donc pénible de gérer cela manuellement.

La mise à l'échelle automatique le gère, comme son nom l'indique, automatiquement. Vous définissez un modèle prédéfini qui est utilisé pour démarrer une copie de vos serveurs à partir de zéro. Chaque fois que votre réseau atteint une quantité prédéterminée de charge, par exemple 70% d'utilisation du processeur, la mise à l'échelle automatique déclenche une nouvelle instance pour faciliter les choses. Lorsqu'il se calme, il réduit le nombre ou les instances.

Bien sûr, la configuration de ce modèle ne sera pas facile, mais GCP dispose d'outils pour rendre cela plus simple, comme la possibilité d'utiliser un conteneur comme image de machine.

Si Auto Scaling vous permet d’évoluer pour répondre à toute demande, il peut également vous faire économiser de l’argent en réduisant la taille lorsque cela n’est pas nécessaire. Avec l'hébergement de serveur traditionnel, vous devez planifier les pics de demande. Si votre serveur ne peut pas gérer les pics de trafic, vous avez besoin d'un meilleur serveur. Cependant, il s'agit généralement d'un gaspillage d'argent, car pendant les heures creuses, lorsque votre application n'est pas sous la charge de pointe, vous payez plus que nécessaire.

Même si vous n'utilisez qu'un ou deux serveurs, la configuration d'Auto Scaling peut aider votre réseau à gérer les pics d'activité du trafic et constitue une fonctionnalité utile pour tout réseau à haute disponibilité.

Configuration d'un groupe d'instances géré

Dans la console de gestion GCP, sélectionnez Compute Engine> Groupes d'instances.

comment-configurer-auto-scaling-sur-google-cloud-platform-cloudsavvy-5903494notre guide sur leur mise en place.

En dessous, vous trouverez les paramètres d'Auto Scaling. Le mode par défaut augmente et diminue automatiquement, mais vous pouvez désactiver la mise à l'échelle et ne faire augmenter que le réseau. Vous pouvez également définir la métrique qu'il utilise sur Auto Scale, qui est définie sur l'utilisation du processeur à 60% par défaut.

La période de refroidissement correspond essentiellement au temps de chargement d'un nouveau serveur. Si votre serveur prend une minute ou deux pour tout configurer, vous ne voulez pas que GCP examine ces métriques pendant la configuration, car il pourrait signaler utilisation inattendue du processeur.

Vous pouvez également modifier le nombre minimum et maximum d'instances, pour garantir les performances et limiter les coûts, respectivement.

La dernière fonctionnalité est la réparation automatique, qui effectuera régulièrement des vérifications de l'état des services exécutés sur chaque instance. Si une instance commence à agir, elle peut être remplacée facilement. Si vous disposez d'un équilibreur de charge, il achemine automatiquement le trafic, mais ne corrige pas l'instance elle-même sans auto-réparation. Nous vous recommandons d'activer cette fonctionnalité.

Cliquez sur "Créer" et le nombre minimum d'instances sera créé. Vous pouvez les gérer individuellement à partir de la console Compute Engine ou gérer le modèle d'instance pour modifier les paramètres de l'ensemble du groupe.

★★★★★