Agence web » Actualités du digital » Quel stockage AWS devez-vous utiliser pour un serveur de base de données? –

Quel stockage AWS devez-vous utiliser pour un serveur de base de données? –

comment-automatiser-la-creation-de-machines-virtuelles-aws-a-partir-6689232

Les performances de la base de données sont fortement affectées par les performances de la mémoire sous-jacente. Pour les lectures, avoir beaucoup de RAM peut accélérer les choses, mais pour les opérations lourdes en écriture, le goulot d’étranglement est le SSD du disque dur qu’il manque. AWS propose de nombreuses options de stockage, alors laquelle vous convient le mieux?

Instances EC2 axées sur la base de données

Au-delà du stockage sous-jacent, de nombreux autres facteurs influent sur les performances de la base de données. AWS possède de nombreuses classes d’instances différentes avec des niveaux individuels en leur sein.

L’instance la plus orientée base de données est la série R5. Les thèses sont optimisées pour les performances de la mémoire, à la fois avec la vitesse et la taille de la RAM et les performances EBS. Ils offrent un rapport élevé entre le nombre de cœurs et la mémoire disponible, allant jusqu’à 768 Go de RAM sur le r5.24xlarge.

Il y a aussi la série r5d, une sous-classe de R5 qui offre un disque local directement, pas sur EBS. Le plus grand niveau comprend quatre disques SSD NVMe de 900 Go. Plus petite que la capacité maximale d’EBS, mais aura des performances stellaires et une grande latence.

Il existe également la série D3, qui offre la plus grande quantité de stockage local possible pour une instance EC2, jusqu’à 336 To. Si vous cherchez à exécuter une instance particulièrement massive stockant beaucoup de données, D3 peut fonctionner le mieux pour vous.

Types de volume EBS

EBS a quelques niveaux différents. Le plus courant est gp3, qui est un volume sauvegardé SSD à usage général qui offre des performances solides à un prix plus élevé que les volumes sauvegardés sur disque dur. gp3 est la dernière génération, remplaçant gp2et offrant des performances 4x meilleures avec les SSD PCIe Gen 4.

gp3 utilise un modèle de tarification en rafale. En fonction de la taille du volume, il gagne des «crédits IO» par heure qui sont utilisés automatiquement pour acheter des IOPS, ou des opérations d’entrée-sortie-par-seconde. Cela permet des rafales rapides de performances en cas de besoin, mais si vous avez besoin de performances stables et solides, ce n’est pas une bonne idée. Il existe également un nombre maximum d’IOPS; pour gp3, c’est 16 000.

Modèle de godet de rafale GP2

Les volumes gagnent des crédits IO à un taux de 3 par Go par seconde. Cela signifie que si vous avez un volume supérieur à 1 To, votre compartiment sera toujours plein et vous n’aurez pas à vous soucier des performances en rafale. Tout ce qui est inférieur à cela, et vous êtes limité à la performance de base en fonction du nombre de crédits que vous gagnez.

Les performances de base dépassent la rafale après 1 To

Ce que cela signifie en pratique, c’est que si vous avez besoin de performances supplémentaires, vous voudrez utiliser le deuxième volume basé sur SSD, io2, également appelé SSD IOPS provisionné. Ceux-ci vous permettent littéralement d’acheter directement les performances du disque, provisionnées sur votre volume EBS. Le meilleur niveau, io2 Block Express, offre jusqu’à 4000 Mo / s par volume et 7500 Mo / s par instance.

C’est jusqu’à quatre fois la performance de gp3, mais seulement si vous pouvez la payer – la bande passante est chère et vous devrez en payer la totalité. Un haut de gamme io2 le volume peut facilement coûter des milliers de dollars par mois, plus que l’instance EC2 qui peut être exécutée dessus. Cela s’ajoute à l’augmentation de 83% des coûts de stockage par Go.

Tandis que io2 est une option pour les clients qui ont besoin de chaque once de performances qu’ils peuvent obtenir, à moins que vous ne maximisiez votre lecteur, l’objectif général gp3 les volumes seront excellents pour de nombreuses personnes.

Volumes du disque dur

Il existe deux volumes EBS de disque dur principaux, les volumes HDD à débit optimisé (st1) et les volumes Cold HDD (sc1). Les noms sont assez explicites – st1 est optimisé pour des vitesses de lecture séquentielles assez décentes (bien que des performances aléatoires terribles, comme tous les disques durs). Pour les applications non critiques nécessitant des fichiers de grande taille, sc1 offre d’excellentes performances de stockage local.

Les deux types de volumes utilisent également le modèle de compartiment en rafale, mais plafonnent à un nombre de Mbps fixe en fonction de la taille du volume.

Le débit de base est toujours inférieur à la rafale

Cependant, pour les bases de données, les performances de lecture et d’écriture aléatoires peuvent avoir beaucoup d’importance, tout comme la latence. Nous sommes en 2020, et vos utilisateurs ne devraient pas avoir à attendre qu’un disque tourne et à attendre qu’une tête de lecture magnétique récupère des données de base. Sans parler de la façon dont il gérerait les requêtes SQL complexes qui pourraient interrompre le disque.

Pour tout ce qui concerne l’utilisateur, les performances sont importantes et vous devez utiliser un SSD. Le seul cas où cela a du sens est dans les applications lourdes en lecture où la base de données est suffisamment petite pour pouvoir être conservée principalement en mémoire, mais même dans ce cas, elle serait suffisamment petite où la légère prime même d’un volume gp3 de base en vaut la peine. .

Cependant, pour le Big Data, l’analyse et d’autres bases de données internes, la base de données peut être si volumineuse que le coût du stockage local est trop élevé pour fonctionner sur des disques SSD. Si vous cherchez à exécuter un lac de données haute capacité ou un cluster multi-serveurs, vous ne vous souciez peut-être pas tellement de la vitesse du disque légèrement inférieure, surtout si cela vous permet d’économiser de l’argent dans le processus.

★★★★★