¿Qué es la arquitectura del sistema de almacenamiento de datos de Amazon Redshift?

Que Es La Arquitectura Del Sistema De Almacenamiento De Datos De Amazon Redshift



Alojar y gestionar datos en bases de datos y almacenes de datos siempre ha sido una tarea agitada y problemática. Se requieren muchos recursos y potencia computacional para darle sentido a los datos. Amazon Web Services tiene una solución integral para este propósito. Tiene un servicio llamado Amazon Redshift que gestiona completamente los almacenes de datos de los usuarios.

Este artículo explicará en detalle Amazon Redshift junto con su arquitectura de almacén de datos. Se explicarán en detalle todos los componentes de la arquitectura del sistema de almacenamiento de datos de Redshift.







¿Qué es el corrimiento al rojo de Amazon?

TI es un servicio de almacenamiento de datos proporcionado por Amazon. Gestiona y analiza de manera eficiente grandes conjuntos de datos para análisis e informes. Está construido sobre un modelo de almacenamiento en columnas. Utiliza grupos de nodos informáticos controlados por un nodo líder para proporcionar procesamiento de datos de alto rendimiento.



Toma datos de diferentes fuentes y los agrupa para crear un almacén de datos. Ofrece diferentes funciones, como intercambio de datos y análisis en tiempo real. Vea la imagen a continuación para comprender las características y capacidades de Amazon Redshift:







Vayamos ahora a la arquitectura del sistema de almacenamiento de datos.

¿Qué es la arquitectura del sistema de almacenamiento de datos de Amazon Redshift?

Esta arquitectura de sistema tiene tres partes principales. Estas partes son:



  • Almacenamiento
  • Aceleración
  • Cálculo

Entendamos sus propósitos:

Almacenamiento
La parte de almacenamiento trata de los servicios de almacenamiento que tiene Redshift. Tiene su propia opción de servicio de almacenamiento administrado, así como una opción de depósito S3.

Aceleración
La parte de aceleración depende del servicio de almacenamiento en uso y de la potencia computacional empleada. El almacenamiento administrado por Redshift es más rápido en comparación con otras opciones de almacenamiento

Cálculo
La parte de cálculo se ocupa exclusivamente de la potencia informática en uso. La computación se realiza con clústeres y los clústeres tienen nodos. Los nodos a su vez tienen cortes.

Para comprender mejor todos los elementos y componentes de esta arquitectura, vea la imagen a continuación:

Entendamos sus componentes uno por uno.

¿Cuáles son los componentes arquitectónicos de Amazon Redshift?

Los siguientes son los componentes arquitectónicos de Amazon Redshift:

  • Clústeres
  • Nodos
  • Rebanadas de nodos
  • Almacenamiento
  • Red interna
  • Bases de datos

Analicemos estos uno por uno:

Clústeres
Un cluster es la unidad fundamental y central. Se compone de varios nodos. Si un clúster consta de varios nodos informáticos, un nodo líder adicional interviene para coordinar las actividades de estos nodos informáticos y gestionar la comunicación externa.

Nodos

Los nodos en los clústeres son de dos tipos. Estos son:

  • Nodo líder
  • Nodo de cálculo

Entendamos estos uno por uno:

Nodo líder
Gestiona la comunicación con los programas cliente y coordina las interacciones con los nodos informáticos. El nodo líder juega un papel vital en la ejecución de consultas complejas. Compila código basado en el plan de ejecución que se distribuye a los nodos informáticos y asigna porciones de datos a cada nodo informático individual.

Nodo de cálculo
Los nodos informáticos son la columna vertebral de la arquitectura de Amazon Redshift. Realizan tanto el almacenamiento como el procesamiento de datos. Estos tienen recursos dedicados, como memoria y CPU.

Rebanadas de nodos
Los nodos informáticos se dividen a su vez en sectores. Estos sectores trabajan juntos para procesar cargas de trabajo asignadas y lograr paralelismo para mejorar el procesamiento de consultas.

Almacenamiento
El almacenamiento de datos dentro de Amazon Redshift es administrado por 'Redshift Managed Storage (RMS)'. Tiene la capacidad de escalar el almacenamiento de forma independiente utilizando el almacenamiento “Amazon S3”. RMS utiliza almacenamiento local basado en SSD de alto rendimiento como caché de nivel 1 que optimiza el rendimiento.

Red interna
Esta red interna de Amazon Redshift ayuda a una comunicación rápida y segura entre los nodos líderes y los nodos informáticos. Esta red no es accesible directamente para las aplicaciones cliente.

Bases de datos
Los clústeres tienen una o más bases de datos. Los datos de estas bases de datos se encuentran en nodos informáticos. Las aplicaciones cliente se comunican con el nodo líder. El nodo informático gestiona la ejecución de consultas entre nodos informáticos.

Se trata de Amazon Redshift y sus elementos arquitectónicos. Este artículo ha explicado exhaustivamente los componentes de trabajo de Amazon Redshift.

Conclusión

La arquitectura de Amazon Redshift es la base de sus capacidades. El nodo líder controla y gestiona los nodos de cálculo y los sectores de nodos ayudan en el procesamiento paralelo. Redshift Managed Storage utiliza almacenamiento basado en SSD para mejorar el rendimiento. En este artículo se explica la arquitectura del sistema de almacenamiento de datos de Amazon Redshift.