Almacén de datos en la nube de AWS

Almacén de datos en la nube de AWS

Almacén de datos en la nube de AWS

Amazon Redshift es un servicio de almacenamiento de datos administrado ofrecido por Amazon Web Services. Basado en PostgreSQL, se comunica con aplicaciones de terceros a través del protocolo ODBC.

¿Qué es Amazon Redshift?

Lanzado en octubre de 2012 por AWS, Amazon Redshift es un servicio de almacenamiento de datos completamente administrado. Basado en un sistema de gestión de bases de datos (DBMS) en columnas, ofrece un procesamiento masivo en paralelo.

Diseñado para cargas de trabajo analíticas, Amazon Redshift maneja volúmenes de datos de petabytes (1015 bytes). Basado en el motor PostgreSQL, un estándar de la industria de código abierto, el almacén de datos en la nube se integra con la mayoría de las aplicaciones de terceros a través de los protocolos ODBC (conectividad de base de datos abierta) y JDBC (conectividad de base de datos Java). Esta oferta complementa otros servicios de administración de bases de datos relacionales (SimpleDB y Amazon RDS) y no relacionales (DynamoDB) de AWS.

¿Cuáles son los casos de uso de Amazon Redshift?

Amazon Redshift proporciona la infraestructura para consultas SQL rápidas. Diseñado para el procesamiento de datos de alto rendimiento, Redshift ayuda a crear, entrenar e implementar modelos de aprendizaje automático. Amazon Redshift proporciona herramientas de inteligencia empresarial para crear informes y paneles personalizados.

¿Amazon Redshift es una base de datos relacional (SQL)?

Amazon Redshift es un sistema de gestión de bases de datos relacionales compatible con otros RDBMS del mercado. A diferencia de las bases de datos tradicionales, el servicio de AWS almacena datos agrupándolos por columnas y no por filas. Centrado en big data, un RDBMS orientado a columnas proporciona tiempos de respuesta rápidos a consultas complejas.

Sin servidor Amazon Redshift

Amazon Redshift Serverless es la opción sin servidor de Amazon Redshift. El enfoque sin servidor facilita la configuración y administración de la infraestructura del usuario. El almacén de datos escala automáticamente en función de la carga de trabajo.

Con Amazon Redshift Serverless, el usuario simplemente carga datos en la base de datos antes de que se puedan consultar o compartir. En una base de pago por uso, la facturación es por segundo.

¿Qué es Amazon Redshift Spectrum?

Redshift Spectrum es una función de Amazon Redshift diseñada para lanzar consultas directamente desde Redshift sobre datos estructurados o semiestructurados almacenados en el servicio de almacenamiento de objetos de Amazon S3. Esto le permite consultar o recuperar estos datos evitando cargarlos en las tablas de Redshift, incluso desde varios clústeres de Redshift a la vez.

Corrimiento al rojo vs. Atenea

Si bien Amazon Redshift es un almacén de datos, Amazon Athena es solo un servicio de consulta diseñado para consultar o analizar datos estructurados o semiestructurados almacenados en Amazon S3.

Desplazamiento al rojo frente a RDS

Donde Amazon RDS (para base de datos relacional) es una plataforma de datos relacionales, Amazon Redshift se presenta en forma de un almacén de datos que está estructurado de manera diferente, especialmente en columnas. Esto le permite procesar volúmenes masivos de datos con mayor velocidad.

Corrimiento al rojo vs. Aurora

A diferencia de Redshift, que es un almacén de datos estructurado en columnas, Amazon Aurora es un sistema de administración de bases de datos relacionales (RDBMS). Compatible con MySQL y PostgreSQL, Aurora se ofrece como parte de la oferta de Amazon RDS.

Desplazamiento al rojo frente a EMR

Amazon EMR (anteriormente Amazon Elastic MapReduce) es una plataforma basada en instancias EC2 diseñada para ejecutar los marcos de trabajo de big data de código abierto Apache Hadoop y Apache Spark. También diseñado para el procesamiento de big data, Redshift es un almacén de datos estructurado en columnas creado directamente por los equipos de Amazon Web Services.

Desplazamiento al rojo frente a copo de nieve

En comparación con la plataforma de datos Snowflake, la principal ventaja de Redshift radica claramente en su integración con la oferta en la nube de AWS. En comparación con Redshift, la fortaleza de Snowflake es la separación del almacenamiento de la computación. Resultado: permite recoger picos de tráfico aumentando la capacidad informática sin aumentar visiblemente la cantidad de almacenamiento.

Documentación de Amazon Redshift

En su sitio, AWS ofrece documentación técnica proporcionada sobre Redshift en francés, con varias guías y tutoriales:

Leave a Reply

Your email address will not be published. Required fields are marked *