Saltar al contenido principal

Análisis en AWS

Integración de datos con AWS

Conéctese a sus datos y actúe sobre ellos, independientemente de dónde se encuentren

Información general

La información basada en datos de mayor impacto se obtiene al observar una imagen completa de su empresa y clientes. Solo podrá conseguirlo cuando conecte los datos de todos los orígenes de datos de varios departamentos, servicios, herramientas locales y aplicaciones de terceros.

La integración de datos con AWS facilita la conexión a los datos y la actuación, independientemente de dónde se encuentren. Gracias a las capacidades de integración de datos de AWS, puede reunir datos de múltiples orígenes; puede transformar, operacionalizar y administrar datos para ofrecer datos de alta calidad en sus lagos de datos y almacenamientos de datos.

Vea la sesión de re:Invent 2023 sobre nuevos lanzamientos

AWS anuncia cuatro integraciones sin ETL para facilitar y agilizar el acceso a los datos y su análisis en todos los almacenes de datos

Circular diagram illustrating the data integration lifecycle, with four colored sections labeled Manage, Connect, Transform, and Operationalize.

Ventajas de la integración de datos con AWS

    Sus datos proceden de múltiples orígenes y en diversos formatos: aplicaciones alojadas de terceros, almacenes de datos locales y almacenes de datos operativos. Los servicios de AWS se conectan a cientos de orígenes de datos, incluido el software como servicio (SaaS) de terceros, en las instalaciones y otras nubes. Una vez que haya conectado o trasladado datos a lagos de datos, almacenamientos y bases de datos, puede hacer que estén disponibles de forma segura en toda la organización.

    AWS Glue, uno de los muchos servicios de integración de datos de AWS, consolida las principales capacidades de integración de datos en un solo lugar, incluidos descubrimiento, extracción, transformación y carga (ETL) de datos, limpieza, transformación y catalogación centralizada. Se trata de un servicio sin servidor que puede aprovisionar y administrar trabajadores automáticamente según sea necesario.

    AWS proporciona herramientas que satisfacen las necesidades de ingenieros de datos, desarrolladores ETL y analistas empresariales, ayudando a usuarios de todos los niveles técnicos a explorar y trabajar con sus datos de forma interactiva. Puede transformar datos visualmente con una interfaz de arrastrar y soltar en AWS Glue Studio, limpiar y normalizar datos con la herramienta de preparación de datos AWS Glue DataBrew y probar datos con su entorno de desarrollo integrado (IDE) o cuaderno preferido.

    A menudo, las organizaciones deben admitir diversos marcos de procesamiento de datos, como ETL, ETL inverso y extracción, carga y transformación (ELT), así como diferentes cargas de trabajo, como lotes, microlotes y streaming. AWS proporciona compatibilidad flexible con todos los marcos de trabajo y cargas de trabajo, y permite la portabilidad gracias a los estándares de código abierto.

Aborde los desafíos de la integración de datos con AWS

    AWS le ayuda a obtener acceso a los datos e integrarlos desde cualquier lugar donde los almacene, lo que permite a los equipos de integración de datos centrarse en actividades de alto valor que maximizan el valor de los datos.

    AWS Glue facilita el descubrimiento, la preparación y la integración de todos los datos a cualquier escala. AWS Database Migration Service ayuda a trasladar cargas de trabajo de bases de datos y análisis a AWS de forma rápida, segura, con un tiempo de inactividad mínimo y sin pérdida de datos. Amazon Managed Workflows para Apache Airflow (MWAA) proporciona orquestación de flujos de trabajo administrados segura y de alta disponibilidad para Apache Airflow. AWS Data Exchange conecta con datos de terceros de más de 300 proveedores de datos y más de 3500 productos de datos.

    En casos de uso complejos en los que necesita transformar, normalizar, comprobar la calidad de los datos antes de ingestarlos desde un almacén de datos sin procesar o reducir las columnas, filas o el tamaño de los datos de una tabla, AWS Glue le facilita la preparación e integración de los datos.

    En casos de uso comunes en los que ETL se repite con regularidad, puede utilizar las capacidades Zero-ETL de AWS, que eliminan la necesidad de crear y administrar canalizaciones ETL. Gracias a las capacidades de Zero-ETL de AWS, puede ingerir directamente datos de streaming de Amazon Managed Streaming para Apache Kafka en Amazon Redshift, analizar datos de Amazon Aurora con Amazon Redshift casi en tiempo real y mucho más.

    Los usuarios de la empresa tienen distintas capacidades técnicas para interactuar con los datos y es posible que no puedan hacerlo sin las herramientas adecuadas.

    AWS proporciona interfaces específicas de habilidades y herramientas de creación de trabajos para todo tipo de usuarios, desde desarrolladores hasta usuarios empresariales. AWS Glue Studio genera automáticamente código ETL y permite a los desarrolladores de ETL y a los analistas empresariales transformar datos con una interfaz sin código. AWS Glue también permite a los desarrolladores e ingenieros utilizar su IDE, bloc de notas y motores de procesamiento preferidos. Amazon Managed Workflows para Apache Airflow permite a científicos e ingenieros orquestar canalizaciones de datos integrales.

    AWS ofrece soporte para varias cargas de trabajo sin bloqueo.

    AWS Glue Studio le ayuda a crear trabajos ETL altamente escalables sin necesidad de convertirse en un experto en Apache Spark, y a cargar datos estructurados y no estructurados en almacenamientos y lagos de datos. Amazon Managed Streaming para Apache Kafka (MSK) y Amazon Kinesis facilitan la ingesta y el procesamiento de datos de streaming en tiempo real. Otras cargas de trabajo habituales son la transformación de datos por lotes, la replicación de bases de datos, la ingesta de datos desde SaaS, el uso compartido de datos entre equipos y la suscripción a datos de terceros.

Servicios y características de AWS relacionados

AWS Glue: descubra, prepare e integre todos sus datos a cualquier escala

AWS Q for Data Integration: la capacidad generativa de AWS Glue basada en IA le permite crear trabajos de integración de datos mediante lenguaje natural.

Amazon Managed Workflows for Apache Airflow: orquestación de flujos de trabajo gestionados segura y de alta disponibilidad para Apache Airflow

Amazon AppFlow: automatice los flujos de datos entre el software como servicio (SaaS) y los servicios de AWS

Integraciones de Amazon Aurora Zero-ETL con Amazon Redshift: realice análisis y aprendizaje automático casi en tiempo real de petabytes de datos transaccionales en Aurora

Integración sin ETL de Amazon Aurora PostgreSQL con Amazon

Integración sin ETL de Amazon DynamoDB con Amazon Redshift

Integración sin ETL de Amazon RDS para MySQL con Amazon Redshift

Integración sin ETL de Amazon DynamoDB con Amazon OpenSearch Service

Servicio de migración de bases de datos de AWS: traslade sus flujos de trabajo de bases de datos y análisis a AWS de forma rápida, segura y con un tiempo de inactividad mínimo y sin pérdida de datos

Amazon Athena: analice los datos a escala de petabytes donde se encuentran con facilidad y flexibilidad

Amazon Redshift: la mejor relación precio-rendimiento para el almacenamiento de datos en la nube

AWS Lake Formation: cree, administre y proteja lagos de datos en cuestión de días

Intercambio de datos de AWS: busque, suscríbase y utilice fácilmente datos de terceros en la nube

Catálogo AWS Glue: almacene, anote y comparta metadatos en la nube de AWS

Amazon DataZone: desbloquee datos más allá de los límites de la organización con una gobernanza integrada

Novedades

Cargando
Cargando
Cargando
Cargando
Cargando