Formación

Introducción a la ingeniería de datos en Google Cloud

Modalidad:

En línea, en persona

En Matza Education, cada curso de formación está diseñado para ofrecer conocimientos prácticos y relevantes, conectando teoría y aplicación en escenarios reales. Nuestro objetivo es preparar a los profesionales para los retos del mercado, reforzando las competencias técnicas y estratégicas en diferentes áreas de la tecnología y la gestión.

Al participar en uno de nuestros programas, tendrá acceso a contenidos actualizados, formadores experimentados y una metodología orientada a los resultados. Independientemente del formato -presencial u online-, nuestro objetivo es crear una experiencia de aprendizaje dinámica, accesible y de gran impacto.

Más que un curso, cada programa de formación es una oportunidad de desarrollo profesional y personal, que le ayudará a obtener certificaciones, ampliar sus conocimientos y destacar en un mercado cada vez más competitivo.

Importante: debe confirmar el correo electrónico que recibió tras inscribirse para validar su participación.

  • Ingenieros de datos
  • Administradores de bases de datos
  • Administradores de sistemas

En este curso, aprenderá acerca de la ingeniería de datos en Google Cloud, las funciones y responsabilidades de los ingenieros de datos y cómo se relacionan con los servicios proporcionados por Google Cloud. También aprenderá formas de afrontar los retos de la ingeniería de datos.

En este curso, los participantes aprenderán las siguientes habilidades:

  • Comprender el papel de un ingeniero de datos.
  • Comprender las tareas de ingeniería de datos y los principales componentes utilizados en Google Cloud.
  • Entender cómo crear e implementar canalizaciones de datos de varios estándares en Google Cloud.
  • Identificar y utilizar diversas técnicas de automatización en Google Cloud.

Para sacar el máximo partido de este curso, los participantes deben cumplir los siguientes criterios:

  • Experiencia previa con Google Cloud a un nivel fundamental utilizando Cloud Shell y accediendo a productos en la consola de Google Cloud.
  • Conocimientos básicos de un lenguaje de consulta común como SQL.
  • Experiencia en modelado de datos y actividades ETL (extraer, transformar, cargar).
  • Experiencia en el desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.

Experiencia en el desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.

1 día - 08 horas lectivas - En directo en línea

Módulo 01: Tareas y componentes de ingeniería de datos

  • El papel de un ingeniero de datos
  • Fuentes de datos frente a destinos de datos
  • Formatos de datos
  • Opciones de almacenamiento en Google Cloud
  • Opciones de gestión de metadatos en Google Cloud
  • Compartir conjuntos de datos mediante el Analytics Hub

Objetivos:

  • Explique la función de un ingeniero de datos.
  • Comprender las diferencias entre una fuente de datos y un destino de datos.
  • Explicar los distintos tipos de formatos de datos.
  • Explicar las opciones de soluciones de almacenamiento en Google Cloud.
  • Más información sobre las opciones de gestión de metadatos en Google Cloud.
  • Entender cómo compartir conjuntos de datos fácilmente utilizando el Analytics Hub.
  • Comprender cómo cargar datos en BigQuery utilizando la consola de Google Cloud o la CLI de gcloud.

Módulo 02: Replicación y migración de datos

  • Arquitectura de replicación y migración
  • La herramienta de línea de comandos gcloud
  • Traslado de conjuntos de datos
  • Datastream

Objetivos:

  • Explicar la arquitectura básica de la replicación y migración de datos de Google Cloud.
  • Comprender las opciones y los casos de uso de la herramienta de línea de comandos gcloud.
  • Explicar la funcionalidad y los casos de uso del Servicio de Transferencia de Almacenamiento.
  • Explicar la funcionalidad y los casos de uso de Transfer Appliance.
  • Comprender las características y la aplicación de Datastream.

Módulo 03: La norma de canalización de datos de extracción y carga

  • Arquitectura de extracción y carga
  • La herramienta de línea de comandos bq
  • Servicio de transferencia de datos BigQuery
  • BigLake

Objetivos:

  • Explique el diagrama básico de la arquitectura de extracción y carga.
  • Comprender las opciones de la herramienta de línea de comandos bq.
  • Explicar la funcionalidad y los casos de uso del servicio de transferencia de datos de BigQuery.
  • Explicar la funcionalidad y los casos de uso de BigLake como estándar sin extracción ni carga.

Módulo 04: La norma de canalización de datos de extracción, carga y transformación

  • Arquitectura de extracción, carga y transformación (ELT)
  • Programación y secuencias de comandos SQL con BigQuery
  • Formulario de datos

Objetivos:

  • Explique el diagrama básico de la arquitectura de extracción, carga y transformación.
  • Comprender una canalización ELT común en Google Cloud.
  • Conozca las funciones de programación y secuencias de comandos SQL de BigQuery.
  • Explicar la funcionalidad y los casos de uso del Dataform.

Módulo 05: La norma de canalización de datos de extracción, transformación y carga

  • Arquitectura de extracción, transformación y carga (ETL)
  • Herramientas GUI de Google Cloud para canalizaciones de datos ETL
  • Tratamiento de datos por lotes con Dataproc
  • Opciones de tratamiento de datos en flujo
  • Bigtable y canalización de datos

Objetivos:

  • Explique el diagrama básico de la arquitectura de extracción, transformación y carga.
  • Conozca las herramientas GUI de Google Cloud utilizadas para las canalizaciones de datos ETL.
  • Explique el procesamiento de datos por lotes mediante Dataproc.
  • Aprenda a utilizar Dataproc Serverless for Spark para ETL.
  • Explicar las opciones de tratamiento de datos en flujo.
  • Explique el papel que desempeña Bigtable en las canalizaciones de datos.

Módulo 06: Técnicas de automatización

  • Normas y opciones de automatización para tuberías
  • Programador y flujos de trabajo en la nube
  • Compositor de nubes
  • Funciones de ejecución en la nube
  • Eventarc

Objetivos:

  • Explicar las normas y opciones de automatización disponibles para las tuberías.
  • Obtenga información sobre Cloud Scheduler y los flujos de trabajo.
  • Más información sobre Cloud Composer.
  • Conozca las funciones de Cloud Run.
  • Explicar la funcionalidad y casos de uso de la automatización para Eventarc.