Programa Executive de Python & Databricks | Online en directo.
+34 966 26 30 27 executive@doeua.es
PYT
Programa Executive de Python & Databricks
PYT
Programa Executive de Python & Databricks
FORMACIÓN
Streaming (online en directo)
PRECIO
900€
FECHAS
Del 28 de octubre al 16 de diciembre de 2022
DURACIÓN
30 horas
CLASES EN
Plataforma Online
OBJETIVOS

  • Conocer y poner en práctica las principales funcionalidades tanto de
    Python como de Databricks, esenciales en el día a día del Data
    Strategist.

  • Aprender los conceptos básicos de la programación aplicada a los
    datos, para optimizar los procesos de ingesta y transformación de
    datos.

  • Practicar con casos prácticos usando las últimas herramientas que
    Microsoft pone a nuestra disposición para crear sistemas robustos
    de datos.


  • Ser capaz de usar el lenguaje de programación Python y las librerías
    más usadas aplicadas a los datos.

  • Usar el framework de Spark para poder trabajar con grandes
    volúmenes de datos (Big Data).

  • Manejar y usar la herramienta Databricks con el objetivo de ser
    capaz de aplicar los conocimientos adquiridos en Python y Spark.

  • Crear procesos ELT (extracción, carga y transformación) usando
    dataframes y llevarlos al Data Lake para posteriormente ser
    consumidos por el área de Business Intelligence (BI).

  • Obtener datos de APIs REST, así como transformarlos y prepararlos
    para las bases de datos relacionales estructuradas.

  • Optimizar procesos de carga con las nuevas Tablas Delta.

  • Crear patrones de cargas incrementales SCD Type2.

  • Gestionar y validar los errores para su posterior tratamiento.

PROGRAMA

Bloque 1. Iniciación a Python

▪ Variables y Tipos de Datos
▪ Operadores Aritméticos
▪ Cadenas de Texto
▪ Entrada por Teclado y Salida por Pantalla
▪ Booleanos
▪ Condicionales
▪ Estructura de datos (Listas, Tuplas y Diccionarios)
▪ Bucles
▪ Funciones
▪ Manejo de Errores
▪ PEP8 en Python
▪ Ejercicio 1 Python

Bloque 2. Python & PySpark

▪ Introducción al Big Data
▪ Procesamiento en Batch o Streaming
▪ Instalación Anaconda, Visual Studio Code y Pyspark
▪ Crear notebook en Jupyter
▪ RDDs acciones y transformaciones
▪ Dataframes
▪ Pandas, numpy y matplotlib
▪ Ejercicio 2 Dataframe

Bloque 3. PySpark & Databricks

▪ Introducción a Databricks
▪ Notebooks
▪ Spark Dataframes y Pandas Dataframe
▪ Manipulación Dataframes
o Selección y modificación de columnas
o Filtrar datos
o Eliminar Columnas
o Ordenar datos
o Agregaciones
o Uniones
▪ Ejercicio 3 PySpark Dataframe

Bloque 4. Databricks & Azure

▪ Introducción Azure Data Lake Gen 2
▪ Conectar Azure Data Lake a Databricks
▪ Azure Key Vault y Secret
▪ Lectura y escritura de archivos en Data Lake Gen 2
▪ Archivos JSON
▪ Ejercicio 4 Dataframe JSON

Bloque 5. Databricks & API REST

▪ Introducción a las APIS REST
▪ Obtener datos de una API REST
▪ Tratar los datos obtenidos
▪ Validaciones datos recibidos
▪ Devolver los datos
▪ Gestionar errores
▪ Delta Tables
▪ Cargas Incrementales (CDC)
▪ Funciones UDF
▪ Ejercicio 5 Delta Tables

Bloque 6. Databricks & Power BI

▪ Conexión databricks a Power Bi
▪ Databricks Dashboard
▪ Cluster en Databricks
▪ Workflow en Databricks
▪ Databricks widget
▪ Particiones de Dataframe
▪ Autoloaders
▪ Databricks Utilidades
▪ Optimización de Notebooks
▪ Jobs en Databricks
▪ Spark UI
▪ Certificaciones Databricks
▪ Ejercicio 6 Proyecto final

PROFESORADO

Alfonso Gallardo | Data Engineer en Kabel



Técnico superior en Desarrollo de Aplicaciones Informáticas y Diplomado
en Ciencias Empresariales.

Consultor para empresas que desean crear un modelo de datos actual, basado en la nube.

Especializado en ingestas, canalizaciones, extracciones, cargas y transformaciones de grandes volúmenes de datos.
Algunas de las herramientas en las que está especializado son: Azure DataLake, Azure Databricks, Azure SQL, Power BI, entre otras.
El lenguaje de programación con el que trabaja es Python, con librerías como pandas, numpy, matplotlib.

Ha trabajado para empresas del sector financiero, salud, ocio y
aerolíneas.

LOS ALUMNOS HABLAN
CALENDARIO

  • Viernes 28 de octubre de 16:30 a 20:30 h.

  • Viernes 4 de noviembre de 16:30 a 21 h.

  • Viernes 11 de noviembre de 16:30 a 20:30 h.

  • Viernes 18 de noviembre de 16:30 a 21 h.

  • Viernes 25 de noviembre de 16:30 a 20:30 h.

  • Viernes 2 de diciembre de 16:30 a 21 h.

  • Viernes 16 de diciembre de 16:30 a 21 h.

INSCRIPCIÓN
Solicita tu reserva de plaza cumplimentando este formulario

Desde la organización del Programa Executive de Python & Databricks nos pondremos en contacto contigo para formalizar la inscripción.

Si tienes interés en bonificarte parte de los costes de formación ponte en contacto con Marga Ruiz | marga.ruiz@ua.es | 965903833

Los alumnos recibirán el título “Programa Executive de Python & Databricks” de 30 horas expedido por la Fundación Empresa de la Universidad de Alicante y el DSI - Data Strategy Institute