▪ Variables y Tipos de Datos
▪ Operadores Aritméticos
▪ Cadenas de Texto
▪ Entrada por Teclado y Salida por Pantalla
▪ Booleanos
▪ Condicionales
▪ Estructura de datos (Listas, Tuplas y Diccionarios)
▪ Bucles
▪ Funciones
▪ Manejo de Errores
▪ PEP8 en Python
▪ Ejercicio 1 Python
▪ Introducción al Big Data
▪ Procesamiento en Batch o Streaming
▪ Instalación Anaconda, Visual Studio Code y Pyspark
▪ Crear notebook en Jupyter
▪ RDDs acciones y transformaciones
▪ Dataframes
▪ Pandas, numpy y matplotlib
▪ Ejercicio 2 Dataframe
▪ Introducción a Databricks
▪ Notebooks
▪ Spark Dataframes y Pandas Dataframe
▪ Manipulación Dataframes
o Selección y modificación de columnas
o Filtrar datos
o Eliminar Columnas
o Ordenar datos
o Agregaciones
o Uniones
▪ Ejercicio 3 PySpark Dataframe
▪ Introducción Azure Data Lake Gen 2
▪ Conectar Azure Data Lake a Databricks
▪ Azure Key Vault y Secret
▪ Lectura y escritura de archivos en Data Lake Gen 2
▪ Archivos JSON
▪ Ejercicio 4 Dataframe JSON
▪ Introducción a las APIS REST
▪ Obtener datos de una API REST
▪ Tratar los datos obtenidos
▪ Validaciones datos recibidos
▪ Devolver los datos
▪ Gestionar errores
▪ Delta Tables
▪ Cargas Incrementales (CDC)
▪ Funciones UDF
▪ Ejercicio 5 Delta Tables
▪ Conexión databricks a Power Bi
▪ Databricks Dashboard
▪ Cluster en Databricks
▪ Workflow en Databricks
▪ Databricks widget
▪ Particiones de Dataframe
▪ Autoloaders
▪ Databricks Utilidades
▪ Optimización de Notebooks
▪ Jobs en Databricks
▪ Spark UI
▪ Certificaciones Databricks
▪ Ejercicio 6 Proyecto final