Curso Python para data science y big data esencial

Curso Python para data science y big data esencial

 Python para data science y big data esencial
Python está viviendo una segunda juventud como lenguaje de programación, ajustado codo con codo a una de las grandes necesidades de ésta década: el trabajo con grandes volúmenes de datos. En este curso, vas a aprender en primer lugar los fundamentos de Python para Data Science y visualización de datos, para posteriormente aplicarlos en el análisis de grandes volúmenes de datos usando el entorno Spark, una de las herramientas más populares del sector Big Data. El contenido del curso es práctico. Vamos a sentar las bases para que aprendas a desarrollar tu proyecto de datos, de principio a fin.

1. Introducción a Python para data science y big data

Evaluación de las necesidades de big data
Instalar Jupyter Notebook
Instalar PySpark
Evaluar la eficiencia del código

2. Gestión de datos en Python

Introducción al Pandas
Filtrar datos en Python
Transformaciones de la base de datos
Groupby: obtener información esencial
Tratar datos duplicados y perdidos
Introducción a la librería Numpy

3. Gestión de datos avanzada

Correlaciones. Entender las relaciones entre las variables
Test de la Chi-Cuadrado
Análisis de datos extremos
Principios de las bases de datos relacionales
Transformar un dataframe en una base de datos relacional
Joins. Trabajar con bases de datos relacionales
Paralelizar loops en Python

4. Visualización de datos en Matplotlib

Introducción al Matplotlib
Modificar elementos del gráfico en Matplotlib
Etiquetas y leyendas en Matplotlib
Gráficos para series temporales en Matplotlib
Histogramas y box plots en Matplotlib
Nubes de puntos y mapas de calor en Matplotlib
Introducción al Plotly. Visualización interactiva
Gráficos avanzados con Plotly
Visualización de Mapas con Plotly

5. Machine Learning esencial: Clustering

Necesidades de Machine Learning: clustering y modelización
Preparar los datos para Machine Learning
K-Means, el algoritmo de clustering
El algoritmo hierarchical clustering

6. Machine Learning esencial. Modelización

Regresión lineal
Regresión logística
Naives Bayes Classifier
Árboles de clasificación y regresión
Random forest
Support vector machine
K-Nearest Neighbours

7. Trabajar con PySpark

Introducción a PySpark
Sintaxis en PySpark. Qué necesitamos saber
Qué son los RDD (Resilient Distributed Databases)
Funciones lambda
Dataframes en PySpark
Transformaciones básicas en PySpark
Acciones básicas en PySpark
Operaciones numéricas con RDD

8. PySpark avanzado

Joins en PySpark
Acumuladores. Cómo detectar patrones en nuestros datos
Cómo construir funciones map
Cómo construir funciones reduce
Ejemplos básicos de MapReduce en PySpark

9. Desafío y solución: MapReduce

Desafío: MapReduce aplicado con PySpark
Resolución de los ejercicios de MapReduce
  Aumenta tus conocimientos sobre la ciencia de datos en Python, y domina una de las herramientas más avanzadas para Data Science. Desde un enfoque práctico explora en detalle qué ofrece machine learning. Aprovecha el paquete scikit-learn y conoce cómo usar web scraping para desarrollar
  Muchos de los empleados que trabajan con la ciencia de datos (Aprende data science) no son científicos de datos, sino que son gerentes o socios que quieren obtener valor a partir de los datos de la organización. Los miembros del equipo data science tienen que entender el lenguaje de la
Información de: Big Data y Ciencia de DatosAprende las bases que te llevarán a ser un profesional de las ciencias de datos. Maneja grandes cantidades de información. Extrae, clasifica y procesa, y dale valor a estructuras y fuentes de datos. Con este curso podrás: Procesar grandes
  Curso Python paso a paso. Este curso es una introducción rápida a la programación en Python, vamos a trabajar en la instalación, sintaxis del lenguaje, y trabajaremos un proyecto completo donde aprenderás como estructurarlo y ponerlo en marcha. Trabajaremos con fechas y tiempos, leyendo
    Información de: Python avanzadoAprende a como mejorar y ser un desarrollador, transfórmate en un experto de Python. Aprende a profesionalizar tus programas desarrollados en Python. En este curso verás cómo usar la implementación de bases de datos para satisfacer la necesidad
  Aprovecha al máximo tus conocimientos de programación con Python Si ya has hecho tu primer "Hola, mundo” con Python, este curso te dará un enfoque más profesional y te enseñará el alcance de este lenguaje de programación. Conocerás las diferencias más importantes entre conceptos complejos,