Taller: Pandas, para el análisis y procesamiento de datos

– Pandas en una librería de Python muy útil para el procesamiento y análisis de datos.
– Aprenderemos a importar  grandes volúmenes de datos de múltiples fuentes, haremos su exploración, pre-procesamiento y exportación, para crear sets de datos útiles y reportes, listos para almacenarse y utilizarse en futuras exploraciones.

– Taller de 16 horas práctico, presencial e intensivo.

Inscríbete al próximo taller

Python siempre ha sido excelente para la eliminación y preparación de datos, pero menos para el análisis y el modelado de datos. pandas ayuda a llenar este vacío, lo que le permite llevar a cabo todo su flujo de trabajo de análisis de datos en Python sin tener que cambiar a un lenguaje más específico de dominio como R.

Pandas cambia bastante las reglas del juego cuando se trata de analizar datos con Python y es una de las herramientas preferidas y ampliamente utilizadas en el limpieza y transformación de datos a formatos útiles, sino el más utilizado. Pandas es de código abierto, de uso gratuito (con licencia BSD) y fue escrito originalmente por Wes McKinney.

*Con información de pandas.pydata.org

Tour de 10 minutos por pandas, por su creador Wes McKinney

Información Detallada

Conoce los tipos de inscripción y precios:

  1. Pago total de inscripción: $3,100*
    *Pago del total del curso antes de 7 días naturales del inicio del curso, después a precio de inscripción normal ($3,300).
  2. Inscripción normal (anticipo): $3,300
    Reserva tu lugar con un anticipo de $1000 y cubre el resto en la primera clase.
  3. Crédito educativo (3 meses): $3,700
    Paga un anticipo de $1000 y cubre el resto en 3 pagos, y hasta en 3 meses. En la primera clase deberá hacerse el pago con tarjeta de crédito a 3 meses o firma de pagarés cómo compromiso de pago.

  4. Inscripción en grupo:  $3,100
    Precio por persona, por hacer el pago del anticipo de la inscripción de 2 o más personas.

Los precios son en pesos mexicanos y no incluyen IVA.

Duración total: 16 horas.

Taller Sabatino de 4 sesiones de 4 horas (10:00 a 14:00 hrs)

 

El objetivo es la generación de una rutina para el análisis y la manipulación de datos. La rutina incluye:

  1. La importación de datos provenientes de múltiples fuentes (se trabajarán con datos públicos).
  2. La exploración de los datos, que nos permita conocer más sobre los datos que se están manipulando.
  3. El pre-procesamiento, o limpieza de los datos, en donde el objetivo es moldear los datos a un formato que nos permita comprenderlos y dejarlos listos para un futuro procesamiento.
  4. La exportación de los datos para almacenarlos, compartirlos en forma de reporte y/o futuros procesamientos.

Para la importación, exploración, pre-procesamiento y exportación de los datos se utilizará la librería de Python llamada Pandas. Durante cada una de las clases, se trabajará con datos reales con el fin de que cualquier persona que tome el curso sea capaz de cargar, manipular y compartir cualquier conjunto de datos.

 

Clase 1

  1. Instalación de Pandas
  2. Introducción a los DataFrames
  3. Importar archivos en formato JSON y CSV
  4. Exportar archivos JSON y CSV

Clase 2

  1. Profundizar en la estructura de los DataFrames
  2. Revisar y modificar tipos de datos
  3. Acceder y modificar la información de los DataFrames
  4. Manipulación de Series

Clase 3

  1. Desarrollar todo el proceso de Sanitización
  2. Dominar los índices de un DataFrame
  3. Modificación de filas y columnas
  4. Operaciones en un DataFrame (Lambda)
  5. Indices Booleanos

Clase 4

  1. Agrupando información
  2. Combinación de objetos: Append, Concat, Merge
  3. Trabajo Final
  • Traer computadora (PC, Mac o Linux) con conexión WiFi a Internet.
  • Contar con bases de programación, preferentemente en Python.
  • Guía del curso
  • Recursos para instalar el software
  • Recursos de aprendizaje adicional

Científico de Datos: José María Sosa.
Estudió ingeniería industrial con maestría en calidad y productividad en el Tec de Monterrey. Trabaja actualmente como científico de datos en RIGS Technology, una de las startups en México más importantes de la industria automotriz. Enfocándose en la automatización de la extracción de grandes cantidades de datos para su análisis y representación mediante dashboards de negocios.

– ¿Es necesario saber programar?

Es necesario contar con bases de programación preferentemente de Python, ya que pandas en una librería de este lenguaje. Si no tienes las bases de Python, te recomendamos nuestro curso “Python, comienza aquí” para que obtengas las necesarias para aprovechar el curso de pandas.

– ¿El software que se utilizará tiene algún costo?
No, pandas es una librería gratuita y de código abierto, creada por Wes McKinney.
– ¿Donde consigo el pandas?
La librería la puedes descargar en https://pandas.pydata.org/getpandas.html y lo haremos en clase.
– ¿A quiénes está dirigido este curso?
Para todas aquellas personas que quieran aprender importar, limpiar, pre-procesar, y exportar sets de datos útiles para su almacenamiento y exploraciones posteriores.
– ¿Porqué un taller presencial?
Aunque hay varios cursos en línea, acá podrás acortar la curva de aprendizaje y resolver las dudas que surgen en el proceso con el apoyo de un instructor especialista.

*Si no cuentas con bases de Python, puedes tomar antes nuestro curso “Python, comienza aquí”.