Curso: Pandas, para análisis y procesamiento de datos

Oferta

$4,000.00 $3,500.00

4 sesiones sabatinas de 10:00 a 14:00

Puedes escoger entre inscripción presencial (cupo limitado) y virtual (a distancia en vivo).

Ubicación: Función Lab (Col. Americana, Guadalajara Jal MX)

Cancelar

Taller: Pandas, para el análisis y procesamiento de datos

• Pandas en una librería de Python muy útil para el procesamiento y análisis de datos.
• Aprenderemos a importar  grandes volúmenes de datos de múltiples fuentes, haremos su exploración, pre-procesamiento y exportación, para crear sets de datos útiles y reportes, listos para almacenarse y utilizarse en futuras exploraciones.

• Taller de 16 horas práctico e intensivo.

Python siempre ha sido excelente para la eliminación y preparación de datos, pero menos para el análisis y el modelado de datos. pandas ayuda a llenar este vacío, lo que le permite llevar a cabo todo su flujo de trabajo de análisis de datos en Python sin tener que cambiar a un lenguaje más específico de dominio como R.

Pandas cambia bastante las reglas del juego cuando se trata de analizar datos con Python y es una de las herramientas preferidas y ampliamente utilizadas en el limpieza y transformación de datos a formatos útiles, sino el más utilizado. Pandas es de código abierto, de uso gratuito (con licencia BSD) y fue escrito originalmente por Wes McKinney.

*Con información de pandas.pydata.org

Información Detallada

Duración total: 16 horas.

Curso Sabatino de 4 sesiones de 4 horas (10:00 a 14:00 hrs)

 

El objetivo es la generación de una rutina para el análisis y la manipulación de datos. La rutina incluye:

  1. La importación de datos provenientes de múltiples fuentes (se trabajarán con datos públicos).
  2. La exploración de los datos, que nos permita conocer más sobre los datos que se están manipulando.
  3. El pre-procesamiento, o limpieza de los datos, en donde el objetivo es moldear los datos a un formato que nos permita comprenderlos y dejarlos listos para un futuro procesamiento.
  4. La exportación de los datos para almacenarlos, compartirlos en forma de reporte y/o futuros procesamientos.

Para la importación, exploración, pre-procesamiento y exportación de los datos se utilizará la librería de Python llamada Pandas. Durante cada una de las clases, se trabajará con datos reales con el fin de que cualquier persona que tome el curso sea capaz de cargar, manipular y compartir cualquier conjunto de datos.

 

Sesión 1

  1. Instalación de Pandas
  2. Introducción a los DataFrames
  3. Importar archivos en formato JSON y CSV
  4. Exportar archivos JSON y CSV

Sesión 2

  1. Profundizar en la estructura de los DataFrames
  2. Revisar y modificar tipos de datos
  3. Acceder y modificar la información de los DataFrames
  4. Manipulación de Series

Sesión 3

  1. Desarrollar todo el proceso de Sanitización
  2. Dominar los índices de un DataFrame
  3. Modificación de filas y columnas
  4. Operaciones en un DataFrame (Lambda)
  5. Indices Booleanos

Sesión 4

  1. Agrupando información
  2. Combinación de objetos: Append, Concat, Merge
  3. Trabajo Final

Para el curso se utilizará la versión más reciente de Python 3. Las clases serán impartidas utilizando la interfaz de Jupyter.

  • Contar con una computadora con sistema operativo Linux, Mac o Windows.
  • Para evitar demoras, es indispensable antes de comenzar el curso contar la versión más reciente de Python 3 y de Jupyter (o la interfaz de preferencia) instalada en su computador.
  • Si se tiene cero conocimiento de cómo instalar Python y Jupyter, se recomienda descargar el paquete de Anaconda e instalarlo. Anaconda incluye todo el software que se utilizará durante la clase. (Visitar https://www.anaconda.com/distribution/ y descargar la versión 3.7 en adelante)

Para inscritos en clases virtuales, además:

  • Contar con una conexión a Internet con velocidad suficiente para participar en una videoconferencia.
  • Preferentemente contar con micrófono y cámara web para facilitar tu participación en clase.
  • Descargar e instalar el software de videoconferencias Zoom (https://zoom.us/) antes iniciar el curso.
  • Guía del curso
  • Recursos para instalar el software
  • Recursos de aprendizaje adicional

Científico de Datos: José María Sosa.
Estudió ingeniería industrial con maestría en calidad y productividad en el Tec de Monterrey. Trabaja actualmente como científico de datos en RIGS Technology, una de las startups en México más importantes de la industria automotriz. Enfocándose en la automatización de la extracción de grandes cantidades de datos para su análisis y representación mediante dashboards de negocios.

– ¿Es necesario saber programar?

Es necesario contar con bases de programación preferentemente de Python, ya que pandas en una librería de este lenguaje. Si no tienes las bases de Python, te recomendamos nuestro curso “Python, comienza aquí” para que obtengas las necesarias para aprovechar el curso de pandas.

– ¿El software que se utilizará tiene algún costo?
No, pandas es una librería gratuita y de código abierto, creada por Wes McKinney.
– ¿Donde consigo el pandas?
La librería la puedes descargar en https://pandas.pydata.org/getpandas.html y lo haremos en clase.
– ¿A quiénes está dirigido este curso?
Para todas aquellas personas que quieran aprender importar, limpiar, pre-procesar, y exportar sets de datos útiles para su almacenamiento y exploraciones posteriores.
– ¿Porqué un taller presencial?
Aunque hay varios cursos en línea, acá podrás acortar la curva de aprendizaje y resolver las dudas que surgen en el proceso con el apoyo de un instructor especialista.

Es necesario tener conocimientos básicos de Python o algún lenguaje de programación. Si no cuentas con bases de Python, puedes tomar antes nuestro curso “Curso Express: Python para Análisis de Datos“.

Tipo de Inscripción

Clase Presencial, Clase Virtual (en vivo)

Fecha

2,9,16 y 23 de noviembre de 2019

Opiniones

No hay opiniones todavía.

Sé el primero en calificar “Curso: Pandas, para análisis y procesamiento de datos”

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

19 − 14 =

También te recomendamos…