Principal >
Cursos >
Ciencia de Datos Avanzado > Actividades y Material de Apoyo
Actividades y Material de Apoyo
Sesión 1: Machine Learning (Parte 1)
Python
Visual Studio Code
Metodologías
- Metodologías para Ciencia de Datos (presentación en PDF y PowerPoint).
Machine Learning
- Las 5 tribus del Machine Learning (acetatos en PDF y PowerPoint).
Sesión 2: Machine Learning (Parte 2)
Inteligencia Artificial
- Historia de la Inteligencia Artificial (acetatos en PDF y PowerPoint).
- Aplicaciones Prácticas de Inteligencia Artificial (acetatos en PDF y PowerPoint).
Machine Learning
EJERCICIOS (Parte 1):
Hacer los siguiente programas en Python:
- Predecir los costos de una casa (Regresión Lineal).
Datasets a utilizar (Parte 1):
Respuestas a los Ejercicios (Parte 1):
- Predecir los costos de las casas en California (código python, python_ml_california_housing.py).
Sesión 3: Machine Learning y Deep Learning
EJERCICIOS (Parte 2):
Hacer los siguiente programas en Python:
- Genera el árbol de decisiones para analizar las características de las flores "iris" (Decision Trees)
- Clasificar 10 puntos en 2 clases usando (K-Means).
- Dados 10 puntos etiquetados en 2 Clusters predice a qué categoría pertenece un nuevo punto (KNN)
Datasets a utilizar (Parte 2):
Respuestas a los Ejercicios (Parte 2):
- Decision Trees: Genera el árbol de decisiones para analizar las características de las flores "iris" en formato ".dot" (código python, python_ml_decision_trees.py).
- K-Means:Clasifica 10 puntos en 2 clases usando K-Means (código python, python_ml_kmeans.py).
- KNN: Dados 10 puntos etiquetados en 2 Clusters predice a qué categoría pertenece un nuevo punto usando KNN (código python, python_ml_knn.py).
Redes Neuronales
- Funcionamiento de las Redes Neuronales (acetatos en PDF y PowerPoint).
Deep Learning
Sesión 4: Deep Learning y Procesamiento del Lenguaje Natural
Deep Learning
EJERCICIOS (Parte 3):
Hacer los siguiente programas en Python:
- Reconocimiento de números escritos a mano usando Redes Neuronales.
Respuestas a los Ejercicios (Parte 3):
- Reconocimiento de números escritos a mano usando redes neuronales (código python, python_redes_neuronales_reconocimiento_numeros.py).
Parte: Pre-Procesamiento de Textos
EJERCICIOS (Parte 4):
Hacer los siguiente programas en Python:
- Eliminar los símbolos y caracteres no deseados de un texto.
- Eliminar los símbolos y caracteres no deseados de un texto usando expresiones regulares.
- Buscar las palabras relevantes de una frase (tokenizar) quitando las "stopwords".
Respuestas a los Ejercicios (Parte 4):
- Eliminar los símbolos y caracteres no deseados de un texto (codigo python, python_nlp_eliminar_simbolos.py).
- Eliminar los símbolos y caracteres no deseados de un texto usando expresiones regulares (codigo python, python_nlp_eliminar_simbolos_expresiones_regulares.py).
- Buscar las palabras relevantes de una frase (tokenizar) quitando las "stopwords" (codigo python, python_nlp_tokenizar_frase.py).
- Buscar las palabras mas repetidas de un texto (codigo python, python_nlp_palabras_mas_repetidas.py).
Sesión 5: Procesamiento del Lenguaje Natural y Grandes Modelos de Lenguaje
Parte: Análisis de Textos
EJERCICIOS (Parte 5):
Hacer los siguiente programas en Python:
- Calcula la Diversidad Léxica de un texto.
- Buscar las palabras mas repetidas de un texto y generar su "nube de palabras".
- Generar una “Nube de Palabras” a partir de una página de Wikipedia .
- Analizar un texto para determinar su polaridad (positivo, negativo ó neutral).
- Analiza un texto para determinar su polaridad (positivo, negativo ó neutral) utilizando listas de palabras positivas y negativas.
- Analiza un texto para determinar su polaridad (positivo, negativo ó neutral) usando TextBlob.
- Analiza un "tuit" para determinar su polaridad usando TextBlob.
Datasets utilizados:
Respuestas a los Ejercicios (Parte 5):
- Calcula la Diversidad Léxica de un texto (codigo python, python_lenguaje_natural_diversidad_lexica.py).
- Buscar las palabras mas repetidas de un texto y generar su "nube de palabras" (codigo python, python_nlp_nube_de_palabras.py).
- Generar una “Nube de Palabras” a partir de una página de Wikipedia (codigo python, python_nlp_nube_de_palabras_wikipedia.py).
- Analizar un texto para determinar su polaridad (positivo, negativo ó neutral) (codigo python, python_nlp_analisis_sentimientos_manual.py).
- Analiza un texto para determinar su polaridad (positivo, negativo ó neutral) utilizando listas de palabras positivas y negativas (codigo python, python_nlp_analisis_sentimientos_con_listas.py).
- Analiza un texto para determinar su polaridad (positivo, negativo ó neutral) usando TextBlob (codigo python, python_nlp_analisis_sentimientos_con_textblob.py).
- Analiza un "tuit" para determinar su polaridad usando TextBlob (codigo python, python_nlp_analisis_sentimientos_twitter.py).
- Detecta si una noticia es falsa (Fake News) (codigo python, python_ml_fake_news.py).
- Dada una película recomienda otras películas parecidas a ella (codigo python, python_ml_recomendacion_peliculas.py).
Material Adicional
Documentales:
Películas:
Evaluación:
Para aprobar el curso se requiere:
- 80% de Asistencia prensencial al curso.
- Enviar al menos una de las 3 tareas que se explican a continuación
TAREA 1: Análisis de Datos
Descargar el dataset de "Artículos Indizados" del siguiente sitio:
Hacer un programa en Python que lea el dataset anterior y calcule e imprima en pantalla lo siguiente:
- Los 3 investigadores que más han publicado.
- Los 3 investigadores que tienen el "Factor de Impacto" mas alto.
- Subirlo el código Python a la plataforma GitHub Classroom (se les enviará a su correo electrónico institucional el enlace para accesar al repositorio GitHub especial para subir las tareas del curso).
TAREA 2: Redes Neuronales
Utilizando el siguiente ejemlo:
Hacer lo siguiente:
- Modificar cualquiera de los ajustes de la red neuronal (no. de capas, funciones de activación, funciones de coste, etc.) con el objetivo de mejorar el desempeño del algoritmo actual de 9.7%
- Indicar dentro del código (como comentarios del programa) los cambios que se hicieron al programa y subirlo a la plataforma GitHub Classroom (se les enviará a su correo electrónico institucional el enlace para accesar al repositorio GitHub especial para subir las tareas del curso).
TAREA 3: Análisis de un Libro
- Buscar en Internet un libro de dominio público en formato "txt" y que esté en "español".
- De acuerdo al libro seleccionado anteriormente, hacer un programa en Python que lea el archivo "txt" y realice los cálculos necesarios para hacer las siguientes operaciones:
- ¿Cuál es la "Diversidad Léxica del libro? (imprimir en pantalla)
- ¿De qué temas trata el libro? (buscar e imprimir en pantalla las 5 palabras más repetidas)
- Generar la nube de ideas del libro.
- ¿El contenido del libro es positivo ó negativo? (análisis de sentimientos)
- Subir el programa en Python y el libro utilizado a la plataforma GitHub Classroom (se les enviará a su correo electrónico institucional el enlace para accesar al repositorio GitHub especial para subir las tareas del curso).
Lista de Asistentes:
A continuación la lista de de los Asistentes al Curso y el respectivo libro que seleccionaron:
1 Carlos Alberto Guizar Gomez, "Actitud de Vencedor".
2 Marcos Gutiérrez López, "Tao Te King".
3 Enrique Reyes Archundia, "El equipaje del Rey".
4 Alejandro Israel Robledo Ayala, "Los perros de Tíndalos".
5 Miguel Angel Fraga Aguilar, "Los pescadores de Trepang".
6 Eduardo Torres Rodriguez, "El Perfume".
7 Juan Cristobal Camacho, ?
8 Aarón García Campos, "Los hijos de los días".
9 Chávez Báez Marco Vinicio, "Historia del Tiempo".
10 Correa Gómez Javier, "Historias fantásticas".
11 García Ramírez María del Carmen, "La piedra filosofal".
12 Rocío Contreras Jiménez, "El Alquimista.
13 Martinez Cárdenas Fernando, "Un mundo felíz".
14 Johan Walter González Murueta, "El Prisionero de Zenda"
15 Juan Carlos Olivares Rojas, "Navidad en la montaña".
16 Méndez Patiño Arturo, "El país de las sombras largas".
17 Javier Alejandro, "El Principito".
18 Adrián Nuñez Vieyra, "Cien años de soledad".
19 Mario Heras Cervantes, "Peter Pan".
20 Irán Arane Melchor Uceda, "La vuelta al mundo en 80 dias"
Usted se encuentra Aquí >
Principal >
Cursos >
Ciencia de Datos Avanzado > Actividades y Material de Apoyo
Portal de Tecnología desarrollado por: Rogelio Ferreira Escutia