Aprendizaje por Refuerzo Nivel Intermedio
Curso teórico-práctico en donde aprenderás e implementaras en Python los principales algoritmos clásicos para la solución de problemas de Aprendizaje por Refuerzo.
El funcionamiento de las tres principales familias de algoritmos clásicos para la solución de problemas de Aprendizaje por Refuerzo: Programación Dinámica, Monte Carlo y Diferencias Temporales
A usar Python y la librería Gym de OpenAI, una de las herramientas más usadas para la implementación y desarrollo de algoritmos de Aprendizaje por Refuerzo
A resolver problemas de Aprendizaje por Refuerzo usando Python, la librería Gym y cualquiera de los algoritmos clásicos
3 nuevas lecciones cada semana (martes, jueves y sábado). Fecha de inicio: marzo 17 de 2022
Introducción a los algoritmos clásicos del Aprendizaje por Refuerzo
Evaluación de la Política: conceptos básicos
Evaluación de la Política: ejemplo práctico
Mejora de la Política y ejemplo práctico
Iteración de la Política y ejemplo práctico
Iteración de Valores
Práctica 1: introducción a OpenAI Gym
Práctica 2: Programación Dinámica con OpenAI Gym - Parte 1: el entorno, la política y evaluación de la política
Práctica 2: Programación Dinámica con OpenAI Gym - Parte 2: mejora de la política
Práctica 2: Programación Dinámica con OpenAI Gym - Parte 3: iteración de la política
Práctica 2: Programación Dinámica con OpenAI Gym - Parte 4: iteración de valores e interactuando con el entorno
Predicción con Monte Carlo y ejemplo práctico
Control con Monte Carlo y ejemplo práctico
Práctica 3: Monte Carlo con OpenAI Gym y Python
Aprendizaje por Diferencias Temporales: conceptos básicos
Aprendizaje por Diferencias Temporales: ejemplo práctico
Ventajas frente a la Programación Dinámica y los métodos Monte Carlo
Control con el algoritmo SARSA y ejemplo práctico
Control con el algoritmo Q-learning y ejemplo práctico
Práctica 4: Diferencias Temporales con OpenAI Gym y Python
Cierre del curso
Debes haber tomado los cursos "Aprendizaje por Refuerzo Nivel Básico", "Python Nivel Básico" y "Python Nivel Intermedio" (todos disponibles en la Academia Online)
Miguel Sotaquirá