En este curso aprenderás

  • Qué es el Aprendizaje por Refuerzo y cómo se diferencia de otros enfoques del Machine Learning

  • Cuál es la historia, la evolución y los componentes del Aprendizaje por Refuerzo

  • A representar problemas de toma de decisiones secuenciales usando los Procesos de Decisión de Markov

  • A crear entornos de Aprendizaje por Refuerzo para agentes usando los Procesos de Decisión de Markov

  • Las características generales de los principales enfoques usados en la solución de problemas de Aprendizaje por Refuerzo

Contenido del curso

3 nuevas lecciones cada semana (martes, jueves y sábados). Fecha de inicio: enero 11 de 2021

  1. 1
    • ¿Qué es el Aprendizaje Reforzado o por Refuerzo?

    • Ejemplos reales de aplicación del Aprendizaje por Refuerzo

    • Historia y evolución del Aprendizaje por Refuerzo

    • Componentes de un sistema de Aprendizaje por Refuerzo

  2. 2
    • Introducción a los Procesos de Decisión de Markov

    • Ejemplo 1: un tablero unidimensional

    • Ejemplo 2: un tablero unidimensional estocástico

    • Ejemplo 3: el tablero bidimensional estocástico - Entorno y reglas de juego

    • Construcción de nuestro primer MDP: los estados y la propiedad de Markov

    • Construcción de nuestro primer MDP: las acciones

    • Construcción de nuestro primer MDP: la función de transición

    • Construcción de nuestro primer MDP: la señal de recompensa

    • Construcción de nuestro primer MDP: los horizontes de tiempo

    • Construcción de nuestro primer MDP: el factor de descuento

  3. 3
    • El objetivo del Agente

    • La Política (???)

    • La función estado-valor

    • La función Q

    • Cierre del curso

Requisitos

Conocimientos básicos de Álgebra Lineal y Probabilidad y Estadística

Instructor

Fundador y creador de contenidos en Codificando Bits

Miguel Sotaquirá

Soy Ingeniero Electrónico y tengo una Maestría en esta área, así como un Doctorado en Bioingeniería. Durante 15 años he sido profesor e investigador de varias universidades de Colombia, y desde el año 2017 me he convertido en un apasionado por el Machine Learning, el Deep Learning y la Ciencia de Datos. De hecho durante mi tesis doctoral explore temas de Machine Learning y algo de Deep Learning (que aún no estaba en auge!) para el análisis de imágenes médicas. En la actualidad me dedico por completo a divulgar contenido en mi canal de YouTube y a brindar asesoría y formación a personas y empresas en estos temas.