En este curso aprenderás

  • Qué es el Aprendizaje por Refuerzo y cómo se diferencia de otros enfoques del Machine Learning

  • Cuál es la historia, la evolución y los componentes del Aprendizaje por Refuerzo

  • A representar problemas de toma de decisiones secuenciales usando los Procesos de Decisión de Markov

  • A crear entornos de Aprendizaje por Refuerzo para agentes usando los Procesos de Decisión de Markov

  • Las características generales de los principales enfoques usados en la solución de problemas de Aprendizaje por Refuerzo

Contenido del curso

  1. 1
    • ¿Qué es el Aprendizaje Reforzado o por Refuerzo?

    • Ejemplos reales de aplicación del Aprendizaje por Refuerzo

    • Historia y evolución del Aprendizaje por Refuerzo

    • Componentes de un sistema de Aprendizaje por Refuerzo

  2. 2
    • Introducción a los Procesos de Decisión de Markov

    • Ejemplo 1: un tablero unidimensional

    • Ejemplo 2: un tablero unidimensional estocástico

    • Ejemplo 3: el tablero bidimensional estocástico - Entorno y reglas de juego

    • Ejemplo 3: el tablero bidimensional estocástico - Los estados y la propiedad de Markov

    • Ejemplo 3: el tablero bidimensional estocástico - Las acciones

    • Ejemplo 3: el tablero bidimensional estocástico - La función de transición y la recompensa

    • Ejemplo 3: el tablero bidimensional estocástico - El horizonte

    • Ejemplo 3: el tablero bidimensional estocástico - El descuento

  3. 3
    • El objetivo del Agente

    • La Política

    • La función estado-valor

    • La función acción-valor

    • Las Ecuaciones de Bellman

    • Cierre del curso

Requisitos

Conocimientos básicos de Álgebra Lineal y Probabilidad y Estadística

Opiniones del curso

5 puntuación por estrellas

Buen curso

Luis Enrique Cabriales Ramírez

Muy buen curso de aprendizaje reforzado. Explicación clara de las bases para esta área de la inteligencia artificial.

Muy buen curso de aprendizaje reforzado. Explicación clara de las bases para esta área de la inteligencia artificial.

Leer menos
5 puntuación por estrellas

Hacer posible lo imposible

Jaime Luna

Las lecciones son muy claras y didacticas, Miguel hace facil lo dificil, hace posible lo imposible para los que nos cuesta un poco mas el proceso de aprendiz...

Leer más

Las lecciones son muy claras y didacticas, Miguel hace facil lo dificil, hace posible lo imposible para los que nos cuesta un poco mas el proceso de aprendizaje. Felicitaciones por su capacidad para enseñar.

Leer menos
5 puntuación por estrellas

Excelente curso

Matias Cardozo

Me parece un muy buen curso para comenzar a entender las bases del aprendizaje por refuerzo. Realmente el profesor explica las cosas de manera muy clara, y h...

Leer más

Me parece un muy buen curso para comenzar a entender las bases del aprendizaje por refuerzo. Realmente el profesor explica las cosas de manera muy clara, y hace que los temas, cálculos y formulas de difícil interpretación sean entendibles. Recomendado 100%.

Leer menos
5 puntuación por estrellas

Introducción Aprendizaje por Refuerzo Basico

Angel Horacio Lagraña Hernandez

¡Realmente muy bien explicados los conceptos básicos, con ejemplos variados de aplicaciones y con un recorrido de la historia del aprendizaje por refuerzo. L...

Leer más

¡Realmente muy bien explicados los conceptos básicos, con ejemplos variados de aplicaciones y con un recorrido de la historia del aprendizaje por refuerzo. Luego pasando a explicar de forma muy detallada tanto los conceptos básicos, como los procesos de decisión de Markov. Quizás, estaría bien incluir el concepto de Exploración-Explotación, en este curso básico, solo concepto. Igual viene más adelante en el intermedio. Por último, muy bien explicadas las ecuaciones de valor, estado y acción, y la generalización materializada en las ecuaciones de Bellman. Aquí en esta última parte echo en falta una aplicación de las ecuaciones de Bellman a un ejemplo sencillo, como cuando se desarrollaron las tablas para procesos tabulares en la primera parte. He aprendido mucho y muchísimo ¡Enhorabuena Miguel! Angel

Leer menos
5 puntuación por estrellas

Excelente curso de introducción

Alejandro Vega

Hola Dr. muchas gracias por hacer mucho más entendible el marco teórico que fundamenta los algoritmos de aprendizaje por refuerzo, el curso es muy certero pa...

Leer más

Hola Dr. muchas gracias por hacer mucho más entendible el marco teórico que fundamenta los algoritmos de aprendizaje por refuerzo, el curso es muy certero para explicar las funciones valor, espero con ansias que llegue el curso de RL con algoritmos de gradientes de política, DQN, Actor Critic..etc. Sin duda es usted un excelente profesor, Saludos desde México. Atte. Alejandro Vega Estudiante de Maestria en ingenieria de la computación

Leer menos
5 puntuación por estrellas

Evaluación curso

Walter Ruben Camacho

Excelente, y muy didáctica la explicación. Muy bueno

Excelente, y muy didáctica la explicación. Muy bueno

Leer menos
5 puntuación por estrellas

Excelente curso

Juan López

Agradezco el curso, es muy entendido todo y la metodología de enseñanza no podría ser mejor, por otro lado las ecuaciones son algo complejas pero con práctic...

Leer más

Agradezco el curso, es muy entendido todo y la metodología de enseñanza no podría ser mejor, por otro lado las ecuaciones son algo complejas pero con práctica debe poder entenderse. muchas gracias

Leer menos

Instructor

Fundador y creador de contenidos en Codificando Bits

Miguel Sotaquirá

Soy Ingeniero Electrónico y tengo una Maestría en esta área, así como un Doctorado en Bioingeniería. Durante 15 años he sido profesor e investigador de varias universidades de Colombia, y desde el año 2017 me he convertido en un apasionado por el Machine Learning, el Deep Learning y la Ciencia de Datos. De hecho durante mi tesis doctoral explore temas de Machine Learning y algo de Deep Learning (que aún no estaba en auge!) para el análisis de imágenes médicas. En la actualidad me dedico por completo a divulgar contenido en mi canal de YouTube y a brindar asesoría y formación a personas y empresas en estos temas.