En las redes profundas de alimentación directa, toda la entrada se presenta a la red, que calcula una salida en una pasada.
En las redes recurrentes, se pueden presentar nuevas entradas en cada paso de tiempo, y la salida del paso de tiempo anterior se puede utilizar como una entrada a la red. Esto puede ser útil para modelar secuencias.
Una dificultad con las redes de avance es que tienen que computar todo a la vez. No es así como funcionan la mayoría de los programas, la mayoría de los programas involucran bucles y flujos de control. Del mismo modo, esto no es así como funciona la visión. Si bien los humanos tienen cierta capacidad para reconocer una imagen sin mover su mirada, son mucho mejores cuando pueden usar sacadas para escanear la imagen, saltando de una pista a otra.
Un modelo de atención en una red neuronal recurrente permite que la red se enfoque secuencialmente en un subconjunto de la entrada, la procese y luego cambie su enfoque a alguna otra parte de la entrada. Esto hace que sea más fácil razonar secuencialmente sobre los datos, incluso si los datos no son de naturaleza secuencial. Se puede aprender un modelo de atención mediante el aprendizaje por refuerzo, o mediante la devolución de personal si la política es diferenciable.
- ¿Prefieres ser un tonto feliz o un genio en problemas? ¿Porque?
- ¿Cómo hacer para volver a un viejo pasatiempo?
- ¿Cuáles son las perspectivas de la psicología de MSW HR y MA?
- ¿Qué opciones de carrera debo explorar si me interesan la antropología cultural, la sociología y la psicología?
- ¿Quiénes son algunos maestros espirituales / gurús, sería genial estudiarlos?
El DIBUJO en papel es una excelente lectura sobre el tema Una red neuronal recurrente para la generación de imágenes