¡Buena pregunta!
Mi respuesta de una línea sería que el cerebro a menudo tiene una autoridad externa, ¡y ese es el mundo externo en sí mismo!
Hay tres categorías amplias de aprendizaje utilizadas en redes neuronales artificiales (ANN):
- Aprendizaje supervisado : ejemplos explícitos de cada categoría se muestran al modelo. El modelo aprende por imitación / emulación .
- Aprendizaje no supervisado : el modelo solo recibe ejemplos y debe categorizarlos en función del espacio de características de los ejemplos. El modelo aprende encontrando regularidades estadísticas en el espacio de características.
- Aprendizaje de refuerzo: en lugar de dar ejemplos explícitos de comportamiento correcto, da “refuerzos”: recompensas y castigos por el comportamiento correcto e incorrecto (o exitoso y no exitoso), respectivamente. El modelo aprende por ensayo y error .
Algunas personas promueven el aprendizaje por refuerzo bajo aprendizaje supervisado, ya que parece haber un maestro en ambos casos. Pero la diferencia clave es que en el aprendizaje supervisado se proporcionan soluciones explícitas , mientras que en el aprendizaje por refuerzo solo se tienen en cuenta las consecuencias generales del comportamiento. se introducen de nuevo en el sistema. El aprendizaje por refuerzo es particularmente útil cuando el espacio de la solución es vasto y / o desconocido. El sistema solo puede explorar y ganar experiencia de prueba y error. Por el contrario, el aprendizaje supervisado solo se puede utilizar cuando el profesor sabe cuál debe ser el resultado deseado.
- ¿Por qué tenemos miedo de los fantasmas?
- ¿Tenemos alguna idea de cuánta memoria funcional tiene un animal no humano?
- ¿Cómo deciden los humanos qué camino está arriba y cuál está abajo?
- ¿Qué investigación de usabilidad o psicología cognitiva se ha realizado sobre el número óptimo de opciones para los menús / navegación?
- ¿Cuáles son los mejores tratamientos para el trastorno de estrés postraumático crónico?
Todos estos tipos de aprendizaje se pueden discernir en los sistemas biológicos.
Cuando un estudiante aprende a imitar a un maestro, eso es aprendizaje supervisado. Esto se muestra en el aprendizaje de idiomas, entrenamiento musical y diversas habilidades motoras. Aprender por repetición y memorización es todavía muy común en todo el mundo. Algunos tipos de habilidades abstractas de resolución de problemas también pueden implicar procedimientos o algoritmos de imitación. También puedes ver que este tipo de aprendizaje son los pájaros cantores.
Cuando un estudiante aprende simplemente trabajando con ejemplos en ausencia de un maestro o una señal de refuerzo, eso es aprendizaje no supervisado. Entonces, cuando desarrolla un sistema implícito de categorización / comparación para la comida, la música o el arte, parece que confía, al menos en parte, en el aprendizaje no supervisado. Este tipo de aprendizaje parece ocurrir también en los animales. Los animales exploran y se adaptan, y pueden aprender incluso sin el enfoque de la zanahoria y el palo. (Los dos enfoques computacionales con los que estoy familiarizado que parecen neurobiológicamente plausibles son los mapas autoorganizados y la teoría de la resonancia adaptativa. Probablemente hay muchos más enfoques).
En los sistemas biológicos tiene sentido vincular el aprendizaje por refuerzo con un concepto llamado “condicionamiento”. Hay dos tipos generales de condicionamiento:
- El condicionamiento clásico o pavoloviano implica asociar un estímulo “neutral” con una recompensa o un castigo. Los famosos experimentos de Ivan Pavlov con perros involucraban tocar una campana antes de alimentar a un perro. El perro saliva naturalmente en anticipación a la comida, y después de las asociaciones repetidas entre el estímulo (campana) y la recompensa (comida), la campana sola puede desencadenar la respuesta de salivación, incluso si no hay olor a comida en ninguna parte. Así que el condicionamiento clásico implica Formando asociaciones entre estímulos y resultados.
- El condicionamiento operante implica Formando asociaciones entre acciones y resultados . Así que se asemeja mucho más al aprendizaje por refuerzo en sistemas artificiales. Si le das una golosina a un perro cada vez que recupera una pelota, realizará esta tarea de manera más confiable cuando lances la pelota.
Los neurocientíficos estudian cómo estos fenómenos psicológicos / conductuales de alto nivel se implementan en las neuronas. La teoría más común es que el aprendizaje a nivel de las neuronas se produce a través de la plasticidad sináptica, la modificación a corto o largo plazo del tamaño (y, por lo tanto, la fuerza) de las conexiones entre las neuronas. Se pueden implementar varias reglas de aprendizaje sináptico en redes neuronales biológicas *. Los modelos neurobiológicamente plausibles de los tipos de aprendizaje y condicionamiento enumerados anteriormente se construyen de manera rutinaria. También hay formas de plasticidad no sináptica que pueden ser importantes para el aprendizaje biológico.
Cómo los humanos y otros animales aprenden y se comportan exactamente es, por supuesto, un problema abierto. Probablemente necesitemos una perspectiva mucho más experimental y teórica antes de poder explicar realmente el aprendizaje biológico.
Notas
* El aprendizaje sináptico es un gran tema. Echa un vistazo a esta respuesta para obtener más detalles sobre las reglas de aprendizaje sináptico:
¿Cuál es el estado del arte en el aprendizaje de Hebbian (aplicado tanto a la inteligencia natural como a la artificial)?
Estas respuestas también pueden ser relevantes:
¿Qué tan similares son el funcionamiento de las redes neuronales artificiales (NN) y la del cerebro humano? ¿Cómo es eso?
¿Cuál es la base molecular de la memoria? ¿Cómo se crean, almacenan y recuperan los recuerdos a nivel molecular?
¿Cuánto tiempo tarda la neuroplasticidad en cambiar significativamente la estructura del cerebro y las formas en que pensamos?
¿Cuándo ocurre la neuroplasticidad y bajo qué condiciones?