¿Cómo puede la ciencia cognitiva computacional realizar una fertilización cruzada con la neurociencia?

Esta es una pregunta interesante, porque técnicamente el interés en la intersección de la ciencia cognitiva, la computación y la neurociencia ha existido desde la década de 1960 durante la “revolución cognitiva”. Así que para responder a esta pregunta, voy a entrar en un poco de historia, y luego profundizaré en la pregunta en cuestión.

Para aquellos de ustedes que no están familiarizados, la revolución cognitiva tuvo lugar en 1965 como una reacción contra las teorías “conductistas” predominantes en ese momento. Desde el nacimiento del término “ciencia cognitiva”, se ha acumulado mucha evidencia que respalda la idea de que existe una interacción entre la mente y los comportamientos, que está vinculada a sustratos biológicos que pueden conducir o contribuir. (es decir, neurociencia cognitiva). No es una coincidencia que la inteligencia artificial también se inventara en esta época, utilizando el cerebro como inspiración como un ejemplo de “la última máquina de computación” que es flexible en el aprendizaje y capaz de realizar muchas tareas complejas a la vez. sin esfuerzo (en comparación con las máquinas en el momento de todos modos).

Esto se debió a algunos movimientos en el siglo XX / XXI que evolucionaron lentamente (y siguen evolucionando a medida que desarrollamos hardware y software más rápidos que pueden analizar grandes conjuntos de datos en períodos de tiempo más cortos. Intentaré señalar los grandes movimientos que se muestran a continuación.

Cibernética
Este movimiento transdisciplinario, establecido por Jay Forrester en el MIT en la década de 1950, tenía como objetivo vincular los sistemas físicos con los sistemas biológicos / cognitivos / sociales. Esto se inspiró en un enfoque de ingeniería más eléctrica y en el intento de aplicar el control de ingeniería eléctrica para comprender la cognición humana. Si bien esta área de investigación se extinguió básicamente alrededor de la década de 1980, sentó las bases para los marcos de modelado subsiguientes (es decir, el modelado gráfico probabilístico) que conocemos y amamos hoy. No basta con hacer comentarios sobre la cibernética, pero si estás interesado, consulta el artículo de wikipedia sobre Cibernética.

Procesamiento paralelo distribuido (conexionismo)
Avance rápido a los años 1980/90, cuando las computadoras eran (relativamente) más rápidas y más eficientes. Junto con los modelos de redes neuronales artificiales que se crearon para modelar el comportamiento de activación neuronal en el cerebro, algunos psicólogos estaban interesados ​​en determinar si este tipo de marco mecanicista podría aplicarse al aprendizaje / resolución de problemas. Este marco se asemejaba a una red neuronal e intentaba hacer predicciones a nivel de sistema sobre cómo los conjuntos de disparos neuronales (restringidos por sustratos biológicos) podrían dar lugar a comportamientos cognitivos. Gran parte de la investigación seminal se realizó en la Universidad Carnegie Mellon, donde este método de modelado de redes neuronales PDP se hizo tan popular que un software de modelado conexionista popular (conexionismo) se desarrolló a partir de él. (Ver Emergente).

En particular, algunos modelos vienen a la mente.

  • El modelo ACT-R de John Anderson para aprender nuevos conceptos (nota: no creo que sea un modelo PDP, pero utiliza un marco de red similar, por lo que lo he mencionado).
  • El modelo de adquisición de lenguaje de Jay McClelland.

Si bien estos modelos fueron un gran salto y contribuyeron en gran medida al avance de la investigación en psicología y neurociencia, la principal debilidad de estos modelos es que si bien caracterizaron el sistema muy bien (es decir, muy neurológico), no explicaron con alta precisión los cálculos. que las neuronas no funcionaron ni los mecanismos mediante los cuales lograron varios resultados cognitivos (es decir, computacional). Esto evolucionó a un interés resurgido en el siguiente tipo de modelado a continuación.

Modelos gráficos probabilísticos / inferencia bayesiana
El movimiento hacia el uso de modelos gráficos probabilísticos (ver: Modelo gráfico) como una forma de modelar el sistema cognitivo ha sido un desarrollo bastante reciente en el campo de la ciencia cognitiva computacional. El uso de los procesos de decisión de Markov ha sido omnipresente en los campos de la informática y la neurociencia, pero solo recientemente ha sido “prestado” por los psicólogos para comprender la cognición. Sin embargo, estos modelos han sido bastante útiles para tratar de explicar cómo las personas resuelven problemas, toman decisiones (tomamos decisiones basadas en ciertos antecedentes que tenemos en un momento dado). O si estuviéramos intentando modelar cómo los humanos realizan tareas complejas, esta sería una forma relativamente sencilla de incorporar el ruido del mundo / entorno que afecta nuestras acciones. Quizás el mayor desafío en esta área de trabajo es que es realmente difícil construir un modelo de estado interno o interno, ya que no tenemos una idea de lo que está sucediendo precisamente. Sin embargo, al ser informados por la neurociencia o los sustratos biológicos, podemos obtener una idea de lo que uno puede esperar caracterizar como un “estado mental interno”.

Hay otras debilidades en este trabajo (o áreas para crecer, como prefiera), como el hecho de que a veces estos modelos asumen agentes racionales (y la gente a menudo no se desempeña racionalmente – vea el trabajo de Tversky y Kahnemen – pero quizás eso sea lo que podría ser posible aclarar con suficiente investigación en el tiempo.

En una nota al margen, si está interesado en investigar más a fondo la ciencia cognitiva computacional, recomendaría buscar a Josh Tenenbaum (MIT), Tom Griffiths (Berkeley), Charles Kemp (CMU), Tom Mitchell ( CMU), Todd Gureckis (NYU) y Matthew Botvinick (Princeton), por nombrar algunos.

¿El futuro de la ciencia cognitiva computacional y la neurociencia de sistemas?
Con respecto a estos dos campos que se contribuirán entre sí, tengo la sensación (también es que solo estoy proyectando aquí) de que han evolucionado de forma sinérgica y continuarán proporcionándose retroalimentación para avanzar cada campo respectivo. A medida que la psicología, la neurociencia y los campos computacionales convergen, podría ser imposible para la ciencia computacional cognitiva avanzar sin el conocimiento de expertos en otros campos como la neurociencia de sistemas y la ingeniería eléctrica y la informática, y viceversa. En otras palabras, no veo que estos campos se desarrollen en paralelo entre sí, sino que veo que estos campos convergen en proyectos de investigación multidisciplinarios que requieren la experiencia de muchas perspectivas diversas y personas con diferentes conjuntos de habilidades y antecedentes. Si estas colaboraciones son exitosas, este puede ser el próximo paso crítico para revolucionar aún más el campo de la ciencia del cerebro.

¡Esa es una pregunta difícil! De hecho, eso es una pregunta de investigación. 🙂

Las redes neuronales pueden lograr muchas cosas que hacen los enfoques más abstractos, y viceversa. La mayoría de las redes neuronales artificiales útiles son, en sí mismas, abstracciones de redes neuronales biológicas. Me imagino que para algunas aplicaciones, los enfoques múltiples pueden ser matemáticamente equivalentes. ¡Pero si lo son o no es una pregunta para la tesis doctoral de alguien! 🙂

Las redes bayesianas y otros enfoques podrían ser útiles para determinar el rendimiento óptimo en un contexto dado. Luego pueden compararse con modelos neurales y con datos de psicofísica animal / humana.

Como señalan muchos investigadores, una sola neurona es mucho más complicada que los nodos utilizados en la mayoría de los estudios de modelos. Una sola neurona es en sí misma capaz de cálculos complejos. La incorporación de estos grados adicionales de libertad podría informar enfoques no neuronales.

Así que, idealmente, los métodos a diferentes escalas pueden restringirse entre sí.

Los modelos difusos pueden servir como objetivos para modelos detallados, y los modelos detallados pueden servir como restricciones mecanicistas en los modelos difusos.

La ciencia cognitiva podría ser como la termodinámica, y la neurociencia podría ser como la teoría cinética. Lo ideal sería que los dos fueran equivalentes entre sí.

Pero estamos lejos de la situación ideal. Los métodos bayesianos son algo limitados. Además, la noción de “optimalidad” puede ser muy problemática.

Estas y otras críticas de los métodos bayesianos en neurociencia se encuentran en estos dos excelentes artículos:

¿Fundamentalismo bayesiano o ilustración? Sobre el estado explicativo y aportes teóricos de los modelos bayesianos de cognición.

Historias bayesianas en psicología y neurociencia.