¿Es razonable el modelo para IA general de On Intelligence de Jeff Hawkins y es posible utilizarlo prácticamente?

En muchos de sus rasgos generales, el libro de Hawkins resuena bien con las ideas planteadas por los investigadores en el área de Aprendizaje Profundo, que está más orientado al aprendizaje automático pero también tiene conexiones con la neurociencia y que ha experimentado un fuerte crecimiento desde 2006. de particular importancia es la idea de aprender representaciones, explotar principios de aprendizaje no supervisados ​​(es decir, encontrar representaciones que capturen la estructura en la distribución de entrada), que estas representaciones estén organizadas en múltiples niveles (es decir, en una especie de jerarquía de abstracciones), y que la estructura Esta jerarquía refleja la topología de la entrada, por ejemplo, en el caso de la entrada visual, los detectores de características están especializados en zonas espaciales (subimagen) en la imagen de entrada, y reciben información de los detectores de características de nivel inferior especializados para Zonas espaciales aún más pequeñas dentro. Los investigadores de Deep Learning han podido hacer un uso práctico de estos principios y han logrado o superado resultados de aprendizaje automático de última generación para una serie de conjuntos de datos de aprendizaje automático de referencia, desde reconocimiento de patrones, visión artificial, procesamiento de lenguaje natural, procesamiento de audio, y modelado de movimiento. Consulte http://deeplearning.net para obtener más información y mi libro disponible en línea (Learning Deep Architectures for AI) para una revisión técnica del campo (para investigadores de aprendizaje automático).

Jeff Hawkins acertó en muchas cosas con On Intelligence, en particular, el énfasis en los modelos jerárquicos y la predicción. Al mismo tiempo, la propuesta es solo una parte de la imagen y no es lo suficientemente específica como para guiar una implementación de AI.

El libro de Hawkins tomó muchos conceptos que circulaban en la comunidad de neurociencias teóricas y los resumió en una forma que era accesible para una amplia audiencia. Al hacer esto, le hizo un favor al mundo y consiguió que mucha gente se interesara en las grandes cuestiones de la neurociencia. Esto es algo bueno, ya que el campo tiene una tendencia a perderse en los detalles.

Dicho esto, aquí hay algunos problemas con On Intelligence en relación con el cerebro:

  • El cerebro está distribuido, no jerárquico. Sí, el cerebro y la corteza tienen una organización jerárquica extensa, pero eso no es lo único que sucede. Numerosas vías de conexión atraviesan el cerebro en formas que pueden parecer casi casuales. El cerebro es más multidireccional y distribuido que jerárquico.
  • El objetivo del cerebro es la supervivencia a través de la acción, no la predicción sensorial. Con su énfasis en la memoria, Hawkins destaca un punto excelente, que es que la memoria en el cerebro está en todas partes. Cada parte del cerebro está tratando de hacer predicciones sobre algo, y la predicción es una de las actividades principales que impulsan el aprendizaje. Pero la predicción no lo es todo. En última instancia, el cerebro necesita encontrar estrategias óptimas para la supervivencia. La predicción es un componente importante de esas estrategias, pero las estrategias de comportamiento para la supervivencia están más cerca del principal organizador dominante del cerebro que la predicción sensorial.
  • Las partes del cerebro centradas en la acción utilizan estrategias diferentes a las del sistema perceptivo. Hawkins se enfoca principalmente en la percepción, al igual que la mayoría de las personas en neurociencia computacional. La percepción, y especialmente la visión, es bastante jerárquica. Pero el sistema motor funciona de otra manera: ¿una jerarquía inversa? Otras partes del cerebro no son jerárquicas en absoluto. Por ejemplo, gran parte del sistema sensoriomotor está organizado en bucles de retroalimentación. Y los ganglios basales, parte del sistema sensoriomotor, parecen tener una organización recurrente en espiral que media la supresión más que la activación. La corteza prefrontal que guía la planificación está conectada en varias direcciones. Y luego están las estructuras subcorcorticales, como el sistema límbico que subyace a la motivación de momento a momento y la formación de valores. El lenguaje y la conciencia también son bastante misteriosos.
  • El mecanismo básico del cerebro es la potenciación de las neuronas, no variables probabilísticas. Mientras que On Intelligence presenta una gran perspectiva, no funciona ni propone los mecanismos específicos del cerebro. El trabajo real lo realizan las neuronas enviándose espigas entre sí. Esto no se aborda en el libro ni en el modelo probabilístico abstracto presentado por la compañía de spinning de Hawkins, Numenta.

Entonces, en general, On Intelligence hace un gran trabajo al plantear las grandes preguntas y generar interés en el campo. ¿Pero es la respuesta a cómo funciona el cerebro? Es un gran comienzo, pero aún queda mucho camino por recorrer.

En cuanto a su aplicación práctica a la IA, el software HTM producido por Numenta parece tener cierto éxito en la resolución de ciertos problemas de coincidencia de patrones. Puede que no sea una “IA general”, pero el algoritmo parece ser útil para muchas aplicaciones. Es un enfoque nuevo, y su énfasis en encontrar “causas” es una gran dirección.

Curiosamente, el co-fundador técnico de Numenta, Quora User, quien desarrolló los algoritmos originales, dejó Numenta en octubre de 2010 para iniciar una nueva empresa de aprendizaje automático, Vicarious (compañía), que afirma estar construyendo un software que “piensa y aprende como seres humanos”. . ”