¿Cuáles son algunas críticas de la prueba de Turing?

Es una prueba emocionalmente insatisfactoria para la inteligencia, en el sentido de que la premisa central es que el comportamiento indistinguible del comportamiento humano también puede ser inteligencia real . No dice nada a nuestra creencia de que la inteligencia consiste en el estado de ser subjetivo que experimentan los humanos, que presumimos que es más que el resultado de una serie de algoritmos y comandos del procesador.

¿Una computadora que pasa la prueba de Turing realmente se siente inteligente? ¿Experimenta subjetivamente su propia existencia de alguna manera que se asemeja a la forma en que lo hacemos? Probablemente no. Pero indistinguible es indistinguible. Pasar la prueba de Turing le brinda tanta evidencia de la experiencia subjetiva de la computadora como la experiencia subjetiva de cualquier otra persona. La percepción subjetiva del ser propio es inherentemente interna y no se puede compartir. No hay una manera infalible de probar la diferencia entre un autómata suficientemente complejo y un agente humano consciente.

Varios medios de comunicación informaron recientemente que durante el fin de semana, un programa de computadora pasó la prueba de Turing. The Washington Post calificó el evento de “Prueba de referencia”, mientras que la revista Wired fue menos divertida.

La prueba de Turing (llamada así en honor al científico británico Alan Turing) se entiende a menudo como una prueba diseñada para juzgar si una computadora es inteligente o no y si puede pensar. Una computadora pasa efectivamente la prueba de Turing si un humano que interactúa con la computadora no puede distinguir el rendimiento de la computadora del desempeño de un ser humano normal. Por ejemplo, si una computadora puede mantener una conversación con alguien y el ser humano no puede saber si es una persona real o una máquina, entonces la computadora ha pasado la prueba de Turing. Pero, ¿la aprobación exitosa de la prueba de inteligencia puede proporcionar evidencia de inteligencia y cognición?

Cuando se introdujo la idea de la prueba de Turing en la década de 1950, una de las teorías psicológicas prominentes era el conductismo. El conductismo (conductismo lógico) es la creencia de que la actividad mental consiste simplemente en, o es reducible a la conducta. En otras palabras, no hay comportamiento, no hay actividad mental. Para aquellos que creyeron en el conductismo a principios y mediados del siglo 20, es fácil ver por qué creen que la prueba de Turing podría mostrar evidencia de inteligencia. Si lo único que importa es el comportamiento, entonces una máquina que tenga el mismo comportamiento que un ser humano debe tener la misma inteligencia que un ser humano. No es difícil ver por qué el conductismo es obviamente falso. Todos tenemos la experiencia de la actividad mental sin ningún comportamiento observable. Por ejemplo, uno puede sentir dolor sin mostrar ningún comportamiento de dolor. En otras palabras, la actividad mental está separada del comportamiento.

Debido a que la actividad mental está separada del comportamiento, no es posible usar la prueba de Turing como evidencia de inteligencia o cognición. Incluso si las computadoras se vuelven tan buenas para simular el habla humana que uno no puede saber si se están comunicando con una computadora o un ser humano, aún no habría evidencia de inteligencia o cognición porque simular inteligencia no es lo mismo que duplicar inteligencia.

La prueba de Turing no es una prueba real. Dicen que un robot pasará una prueba, si un juez no puede distinguir entre un humano real y un robot. Ahora, ¿cómo se define tal prueba? ¿Qué conjunto de preguntas harás?

Y si realmente creas una súper computadora inteligente, no sería capaz de engañarte diciendo que es una supercomputadora y no un humano, tal vez quiera engañar al mundo para que sea otra súper computadora sin capacidades humanas. Tal computadora inteligente fallará la prueba entonces.

Además, la computadora necesita aprender a mentir, de modo que cuando le preguntamos si usted es una máquina, dice que no. Se necesita tiempo para calcular las respuestas igual que los humanos. Es necesario entender qué problema es difícil y cuál no es para esto. Y esto depende de humano a humano, algunos humanos son inteligentes y otros no. Entonces, la prueba depende de qué tipo de persona está sentada sobre la mesa.

La lista continua….

Los seres humanos son fácilmente engañados. Se les puede engañar fácilmente para que crean que la computadora con la que están hablando durante largos períodos de tiempo es un humano. No es tanto que la prueba sea mala, sino que el evaluador puede ser estúpido.

Sin embargo, el núcleo de la prueba de Turing es el sonido, si se define de forma restringida. Si encuentra una “imitación” que es indistinguible del original, entonces la “imitación” también puede ser la original para todos los propósitos y propósitos. Esto elimina una gran cantidad de la basura que rodea a los humanos y sus constantes exhortaciones arrogantes de que somos de alguna manera fundamentalmente diferentes de las computadoras. Si una computadora puede captar la entrada de tus sentidos y tu estado cerebral actual, y luego simularla hacia adelante usando las leyes de la física, entonces esa entidad es tu cerebro (bueno, sin todas las partes blandas).

Ahora la pregunta es qué define la inteligencia. La inteligencia no es un concepto particularmente profundo. Es simplemente la predicción. Si el agente puede predecir con precisión el resultado de una determinada situación con sus modelos internos, entonces es inteligente en ese dominio. Una vez hecho esto, se pueden probar múltiples inteligencias, configurando una multitud de pruebas. Cada prueba verifica que el agente es inteligente en alguna área.

Ahora la pregunta es: ¿puedes diseñar una prueba que pueda verificar la inteligencia general? La respuesta es, por supuesto, sí. Dale al mismo agente múltiples pruebas. Si los pasa a todos, es probable que sea generalmente inteligente. Es en este punto que las personas se quejarán de que la prueba no es exhaustiva o de que las pruebas no evalúan correctamente la inteligencia.

Al primer punto, esto es cómo funcionan las pruebas externas en cajas negras. A menos que tenga acceso a los elementos internos, y descubra, de acuerdo con los primeros principios, cómo una máquina hace lo que hace, paso a paso, solo puede obtener una cierta cantidad de cobertura hasta su punto de importancia. En cuanto a si las pruebas pueden evaluar correctamente la inteligencia, esto es simplemente falso. Si el agente no predice el resultado de la situación, no es inteligente en ese dominio.

Mi única crítica de la prueba de Turing es que es solo una prueba. Pero, de nuevo, Turing lo entendió y declaró que su única prueba no implica “inteligencia general” en todos los campos, sino simplemente “algo de inteligencia” en un campo, es decir, engañar a los humanos para que piensen que están hablando con humanos.

Hay tantos engañosos sobre la prueba de Turing en nuestros días … Básicamente, lo que Alan Turing dijo fue simplemente esto:

No me importa si la máquina es un zombie filosófico o no. Si es capaz de engañarme lo suficiente, entonces debería considerarlo inteligente.

Si lo imita, todo está bien.

Y la gente dice que la prueba de Turing es “incorrecta” o inherentemente defectuosa porque alguien logró engañar a un grupo de jueces con una pared sofisticada, pero aún simplista, de ingeniería humana de reglas de texto ramificado. No es que la prueba sea incorrecta, o que el enfoque sea incorrecto. Es que, bajo tal circunstancia específica, ese algoritmo era realmente inteligente . Si estas mismas personas pudieran usar esta misma estrategia para engañar a todos en la mayoría de los contextos dados, entonces habrían creado una IA Fuerte.

El problema siempre se reduce al hecho de que no es “lo suficientemente inteligente”.

Y ahora hay una gran cantidad de pruebas diferentes, todas ellas que afirman ser mejores que las originales. Algunos irían a otro nivel y serían completa y completamente cagados, como el Test de Lovelace. Mezclan la conciencia con la inteligencia todo el tiempo. La conciencia (la capacidad de experimentar qualia ) es algo; la inteligencia es otra. Podemos ser conscientes y tontos (muchos animales), así como no ser conscientes y muy inteligentes (por ejemplo, una computadora cuando se utiliza el aprendizaje automático) [por ahora solo ignoraré las perspectivas filosóficas sobre la inteligencia y la conciencia].

En cualquier caso, hay un problema genuino sobre la prueba de Turing. La prueba de Turing restringe inherentemente el alcance de lo que consideramos “inteligente”, solo por el simple hecho de que nosotros, los humanos, somos los que juzgamos la máquina. ¿Y si un día creamos una Súper IA, podemos entender muchos temas y son mucho más inteligentes que toda la humanidad combinada, pero aún así no podemos hablar verbalmente o entender la mayoría de nuestros conceptos lingüísticos?

No podría pasar la prueba de Turing,

aunque sería claramente inteligente.

Esta pregunta requiere una respuesta exhaustiva; desafortunadamente, debido a la falta de tiempo este fin de semana para un A2A, voy a replantearlo a un artículo bien escrito de Stanford: http://plato.stanford.edu/entrie

Después de digerir ese artículo, seguiré analizando el trabajo citado de dos profesores de Berkeley en filosofía:

  • Hubert Dreyfus (1986), Mind Over Machine
  • John Searle (1981), “Mentes, cerebros y programas”, Behavioral and Brain Sciences , 3: 417–57.

Searle originó el argumento de la sala china, pero vea el seguimiento de Paul King y los enlaces a la neurociencia: Re: prueba de Turing por Adriano Stephan en CogSci

Me parece que hay dos aspectos de la prueba de Turing. Una es la pregunta general de “¿cómo podemos saber si otro ser es inteligente?”, Y la segunda es la idea específica del juego de imitación.

Ahora que el polvo está comenzando a establecerse sobre la idea de que un chatbot ha pasado la especificación original de Turing para el juego de imitación, se destaca que las suposiciones de Turing acerca de lo que constituiría una buena imitación de la inteligencia humana están en desacuerdo con nuestro entendimiento actual. Cuando Turing escribió su artículo, la idea de que una máquina podía producir un lenguaje naturalista parecía un objetivo exigente. Ahora sabemos mucho más sobre el lenguaje, y sabemos cómo codificar las respuestas naturalistas de una manera que puede engañar a los humanos sin necesidad de que haya una inteligencia real detrás de ellos.

Sin embargo, creo que la pregunta central de “¿pueden las máquinas pensar?” y el enfoque de Turing para abordar eso sigue siendo válido. Su punto central fue que no tenemos forma de saber si algún otro ser es consciente e inteligente, porque no podemos experimentar sus procesos de pensamiento: ni siquiera sabemos si nuestros amigos y familiares tienen una experiencia consciente similar a la nuestra. Hasta que alguien desarrolla la telepatía, ese punto sigue siendo cierto; no hace mucho tiempo se consideraba que [insertar minoría aquí] tenía inteligencia subhumana. Como resultado, Turing propuso que la única forma razonable de juzgar la inteligencia es a través del comportamiento externo, y que para hacerlo debe establecer un campo de juego de nivel para permitir la comparación del comportamiento humano y no humano. Eso, en mi opinión, todavía se mantiene.

Así que necesitamos una especificación mejor y más exigente para el juego de imitación. Pero la idea de que un juego de imitación de algún tipo es nuestra única prueba razonable de inteligencia es la mejor que tenemos.

La prueba de Turing no tiene y nunca tiene, y nunca fue la intención de representar ningún tipo de actitud científica definitiva a las preguntas de la naturaleza de la inteligencia. Su artículo deja bastante claro que hay problemas con la pregunta “¿Pueden las máquinas pensar?” y lo reemplaza con la pregunta:
¿Pueden las máquinas hacer lo que nosotros (como entidades pensantes) podemos hacer?
En otras palabras, ¿podemos operacionalizar una definición? Esta pregunta ni siquiera usa la palabra inteligencia.

En 1950, Alan Turing propuso una prueba interesante para determinar si una computadora poseía inteligencia artificial utilizando un interrogador humano. El interrogador podría usar un teclado y una pantalla para dirigir las preguntas a dos encuestados invisibles. Un encuestado sería humano y el otro una computadora.

Un error común sobre la prueba de Turing, es que Turing consideraría un sistema inteligente si pasa esta prueba.

Para corregir este error:

Si después de una interrogación de 5 minutos a ambos encuestados, el interrogador no pudo identificar la computadora más del 70 por ciento de las veces , Turing dijo que la computadora tiene cierto grado de inteligencia .

Aquí hay un documento académico del MIT que resume y discute las críticas de la prueba de Turing: http://people.csail.mit.edu/katr