Póngase en contacto con nosotros

El test de Turing: ¿Hasta qué punto está actualizado el test de inteligencia artificial en tiempos de Chat GPT & Co.

En esta primera parte de nuestra serie "AI Rap con Eva Eggeling", Eva Eggeling, Directora del Centro de Diseño Basado en Datos de Fraunhofer Austria y Directora del Centro de Innovación para la Digitalización y la Inteligencia Artificial KI4Life, profundiza en el tema del Test de Turing.

¿Puede un ordenador pensar como un humano o no? En la era del Chat GPT, preguntas como éstas están más de actualidad que nunca. Sin embargo, ya en las décadas de 1940 y 1950 se llevaron a cabo trabajos pioneros en el campo de la informática. aprendizaje automático conseguido. Y ya entonces, los investigadores buscaban respuestas a preguntas como éstas.

El lógico, matemático, criptoanalista e informático británico Alan Turingpresentó en su ensayo "Computing Machinery and Intelligence" una prueba que pretendía servir como método de investigación en el campo de la inteligencia artificial.


Alan Turing fue un lógico, matemático, criptoanalista e informático británico. Crédito: Wikipedia

 

¿Qué es el test de Turing?

 

El test de Turing está diseñado para analizar Inteligencia de las máquinas puede demostrarlo. La prueba se supera si el ordenador puede imitar las reacciones humanas en determinadas condiciones.

El predecesor del test de Turing es el llamado "Imitation Game". Tres participantes humanos se sientan en tres salas separadas, cada una de ellas conectada a través de una pantalla y un teclado. Un participante masculino se sienta en una sala, una participante femenina en la segunda y un "árbitro" masculino o femenino en la tercera.

La participante femenina intenta convencer al árbitro neutral de que ella es el participante masculino por la forma en que responde a algunas preguntas. El árbitro tiene la tarea de averiguar quién es el participante masculino.

 

¿Cómo funciona el test de Alan Turing?

El desarrollo posterior del juego de imitación para el test de Turing de Alan Turing pone ahora en juego una IA. Un ordenador maneja un terminal, mientras que los humanos se sientan frente a los otros dos. El árbitro debe interrogar a los participantes sobre un tema específico en un formato y un contexto determinados.

Tras un cierto tiempo y un determinado número de preguntas, el árbitro debe decidir qué ordenador manejará la IA. Este procedimiento se repite muchas veces. Si el árbitro no reconoce la IA en la mitad o menos de las pruebas, la IA puede clasificarse como inteligente, ya que el árbitro la percibe como "tan humana" como el entrevistado humano.

 

Críticas al test de Turing

Un gran Problema con las pruebas de IA es sin duda el hecho de que el propio Alan Turin no formulara ningún requisito para el cuestionario. Esto hace que la prueba sea difícil de interpretar. Científicos como Gary Marcus, catedrático de Psicología y Neurociencia de la Universidad de Nueva York, señalan las desventajas de la prueba. Por ejemplo, la prueba con los chatbots no dice nada sobre la inteligencia de las personas que también participan en el test de Turing. Además, la IA no es capaz de responder a preguntas complejas y no actúa de forma intuitiva.

Otro punto criticable es que en el pasado había que restringir el tipo de pregunta para que un ordenador demostrara una inteligencia similar a la humana. Durante mucho tiempo, un ordenador sólo conseguía una puntuación alta en el test de Turing si el interrogador formulaba preguntas de sí o no y los temas se referían a un estrecho campo de conocimiento. Si se hacían preguntas abiertas, la probabilidad de que la IA pudiera engañar al humano era menor.

A día de hoy, es cuestionable que el test de Turing pueda siquiera proporcionar una prueba creíble de inteligencia artificial. La imitación engañosamente genuina de la comunicación humana, ¿indica realmente la existencia de una inteligencia artificial independiente o no es más que una imitación engañosamente genuina?

 

 

¿Qué IA supera la prueba de Turing?

Con motivo del 60º aniversario de la muerte de Alan Turing en 2014, la Universidad de Reading en Londres organizó un concurso en el que un Chatbot llamado Eugene Goostman simulaba a un niño de 13 años. A ojos de algunos científicos, el chatbot superó la prueba, ya que engañó al 33% de los jueces.

Otros argumentan que no había suficientes jurados y que la prueba no era válida porque sólo duró cinco minutos. Otro argumento es que programas como Eugene Goostman tienen como principal objetivo engañar a los interrogadores. La IA responde a las preguntas que no entiende o para las que no tiene respuesta con contrapreguntas y maniobras evasivas. Cuanto más éxito tenga esto, más creerá la gente que se está comunicando con un interlocutor humano.

Un segundo ejemplo es el programa Google Dúplexun proyecto que permite a los usuarios hacer reservas a través del smartphone. En 2018, Google Duplex concertó con éxito una cita con una peluquera por teléfono ante 7.000 personas. La recepcionista no se dio cuenta de que no estaba hablando con una persona real. Este experimento también es considerado por algunos científicos como una prueba de Turing exitosa, aunque no se basa en el formato original de Alan Turing.

ChatGPT y otras IAs modernas basadas en una Gran modelo lingüístico (LLM) ahora pasan regularmente la prueba de Turing. Esta es otra razón por la que se considera obsoleta en la ciencia.

 

Tres ámbitos de aplicación del test de Turing

Aunque la prueba de IA de Alan Turing ha sido ampliamente criticada, la idea básica -la imitación engañosamente realista de la comunicación humana- sigue desempeñando un papel en la digitalización actual.

  • Prueba de Interacción Humana (HIP): La consulta CAPTCHA puede considerarse una prueba de Turing negativa. Como prueba de interacción humana, tiene la función de distinguir a los humanos de las máquinas y alejar eficazmente a los bots de un sitio web mediante consultas automatizadas de texto e imagen. El nombre CAPTCHA significa "Completely Automated Public Turing test to tell Computers and Humans Apart" (Prueba de Turing pública completamente automatizada para distinguir a ordenadores y humanos).
  • Bots: Los bots son herramientas electrónicas que cumplen tareas positivas o negativas en función de su aplicación. Por ejemplo, se utilizan como chatbots para automatizar eficazmente las consultas de atención al cliente. Por otro lado, también se utilizan como bots sociales o bots de spam para difundir información falsa o malware. En ambos casos, las variantes de la prueba de Turing ayudan a seguir desarrollando los bots y hacerlos más parecidos a los humanos.
  • Asistentes de voz: De todas las tecnologías, los asistentes de voz son probablemente los que más se acercan al concepto original de Alan Turing. Los asistentes de voz como Alexa o Siri se basan en un sistema de preguntas y respuestas y están diseñados para automatizar las tareas cotidianas y las necesidades de los usuarios. Aunque las aplicaciones actuales aún no alcanzan el nivel necesario para superar la prueba de Turing, se mejoran constantemente mediante el aprendizaje automático y el análisis del comportamiento de los usuarios y se parecen cada vez más a los humanos

 

 

¿Sigue siendo relevante hoy en día el test de Alan Turing?

Eva EggelingDirector del Centro de Diseño Basado en Datos de Fraunhofer Austria y Director del Centro de Innovación para la Digitalización y la Inteligencia Artificial KI4Life, afirma: "Creo que es especialmente actual ahora, sobre todo desde la gran popularidad de ChatGPT para la población en general".

A pesar de los numerosos debates sobre la pertinencia del test de Turing en la actualidad y la validez de las competiciones basadas en él, el test sigue siendo un punto de partida filosófico para el debate y la exploración de la IA. Mientras seguimos avanzando en IA y comprendiendo y cartografiando mejor cómo funciona el cerebro humano, el test de Turing sigue siendo fundamental para la definición de inteligencia y constituye una base para el debate sobre lo que debemos esperar de las tecnologías para considerarlas máquinas pensantes.

Puestos similares

La actualidad televisiva del editor especializado

La actualidad televisiva del editor especializado

Streaming en los medios de comunicación: cómo WEKA Industrie Medien establece nuevos estándares con imágenes en movimientoLo que solía ser dominio exclusivo de las grandes empresas de medios de comunicación se está convirtiendo en un modelo de éxito en el sector B2B: estudios de televisión propios, producciones de vídeo y formatos de noticias cross-media. A...

leer más
¿Confía en la prensa escrita?

¿Confía en la prensa escrita?

Entonces me gustaría felicitarle, porque los medios impresos consiguen como ningún otro canal transmitir tanta confianza. Así lo demuestran numerosos estudios, como los de Kanar u horizont.net, según los cuales el 80 % de los encuestados reconoce los artículos de los medios impresos como...

leer más
es_ESEspañol