ChatGPT tiene tics lingüísticos debido al colonialismo digital

El uso de la IA a gran escala está revelando nuevas tendencias lingüísticas y trayendo de vuelta algunas palabras obsoletas. El empleo de ciertos términos ha sido revelador, no solo en los textos generados por ChatGPT, sino también en cómo fue entrenado.

“Delve” no es realmente una palabra de uso común en inglés. Se refiere a “alcanzar algo desde una superficie”, o “examinar algo en detalle para intentar encontrar información”, según el Diccionario Cambridge. Sin embargo, desde 2023, su uso en artículos de investigación científica se ha incrementado diez veces, como señala el experto en inteligencia artificial Jeremy Nguyen.

¿A qué se debe este repentino y curioso aumento en el uso de la palabra “profundizar”? La respuesta sería simple, según el investigador: ChatGPT. El chatbot de OpenAI se utilizaría masivamente para redactar artículos de investigación, mencionó Jeremy Nguyen en una publicación en X (anteriormente Twitter). Pero “profundizar” no es la única palabra inusual empleada desproporcionadamente por la inteligencia artificial, y esto podría deberse a la manera en que se entrenan los chatbots.

ChatGPT desarrolla sus propios tics lingüísticos, inspirados en los trabajadores que lo entrenaron

En un artículo publicado el 16 de abril de 2024, The Guardian explica que esta tendencia de utilizar “profundizar” indiscriminadamente no es una coincidencia: “es más bien un fenómeno muy real, vinculado a la forma en que se ha desarrollado ChatGPT.” Al igual que otros chatbots, ChatGPT se basa en un modelo de lenguaje para operar, y este modelo a su vez fue entrenado con enormes cantidades de texto encontradas en Internet. Estos textos fueron luego etiquetados y el entrenamiento de la IA en estos modelos de lenguaje fue supervisado por humanos.

Sin embargo, estos humanos son, la mayoría de las veces, trabajadores precarios, “pequeñas manos de IA” que trabajan a bajo costo desde Kenia o Madagascar para etiquetar datos. Sin embargo, si “profundizar” rara vez se usa en inglés británico o americano, en Nigeria la palabra “se usa mucho más frecuentemente en inglés de negocios”, señala The Guardian. “Así que las personas responsables de entrenar a las IA proporcionaron ejemplos usando su idioma, lo que resultó en un sistema de IA que escribe un poco como el inglés que se habla en África.”

Este “sesgo” es particularmente notable y, por lo tanto, el artículo de The Guardian y los comentarios de Jeremy Nguyen no sorprendieron a los conocedores de la IA. En un subreddit dedicado a ChattGPT, los usuarios se divirtieron compartiendo otros términos que, según ellos, eran indicadores de oraciones escritas por el chatbot. Entre los más mencionados, destacamos “misterioso”, “floreciente”, “desmitificador”, “robusto” y “salvaguardar”. Individualmente, ninguna de estas palabras es realmente sorprendente (con la posible excepción de “floreciente”, raramente usada en la vida cotidiana), es más bien el uso combinado de estos términos lo que generalmente es un signo de IA.

ChatGPT no solo tiene tics lingüísticos en inglés. Los periodistas de Numerama utilizan la IA diariamente para producir resúmenes de artículos (que están disponibles con la suscripción a Numerama Plus) y, por lo tanto, pudieron notar algunos de estos “tics”. La IA suele generar frases muy largas, con un vocabulario complicado, y tiene una tendencia agotadora a utilizar el participio presente. Al generar el resumen de este artículo, ChatGPT utilizó “diez veces”, “prácticas lingüísticas”… pero por una vez, sin participio presente.

BLOG

Blog

El uso indebido de ChatGPT perjudica el rendimiento académico y provoca pérdida de memoria

Byadmin May 3, 2024

El uso generalizado de inteligencia artificial generativa, como ChatGPT, en el ámbito académico está generando preocupación creciente entre investigadores y educadores. Aunque muchos estudiantes consideran esta tecnología una solución rápida...

Blog

ChatGPT: La IA es más humana que algunos estudiantes, según demuestra este sorprendente estudio

Byadmin May 3, 2024

Cuando se evalúan las capacidades de grandes modelos de lenguaje como ChatGPT, la mayoría de los estudios se centran en su habilidad para extraer información fáctica, ejecutar razonamientos lógicos o...

Blog

La inteligencia artificial de código abierto: una solución adaptativa y segura

Byadmin March 27, 2024

Un artículo de Le Monde nos alertó el 13/02: ¡las IA están fallando! Esas IA, que generaron tanto entusiasmo y excitación al principio, ¿necesitan ahora que tomemos distancia? ¿Existen riesgos...

Blog

ChatGPT, una novedosa herramienta de escritura en el escenario político

Byadmin March 4, 2024

ChatGPT ha irrumpido en el ámbito académico y profesional, y ahora se adentra en el terreno político: los políticos lo utilizan para elaborar discursos y legislación, y algunos incluso aspiran...

Blog

La doble amenaza que ChatGPT representa para los secretos corporativos

Byadmin April 27, 2024

Una vez que aprenden a usarlo, cada vez más empleados están utilizando ChatGPT para simplificar sus tareas, como responder correos electrónicos, preparar presentaciones o codificar software. Según Cyberhaven, una empresa...

Blog

En una gira mundial destinada a calmar las preocupaciones sobre la IA, el creador de ChatGPT critica a la UE

Byadmin March 5, 2024

Desde Brasil hasta Nigeria y desde Europa hasta Asia, Sam Altman, líder de OpenAI y mente detrás de ChatGPT, está llevando a cabo un recorrido global con el objetivo de...