El idioma oculto del copiloto

Hay una experiencia cada vez más común cuando trabajás con modelos de lenguaje en español. Le pedís una respuesta en tu idioma, y la respuesta llega impecable. La gramática funciona. El tono es correcto. Si insistís, incluso puede usar voseo. Puede escribir “vos”, “querés”, “pensás”, como si hubiese crecido tomando café en alguna de las orillas del Río de la Plata.

Y sin embargo, algo no termina de encajar.

No es un error de traducción. Es más sutil. Las frases están en español, pero las categorías parecen venir de otro lado. El tono corporativo suena importado. Las recomendaciones presuponen instituciones que no siempre existen. Las soluciones parecen diseñadas para empresas con otra infraestructura, otro marco legal, otra relación con el riesgo, otra abundancia de recursos. La IA habla nuestro idioma, pero no siempre parece mirar desde nuestro mundo.

La pregunta, entonces, no es si la IA puede responder en español. Ya sabemos que puede.

La pregunta es otra: cuando responde en español, ¿desde dónde piensa?

La vieja pregunta de Sapir y Whorf

A comienzos del siglo XX, Edward Sapir y Benjamin Lee Whorf formularon una idea que todavía incomoda: el lenguaje no es solo un instrumento para expresar pensamiento; también participa en darle forma.

La versión fuerte de esa hipótesis decía, más o menos, que el idioma determina lo que una persona puede pensar. Esa versión hoy es difícil de sostener. Las personas piensan más allá de sus palabras, aprenden otros idiomas, traducen, inventan conceptos, rompen los límites de su lengua todo el tiempo.

Pero la versión débil sigue viva, y es mucho más interesante: el idioma no determina el pensamiento, pero orienta la atención. No decide qué podés pensar, pero influye en qué te resulta natural distinguir primero. Qué se nombra con facilidad. Qué diferencias aparecen obvias. Qué relaciones quedan escondidas porque la lengua no las obliga a aparecer.

La investigación contemporánea sobre relatividad lingüística fue por ese camino. No necesitamos creer que una lengua encierra la mente para reconocer algo más modesto y más poderoso: hablar una lengua es habitar un sistema de énfasis. Cada idioma trae hábitos de atención, metáforas, formas de ordenar el tiempo, la agencia, el espacio, la responsabilidad, el vínculo con otros.

Eso no significa que cada idioma sea una cárcel. Significa que cada idioma es una forma de orientación. Unos anteojos a través de los cuales se ve el mundo.

Y si esto importa para los humanos, aparece una pregunta nueva para las máquinas que ahora usamos para pensar, escribir, programar, investigar y decidir: ¿qué pasa cuando esas máquinas son multilingües en la superficie, pero fueron formadas dentro de una ecología lingüística profundamente asimétrica?

La IA no piensa, pero hereda un idioma de referencia

Conviene ser precisos. La IA no piensa en inglés como piensa una persona. No tiene infancia en inglés, no sueña en inglés, no pertenece a una comunidad lingüística. Decir que “la IA piensa en inglés” es una metáfora, y como toda metáfora potente, puede iluminar o confundir.

La versión más defendible es esta: muchos modelos fundacionales fueron entrenados, evaluados y alineados dentro de un ecosistema donde el inglés funciona como idioma de referencia. No porque todo esté en inglés, sino porque una parte decisiva de la cadena que forma a los modelos —datos, papers, documentación, ejemplos de código, foros, benchmarks y criterios de evaluación— nace ahí.

No sabemos exactamente la composición lingüística de los modelos cerrados más recientes. OpenAI, por ejemplo, no publica el detalle completo de los datos de entrenamiento desde GPT-4. Esa opacidad importa. Pero sí tenemos señales claras en modelos y corpus documentados. GPT-3 tenía más del 92% de palabras en inglés en las estadísticas publicadas por OpenAI. Llama 2 reportaba cerca del 90% de datos en inglés. Llama 3 mejoró cobertura multilingüe, pero Meta aclaró que más del 5% del preentrenamiento era en idiomas distintos del inglés; dicho de otra manera, el inglés seguía siendo el centro.

Hay excepciones importantes, como BLOOM, diseñado explícitamente como esfuerzo multilingüe. Pero justamente por eso son excepciones: muestran que la asimetría no es inevitable, sino una decisión de diseño, costo, disponibilidad de datos, incentivos y poder.

Eso importa porque el entrenamiento no solo enseña palabras. También enseña qué forma tiene una respuesta considerada buena: qué tono suena profesional, qué explicación parece completa, qué ejemplos aparecen como naturales, qué problemas merecen ser nombrados. Incluso cuando un modelo aprende otros idiomas, muchas veces aprende a evaluarlos desde una vara construida en inglés.

En ese sentido, el inglés opera como un centro de gravedad: no elimina las demás lenguas, pero curva el espacio conceptual a su alrededor. Las demás lenguas existen, aparecen, se traducen, enriquecen. Pero muchas veces lo hacen dentro de una arquitectura conceptual cuyo centro de masa está en otro lugar.

Esa asimetría tiene una expresión material que pocas veces se nombra: los tokenizadores. Antes de procesar el texto, los modelos lo parten en unidades llamadas tokens. En muchos tokenizadores, las palabras inglesas quedan representadas de manera más compacta que las de otros idiomas. Según el tokenizador y el par de lenguas, el mismo contenido puede necesitar muchos más tokens; Petrov et al. (2023) muestran diferencias de hasta 15 veces en algunos casos. No es solo una curiosidad técnica. Para quien trabaja en español, significa que el mismo prompt puede costar más, llenar antes la ventana de contexto y llegar más fragmentado al modelo. El centro de gravedad lingüístico no es solo cultural: también está cableado en la economía interna de la herramienta.

Responder en español no es pensar desde el español

Esta distinción es crucial.

Un modelo puede responder en español correcto y aun así operar con defaults culturales anglosajones. Puede traducir “performance review” como evaluación de desempeño, pero asumir una cultura de feedback que no existe igual en todas las geografías. Puede hablar de “ownership” como propiedad o responsabilidad, pero no captar del todo cómo se distribuye la agencia en organizaciones más jerárquicas, más informales o más atravesadas por relaciones personales. Puede recomendar procesos de compliance, contratación o atención al cliente que tienen sentido en California y suenan razonables en Bogotá, Buenos Aires o Ciudad de México, pero fallan en la fricción real.

La traducción lingüística puede ocultar la traducción cultural.

Pasa también en software. Un copiloto puede proponer una arquitectura impecable en abstracto, pero asumir acceso estable a servicios cloud, equipos con especialistas para cada capa, presupuestos que toleran sobreingeniería, documentación en inglés, disponibilidad de librerías mantenidas, conectividad constante, marcos regulatorios conocidos. En América Latina, muchas veces el diseño correcto no es el más elegante en abstracto, sino el que sobrevive en condiciones concretas: equipos chicos, proveedores cambiantes, restricciones presupuestales, integraciones heredadas, regulaciones ambiguas, clientes que usan el sistema de maneras que ningún paper describe.

Vale una aclaración que voy a sostener todo el artículo: “América Latina” no es una sola realidad. Lo que funciona en una fintech mexicana puede ser irrelevante en un equipo distribuido en Lima, y lo obvio en una pyme argentina puede ser opaco en un retail brasileño. La asimetría con el inglés es compartida; las realidades por debajo de esa asimetría, no. Cuando hablo de “nuestro contexto” lo hago en plural. Y suele ser esa diferencia interna —no la unidad— lo que el modelo tiende a aplanar primero.

Ahí se vuelve visible la diferencia entre hablar el idioma y entender el mundo.

El español no es solo una interfaz para expresar ideas que podrían haberse pensado igual en inglés. Como cualquier lengua viva, carga modos de relación, niveles de cercanía, formas de cortesía, ambigüedades productivas, ironías, jerarquías, afectos, rodeos, silencios. No es lo mismo decir “hacelo” que “¿lo podrías mirar?”. No es lo mismo “te lo dejo por acá” que “attached you will find”. No es lo mismo una reunión donde el desacuerdo se formula frontalmente que una donde aparece por acumulación de matices.

Cuando la IA responde en español desde categorías aprendidas mayoritariamente en inglés, puede conservar la superficie y perder parte de esa profundidad.

El idioma como infraestructura cultural

Acá Wade Davis ayuda a ampliar el marco.

Davis, antropólogo y etnobotánico, propuso pensar la diversidad cultural como una etnosfera: así como existe una biosfera hecha de diversidad biológica, existe una etnosfera hecha de lenguas, mitos, técnicas, memorias, prácticas, intuiciones y formas de vida. Para Davis, una lengua no es apenas vocabulario ni gramática. Es un modo de traer un mundo al mundo. En una de sus imágenes más conocidas, cada lengua es “an old-growth forest of the mind”: un bosque antiguo de la mente.

La imagen importa porque cambia la escala del problema. Si Sapir y Whorf nos ayudan a decir que el idioma orienta la atención, Davis nos recuerda que una lengua sostiene una ecología completa de pensamiento.

Cuando una lengua se debilita, no desaparece solamente una colección de palabras. Se pierde una forma de clasificar plantas, de leer el clima, de nombrar parentescos, de narrar el origen, de resolver conflictos, de educar a los hijos, de entender la muerte, de relacionarse con el territorio. Se pierde una biblioteca viva de respuestas humanas a la pregunta de cómo habitar el mundo.

No quiero forzar el paralelo. La pérdida de una lengua indígena con pocos cientos de hablantes y el uso cotidiano de un modelo en español por más de seiscientos millones de personas no son el mismo fenómeno, ni del mismo orden moral. Y tampoco quiero sugerir que el español “cargue” una esencia cultural fija que la IA esté traicionando: las lenguas son organismos vivos, mestizos, en transformación constante, no museos a preservar. Lo que Davis aporta es más modesto y útil: la idea de que cuando una lengua queda reducida a interfaz, parte de su mundo conceptual deja de circular, aunque las palabras sigan en uso. Esa advertencia sí viaja, sin necesidad de equiparar fenómenos.

Ese es el punto incómodo. La IA puede mantener visible el español en la capa de salida mientras empobrece la diversidad de mundos en la capa donde se organizan las respuestas. Puede decir nuestras palabras sin cargar plenamente los sistemas de experiencia que esas palabras traen consigo.

El riesgo no es que la IA nos responda en mal español. El riesgo es que nos responda en perfecto español desde una imaginación entrenada en otro bosque.

Qué se pierde cuando todo se vuelve traducible

El discurso tecnológico tiende a celebrar la traducción como solución final. Si el modelo puede traducir, el problema parece resuelto. Más idiomas soportados, más inclusión. Mejor interfaz, menos barrera.

Eso es cierto hasta cierto punto. La traducción abre puertas reales. Permite acceso, aprendizaje, colaboración. Para millones de personas, un modelo que responde bien en su idioma es una expansión concreta de capacidades.

Pero la traducción también puede producir una ilusión: la idea de que todo lo importante viaja sin pérdida entre contextos.

No siempre viaja.

Se pueden traducir palabras como “confianza”, “criterio”, “equipo”, “autoridad”, “deuda”, “compromiso”, “improvisación”, “viveza”, “formalidad”, “respeto”. Pero cada una arrastra un campo cultural distinto. En algunos contextos, confianza significa proceso verificable; en otros, vínculo sostenido. En algunos, autonomía significa independencia individual; en otros, capacidad de moverse dentro de una red de relaciones. En algunos, decir que algo es “profesional” implica distancia emocional; en otros, implica estar presente, responder rápido, poner el cuerpo.

Cuando el modelo aplana esas diferencias, no lo hace por malicia. Lo hace porque aprendió patrones. Y los patrones más abundantes tienen más gravedad.

Ahí aparece una forma nueva de homogeneización. No una imposición explícita. Nadie prohíbe hablar español, portugués, árabe, hindi o guaraní. Al contrario: la interfaz los acepta, los celebra, los renderiza. Pero debajo, las soluciones tienden a parecerse. Los correos suenan parecidos. Las estrategias se justifican igual. Los documentos adoptan la misma cadencia. Los productos se diseñan con los mismos supuestos. La diversidad lingüística sobrevive en la superficie mientras la diversidad conceptual se estrecha por debajo.

Es una pérdida difícil de medir, precisamente porque no se presenta como pérdida. Se presenta como eficiencia.

El riesgo de traducirnos a nosotros mismos

Hay una dependencia técnica evidente en el uso de IA: proveedores, APIs, costos, disponibilidad, privacidad, regulación. Pero hay otra dependencia más silenciosa: la dependencia cognitiva.

Si una herramienta responde mejor cuando formulás el problema con sus categorías, empezás a formular tus problemas de esa manera. No porque alguien te obligue. Porque funciona. Porque el prompt sale mejor. Porque la respuesta llega más limpia. Porque explicar tu contexto local exige más esfuerzo que traducirlo a una categoría global.

Acá hay una objeción razonable. El ecosistema técnico siempre fue anglocentrado. La documentación de Unix estaba en inglés en los setenta, Stack Overflow nos enseñó a formular preguntas en inglés, npm exige nombres en inglés. ¿Qué cambia ahora con el copiloto? La diferencia es de capa. Las herramientas anteriores eran exteriores al pensamiento: traducíamos al inglés para acceder al ecosistema, pero el problema lo seguíamos pensando en nuestro idioma y en nuestro contexto. El copiloto corre el lugar de la traducción. Ya no traducís solamente para preguntar; traducís para razonar acompañado, porque la calidad de la conversación depende de cómo la formulás. La anglización antes ocurría afuera del cuaderno. Ahora ocurre adentro.

Primero traducís una palabra. Después traducís una práctica. Después traducís una institución. Después traducís una intuición que todavía no tenía nombre técnico. Y un día descubrís que para pensar con la máquina empezaste a volverte legible para ella.

Ese es el riesgo más interesante: no que la IA no pueda traducirnos, sino que terminemos traduciéndonos nosotros para poder pensar con ella.

En desarrollo de software esto puede pasar de formas muy concretas. Adoptamos nombres de patrones que no necesitábamos. Convertimos problemas simples en arquitecturas reconocibles para el copiloto. Escribimos documentación en inglés no porque el equipo la necesite, sino porque el modelo la aprovecha mejor. Describimos usuarios locales con categorías de producto importadas. Normalizamos criterios de éxito que vienen de otra economía.

Cada decisión aislada parece razonable. Acumuladas, cambian el centro desde el cual pensamos.

Soberanía cognitiva

La respuesta no puede ser rechazar modelos globales ni refugiarse en una pureza lingüística imposible. Las culturas siempre cambiaron por contacto. Las lenguas siempre se contaminaron, se prestaron palabras, inventaron mezclas, absorbieron influencias. El problema, como diría Davis, no es el cambio. El problema es la dominación: cuando una forma de ver el mundo se vuelve tan central que las demás solo aparecen como variaciones locales de esa forma.

Entonces la pregunta práctica es: ¿cómo usamos IA sin entregar el centro de gravedad de nuestro pensamiento?

Una parte de la respuesta está en construir contexto propio. Documentación escrita desde nuestra realidad, no solo traducida. Benchmarks en español que no sean versiones espejo de benchmarks en inglés. Evaluaciones hechas por expertos de dominio local. Ejemplos que incluyan restricciones reales de nuestras organizaciones. Prompts que no pidan solamente “respondé en español”, sino “razoná desde este contexto, con estas instituciones, estas limitaciones, esta cultura de trabajo, estos riesgos”.

Otra parte está en sostener sospecha crítica frente a la respuesta demasiado fluida. Cuando algo suena impecable, preguntarse: ¿impecable para quién? ¿Qué presupuestos trae? ¿Qué mundo da por sentado? ¿Qué parte de nuestra realidad quedó convertida en excepción, nota al pie o ruido?

Y una tercera parte es más colectiva: necesitamos producir más conocimiento técnico desde nuestros idiomas. No solo consumirlo traducido. Escribir más documentación, más casos, más análisis, más datasets, más críticas, más marcos conceptuales desde América Latina. Si el corpus define parte del mundo que la IA aprende, entonces no alcanza con reclamar representación. Hay que producirla.

Esto no es solo aspiración. Hay esfuerzos concretos en marcha. En Chile, el Centro Nacional de Inteligencia Artificial coordina LatamGPT, una iniciativa regional para entrenar modelos con datos de múltiples países y reflejar variantes lingüísticas y contextos locales. En España, el Barcelona Supercomputing Center desarrolló MarIA, una familia de modelos para el español, y FLOR, un modelo abierto multilingüe para catalán, español e inglés. Iniciativas como Aya, de Cohere for AI, empujan la cobertura multilingüe desde el lado de los datasets. Ninguna resuelve sola el problema; entre todas muestran que la asimetría no es un destino. Pero también muestran la escala del trabajo: producir corpus, entrenar, evaluar y mantener cuesta órdenes de magnitud más que consumir traducido. Por eso el desafío no es solo técnico, también es de coordinación regional y de paciencia institucional, dos cosas que históricamente nos cuestan.

Sapir y Whorf nos dejaron una incomodidad útil: tal vez el lenguaje no determine lo que pensamos, pero sí orienta lo que vemos primero. Wade Davis amplía esa incomodidad: cada lengua no es solo un canal de comunicación, sino una ecología de memoria, imaginación y respuesta.

La IA generativa entra justo ahí, en el lugar donde el lenguaje se vuelve herramienta cotidiana para pensar. Por eso la pregunta importa. No porque haya que defender una frontera pura entre idiomas, sino porque las herramientas que usamos para pensar también empiezan a enseñarnos qué formas de pensamiento parecen naturales.

La IA puede hablar español. La pregunta es si nos ayuda a pensar mejor desde el español, desde América Latina, desde nuestras restricciones y nuestras formas de inventar, o si nos entrena lentamente a traducirnos hacia un centro que no siempre nos ve.

¿En qué momentos sentís que la IA entiende tu idioma pero no tu contexto? ¿Qué categorías tuyas tenés que traducir para que el modelo te responda bien? ¿Qué parte de nuestra manera de pensar querés que sobreviva en las herramientas que usamos todos los días?

Lecturas recomendadas

Lera Boroditsky. (2011). How Language Shapes Thought.
Wade Davis. (2003). Dreams from Endangered Cultures. TED. https://www.ted.com/talks/wade_davis_dreams_from_endangered_cultures
Wade Davis. (2009). The Wayfinders: Why Ancient Wisdom Matters in the Modern World.
Aleksandar Petrov, Emanuele La Malfa, Philip H. S. Torr y Adel Bibi. (2023). Language Model Tokenizers Introduce Unfairness Between Languages. NeurIPS. https://arxiv.org/abs/2305.15425
Edward Sapir. (1929). The Status of Linguistics as a Science.
Benjamin Lee Whorf. (1956). Language, Thought, and Reality.