Este artículo nace de una experiencia práctica: intentar generar imágenes del mundo rural mediante herramientas de inteligencia artificial como DALL·E o Midjourney. Lo que debía representar una escena reconocible del campo uruguayo terminaba siendo una mezcla de elementos extraños: construcciones centroamericanas en pleno campo, con el Cerro Batoví de fondo, y un sinfín de estereotipos acartonados. Esto revelaba algo más que un problema estético: la IA no ha sido entrenada para comprender la ruralidad.
Los modelos de IA aprenden a partir de corpus de datos que, en su gran mayoría, provienen de contextos urbanos y digitalizados. La desproporción es enorme: la cantidad de datos generados, etiquetados y disponibles sobre vida rural es ínfima en comparación con la masa de información urbana. A esto se suma que, durante el entrenamiento, los algoritmos realizan procesos de "limpieza" que descartan términos poco frecuentes o no normativos. Así, voces rurales como ñandubay, verijero, tropilla, trama, estar entorado o chairado son eliminadas por no ajustarse al léxico central.
Este fenómeno no ocurre únicamente de forma automática. También se reproduce culturalmente: muchos de los datos que se etiquetan como "rurales" provienen de visiones externas, a menudo urbanas, cargadas de preconceptos. Lo que se conserva en los modelos no es la experiencia vivida de quienes habitan el campo, sino su caricatura. Y en ese proceso, se pierden saberes, prácticas, matices y vocabularios que no solo representan identidades, sino también formas de resolver problemas productivos, ambientales y sociales.
Recientes estudios han mostrado que los principales conjuntos de datos globales tienden a subestimar en un porcentaje significativo la población que vive en zonas rurales. Esta invisibilización no es neutra: repercute directamente en las decisiones que se toman con ayuda de IA en ámbitos como la sanidad animal, la logística, la educación o el desarrollo territorial.
Corregir este sesgo no es solo una cuestión de justicia simbólica. Es una necesidad operativa y estratégica. Para que la inteligencia artificial sea útil en contextos rurales, debe ser entrenada con datos rurales reales, generados desde los propios territorios, validados por actores que conozcan sus lógicas, y respetuosos de su diversidad.
Una posible vía es promover la creación de repositorios culturales rurales específicos, que recojan lenguaje, imágenes, prácticas, soluciones locales y experiencias históricas. Estos repositorios no solo fortalecerían la representación rural en los modelos de IA, sino que también servirían como resguardo de un patrimonio intangible en riesgo de desaparecer.
Porque si la IA se entrena únicamente con lo que dicen, piensan y etiquetan las ciudades, el riesgo no es solo que represente mal al campo. El riesgo es perder los conocimientos fundamentales de quienes, desde hace siglos, alimentan al mundo.