Según un Estudio, La IA Contamina los Datos Humanos

Según un Estudio, La IA Contamina los Datos Humanos

Crédito: Unsplash.

Estudio Afirma Que Los Datos De IA Contaminan La Información Humana Vital

En los comienzos de la década de 2000, Jeff Bezos introdujo el concepto de “turcos mecánicos”, que consistía en contratar a trabajadores a distancia para tareas de poca importancia que los ordenadores consideraban un reto. Con frecuencia, estos trabajadores cobraban salarios bajos y colaboraban con otros muchos para completar pequeñas partes de proyectos informáticos de mayor envergadura.

Para describir esta fusión de inteligencia humana y digital, Bezos acuñó el término “inteligencia artificial”, destinado a incorporar una dimensión humana a tareas que a los equipos les resultaban difíciles, sobre todo las más sencillas.

Aproximadamente 250.000 personas están empleadas a través del mercado Mechanical Turk de Amazon, que es sólo una de las varias plataformas que ofrecen unos servicios similares.

La creciente dependencia de los empleados humanos de los contenidos generados por la IA

Investigadores de la Universidad EPFL, con sede en Suiza, señalaron recientemente una tendencia preocupante: los trabajadores que antes proporcionaban información humana valiosa ahora dependían de contenidos generados por IA para completar sus tareas. Acuñaron el término “inteligencia artificial” para describir este fenómeno.

Los investigadores expresan su preocupación por las implicaciones de este término, que puede resultar divertido. Argumentan que si los trabajadores confían cada vez más en los generadores de inteligencia artificial para realizar sus tareas, disminuirá considerablemente la fiabilidad de los datos obtenidos por crowdsourcing.

Aunque los grandes modelos lingüísticos (LLM) destacan en el procesamiento de datos de entrenamiento, hay ciertas tareas para las que la aportación humana sigue siendo superior. En comparación con los ordenadores, los humanos son más eficientes a la hora de etiquetar datos para la entrada de modelos, describir imágenes y responder a pantallas CAPTCHA.

Limitaciones de los Grandes Modelos Lingüísticos

Utilizar el crowdsourcing para validar los resultados de grandes modelos lingüísticos o crear datos humanos de referencia puede plantear un problema: ¿qué pasaría si los propios trabajadores de las multitudes utilizan los LLM para aumentar su productividad y sus ingresos en las plataformas de crowdsourcing?

Esta situación contaminaría el conjunto de datos, lo que podría socavar la fiabilidad de las operaciones basadas en IA.

La palabra “turco” tiene su origen en un “robot” que jugaba al ajedrez en el siglo XVIII y que derrotó a ajedrecistas de toda Europa, haciéndoles creer que jugaban contra una máquina. Hoy, el crowdsourcing con “turcos” se ha convertido en una industria multimillonaria, aunque su reputación se ha visto empañada por los bajos salarios.

No obstante, el sector se enfrenta ahora a una amenaza debido a la rápida adopción de los grandes modelos lingüísticos. Según un reciente estudio, un modelo ChatGPT de 3,5 turbos rinde mucho más que los trabajadores de multitudes por una fracción del coste.

Desafíos del Crowdsourcing

Los trabajadores se enfrentan a una presión cada vez mayor para producir más a un ritmo más rápido, por lo que es posible que recurran cada vez más a los recursos de la IA. Según un estudio limitado, los investigadores de la EPFL calculan que entre el 33% y el 46% de las tareas asignadas a los trabajadores de la plataforma Mechanical Turk de Amazon se completaron con la ayuda de grandes modelos lingüísticos.

Estos investigadores advierten de que, a medida que se popularizan los grandes modelos lingüísticos y surgen modelos multimodales que admiten la entrada y salida de texto, imágenes y vídeo, deben tomarse medidas para que la información humana siga siendo claramente humana. Sus hallazgos sirven como señal de advertencia para que plataformas, investigadores y trabajadores de masas busquen nuevos enfoques para preservar el elemento humano en los datos.


Read The Original Article On TechXplore.

Read More: AI Framework Improves Communication Analysis in Team Training.

El Increíble Análisis de Datos

    Share this post