Al hacer clic en "Aceptar", acepta que se almacenen cookies en su dispositivo para mejorar la navegación por el sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para obtener más información.
Abastecimiento de impacto

El etiquetado de datos es una profesión, no un trabajo servil

Escrito por
Aïcha
Publicado el
2023-07-10
Tiempo de lectura
Esto es un texto dentro de un bloque div.
min
📘 ÍNDICE
Muchas gracias. Hemos recibido su envío.
¡Uy! Algo ha ido mal al enviar el formulario.

[Fuente en la que se basa nuestro artículo: Deep Learning AI - The Batch - Número 204 - https://www.deeplearning.ai/the-batch/issue-204/]

En un enfoque de la IA centrado en los datos, el desarrollo de productos de IA de alto rendimiento depende de datos anotados con precisión.

Sin embargo, la naturaleza exigente del trabajo de etiquetado de datos y los costes asociados a la anotación de datos a gran escala están animando a las empresas a buscar soluciones para automatizar el trabajo de anotación, o a recurrir a proveedores de servicios autónomos mal pagados. Estos etiquetadores de datos, a menudo contratados a través de plataformas como Amazon Mechanical Turk o Upwork, están muy solicitados y a veces tienden a apresurar el trabajo para cumplir los estrictos plazos que se les imponen, o a abandonar. Sin embargo, a todo el mundo le convendría considerar la anotación de datos menos como un trabajo ocasional o un "trabajillo", y más como una profesión por derecho propio.

¿Cómo funciona el sector de la anotación de datos?

Las empresas que prestan servicios de anotación (o etiquetadores de datos), como Centaur Labs, Surge AI o Remotasks (parte de Scale AI) y muchas otras grandes del sector, utilizan sistemas automatizados o manuales de crowdsourcing para gestionar trabajadores autónomos de todo el mundo. Los etiquetadores de datos autónomos tienen que pasar exámenes de cualificación, recibir formación y ser evaluados periódicamente para realizar tareas como trazar "Bounding Boxes" en imágenes o vídeosclasificar sentimientos expresados en publicaciones en redes sociales, evaluar videoclips de carácter sexual en determinados casos, clasificar transacciones bancarias o evaluar respuestas de chatbot.

Desafíos relacionados con la estabilidad del empleo y los salarios de los informáticos autónomos

La escala salarial de los etiquetadores de datos varía considerablemente según la ubicación de los trabajadores y la tarea que se les asigne, y oscila entre 1 dólar la hora en Kenia y 25 dólares la hora o más en Estados Unidos. Ciertas tareas que requieren conocimientos funcionales o especializados, buen juicio y/o una gran cantidad de trabajo pueden llegar a pagarse hasta 300 dólares por microtarea.

Además, este tipo de trabajo suele ser poco estable y no tiene en cuenta el derecho laboral: si un Data Labeler se ausenta un día para ir al médico o sufre un corte de electricidad o de conexión a Internet, es inmediatamente sustituido por el sistema de crowdsourcing. Además, este sistema no tolera los momentos de cansancio o los problemas temporales de rendimiento: ¡un par de errores de más y fin del contrato para el Data Labeler!

Al considerar que el etiquetado de datos es una tarea sencilla al alcance de todos, las empresas buscan reducir drásticamente los costes, hasta el punto de negociar tarifas horarias indecentes. Aunque recurrir a una solución deslocalizada suele ser una buena manera de reducir costes, no se equivoque: no es posible obtener a la vez un servicio de calidad y el respeto de los derechos humanos fundamentales por menos de 5 euros la hora (¡lo cual ya es muy bajo!) para un etiquetador de datos, independientemente de que esté basado en la India, Filipinas o Madagascar.

Por desgracia, este sistema es hoy demasiado impersonal: para proteger los secretos comerciales de sus clientes, las empresas asignan tareas sin revelar a los etiquetadores de datos la identidad de su cliente, la aplicación o la función de que se trate. Los etiquetadores de datos desconocen la finalidad de las anotaciones que realizan y se comprometen a no hablar de su trabajo. El resultado es una pérdida de significado, y conjuntos de datos de calidad mediocre a pobre... ¡no ideales para el entrenamiento de modelos!

Retos relacionados con las instrucciones dadas a los etiquetadores de datos y su formación

Las instrucciones de las tareas de etiquetado suelen estar mal documentadas y ser ambiguas. Por ejemplo, estas tareas pueden requerir la anotación de ropa llevada por seres humanos, lo que excluye la ropa en una foto de una muñeca o un personaje de dibujos animados. Pero, ¿qué ocurre con las imágenes de ropa reflejadas en un espejo? ¿Se considera ropa una armadura? ¿Y las máscaras de buceo? A medida que los científicos de datos y los desarrolladores repiten sus modelos, las normas que rigen la anotación de datos se hacen cada vez más complejas, obligando a los anotadores a tener en cuenta una variedad creciente de excepciones y casos especiales. Al primer error o descuido, los etiquetadores de datos corren el riesgo de perder su trabajo. Muy a menudo, sus clientes no han hecho el esfuerzo de documentar con precisión los casos especiales o atípicos, las excepciones o los posibles problemas de calidad de los datos en el conjunto inicial. En muchos casos, no hay discusión posible entre el cliente y el etiquetador de datos autónomo, que se encuentra en dificultades y acaba abandonando su trabajo, aunque ello suponga no cobrar por el trabajo ya realizado en la plataforma de crowdsourcing. ¡Es una aberración!

‍Desafíosrelacionados con las condiciones de trabajo, los horarios y la incertidumbre de las microtareas de anotación de datos.

En el mundo del etiquetado de datos, las horas de trabajo suelen ser esporádicas e impredecibles. Los trabajadores no saben cuándo llegará la próxima tarea, cuánto durará, si será interesante o abrumadora, o si estará bien o mal pagada. Esta incertidumbre, combinada con la diferencia entre su salario por hora y los ingresos de sus empleadores, según aparece en la prensa, puede desmoralizar a los trabajadores.

Muchos anotadores lidian con el estrés agrupándose en secreto en WhatsApp para compartir información y pedir consejo sobre cómo encontrar tareas interesantes y evitar trabajos que consideran indeseables. Aprenden trucos como utilizar modelos de inteligencia artificial existentes para que hagan el trabajo por ellos en las tareas más sencillas, conectarse a través de servidores proxy para ocultar su ubicación y crear varias cuentas para protegerse de ser suspendidos si incumplen las normas establecidas por las empresas que les ofrecen trabajo.

La importancia de la profesión de etiquetador de datos y la anotación de datos de calidad

El desarrollo de sistemas de IA de alto rendimiento depende de datos anotados con precisión. Sin embargo, las estrictas limitaciones financieras de la anotación a gran escala animan a las empresas a utilizar las soluciones más baratas del mercado, eligiendo la tarifa horaria más baja, sin tener en cuenta la calidad de los datos producidos, la ética de la IA de la cadena de suministro o el volumen de horas que se impondrá a los anotadores de datos. Sin embargo, todo el mundo se beneficiaría si considerara la anotación de datos menos como un trabajo ocasional y más como una profesión por derecho propio.

El valor de los etiquetadores (o anotadores) de datos cualificados se hace aún más evidente a medida que los profesionales de la IA adoptan prácticas de desarrollo centradas en los datos que permiten construir sistemas eficaces con relativamente pocos ejemplos. Con muchos menos ejemplos, es absolutamente esencial seleccionarlos y anotarlos correctamente.

El etiquetado manual de datos es un proceso caro y laborioso, pero es la mejor forma de crear conjuntos de datos de calidad para entrenar modelos de IA. Con Innovatiana, ofrecemos experiencia, mano de obra cualificada y controles automatizados para gestionar los requisitos de datos a escala. El talento está en todas partes. Las oportunidades no. Queremos contribuir, a nuestro nivel, a corregir esta injusticia creando puestos de trabajo en Madagascar, con salarios justos y condiciones laborales éticas.


Aïcha CAMILLE JO, Directora General de Innovatiana.