Los desafíos de moderar el contenido en línea con un aprendizaje profundo.

Los desafíos de moderar el contenido en línea con un aprendizaje profundo. https://img-cdn.tnwcdn.com/image/tnw?filter_last=1&fit=1280%2C640&url=https%3A%2F%2Fcdn0.tnwcdn.com%2Fwp-content%2Fblogs.dir%2F1%2Ffiles%2F2019%2F01%2FUntitled-design-16-3-796x417.png&signature=3dad8589410e17fd6ea76854a2821702

Los desafíos de moderar el contenido en línea con un aprendizaje profundo.




A principios de diciembre, internet estaba lleno de noticias de la declaración de Tumblr de que prohibiría el contenido para adultos en su plataforma a partir del 17 de diciembre. Pero aparte de los aspectos legales, sociales y éticos del debate, lo interesante es cómo planea implementar la plataforma de microblogging. la decisión.


De acuerdo a una post por Tumblr soporteEl contenido de NSFW se marcará utilizando una “combinación de clasificación de aprendizaje automático y moderación humana”. Lo cual es lógico porque, según algunas estimaciones, Tumblr alberga cientos de miles de blogs que publican contenido para adultos y hay millones de publicaciones individuales que contienen lo que es. contenido considerado para adultos. La enormidad de la tarea está simplemente más allá del trabajo humano, especialmente para una plataforma que tiene históricamente luchadopara ser rentable.



Aprendizaje profundo, el subconjunto de inteligencia artificial que se ha vuelto muy popular en los últimos años, es adecuado para la automatización de tareas cognitivas que siguen un patrón repetitivo, como clasificar imágenes o transcribir archivos de audio. El aprendizaje profundo podría ayudar a que la mayor parte de la carga de encontrar contenido NSFW fuera del alcance de los moderadores humanos.


Pero hasta ahora, mientras Tumblr está probando las aguas en el marcado de contenido, los usuarios han tomado Twitter. para mostrar ejemplos de contenido inofensivo que Tumblr ha marcado como NSFW, que incluye medias de troll, jeans LED y patentes de diseño de limpieza de botas.




Obviamente, la gente en Tumblr se da cuenta de que hay Límites distintos a las capacidades de aprendizaje profundo., por lo que están manteniendo a los humanos al tanto. Ahora, la pregunta es, ¿por qué una tecnología que es tan buena como:o incluso mejor que¿Los humanos al reconocer imágenes y objetos necesitan la ayuda para tomar una decisión que cualquier humano podría hacer sin mucho esfuerzo?


Un resumen muy breve sobre el aprendizaje profundo.


En el corazón del aprendizaje profundo están las redes neuronales, una estructura de software diseñada aproximadamente según la estructura física del cerebro humano. Las redes neuronales consisten en capas sobre capas de nodos computacionales conectados (neuronas) que ejecutan datos a través de ecuaciones matemáticas y las clasifican según sus propiedades. Cuando se apilan múltiples capas de neuronas entre sí, los algoritmos de aprendizaje profundo pueden realizar tareas que antes eran imposibles de abordar con cualquier otra cosa que no fuera la mente humana.


Al contrario del software clásico, que requiere que los programadores humanos programen meticulosamente cada regla de comportamiento, los algoritmos de aprendizaje profundo desarrollan su propio comportamiento al estudiar ejemplos. Si proporciona una red neuronal con miles de publicaciones etiquetadas como "contenido para adultos" o "contenido seguro", se ajustarán los pesos de sus neuronas para poder clasificar el contenido futuro en esas dos categorías. El proceso se conoce como "aprendizaje supervisado" y actualmente es la forma más popular de hacer un aprendizaje profundo.


Básicamente, las redes neuronales clasifican los datos según sus similitudes con los ejemplos en los que se han entrenado. Por lo tanto, si una nueva publicación tiene más parecido visual con las muestras de capacitación etiquetadas como "contenido para adultos", lo marcará como NSFW.


Lo que se necesita para moderar el contenido con un aprendizaje profundo


El problema con la moderación de contenido es que es más que un problema de clasificación de imágenes. La definición de Tumblr de contenido para adultos incluye "fotos, videos o GIF que muestran genitales humanos de la vida real o pezones con presentación femenina, y cualquier contenido, incluyendo fotos, videos, GIF e ilustraciones, que represente actos sexuales".


Esto significa que la IA que marcará el contenido para adultos tendrá que resolver dos problemas diferentes. Primero, debe determinar si un contenido contiene imágenes de "vida real" y contiene "genitales humanos o pezones con presentación femenina". En segundo lugar, si no es contenido de la vida real (como pinturas, ilustraciones y esculturas), debe verificar Ver si contiene representaciones de actos sexuales.


Teóricamente, el primer problema se puede resolver con una formación básica de aprendizaje profundo. Proporcione a sus redes neuronales suficientes imágenes de genitales humanos desde diferentes ángulos, bajo diferentes condiciones de iluminación, con diferentes fondos, etc., y su red neuronal podrá marcar nuevas imágenes de desnudos. En este sentido, a Tumblr no le faltan datos de capacitación, y un equipo de capacitadores humanos probablemente podrá capacitar a la red en un tiempo razonable.


Pero la tarea se vuelve problemática cuando se agregan excepciones. Por ejemplo, a los usuarios aún se les puede permitir compartir contenido no sexual, como imágenes de lactancia materna, mastectomía o cirugía de confirmación de género.


En ese caso, la clasificación requerirá algo más que la comparación de píxeles y la búsqueda de similitudes visuales. El algoritmo que hace la moderación deberá comprender el contexto de la imagen. Algunos argumentarán que arrojar más datos resolverá el problema. Por ejemplo, si le proporciona a la AI de moderación numerosas muestras de imágenes de lactancia materna, podrá distinguir la diferencia entre el contenido obsceno y el de lactancia materna.


Lógicamente, la red neuronal decidirá que las imágenes de lactancia materna incluyan a un infante humano. Pero entonces los usuarios podrán jugar el sistema. Por ejemplo, alguien puede editar imágenes y videos de NSFW y agregar la imagen de un bebé en la esquina del marco para engañar a la red neuronal y hacer que piense que es una imagen de lactancia materna. Ese es un truco que nunca funcionaría en un moderador humano. Pero para un algoritmo de aprendizaje profundo que simplemente examina la apariencia de las imágenes, puede suceder muy a menudo.


La moderación de ilustraciones, pinturas y esculturas es aún más difícil. Como regla general, Tumblr permitirá obras de arte que impliquen desnudos, siempre y cuando no representen un acto sexual. ¿Pero cómo podrá distinguir la diferencia entre el arte desnudo y el contenido pornográfico? Una vez más, esa sería una tarea que sería muy fácil para un moderador humano. Pero una red neuronal entrenada en millones de ejemplos seguirá cometiendo errores que un humano obviamente evitaría.


La historia muestra que en algunos casos, incluso los seres humanos no pueden tomar la decisión correcta sobre si un contenido es seguro o no. Un claro ejemplo de moderación de contenido que salió mal es La debacle de Napalm Girl en Facebook, donde las redes sociales eliminaron una foto icónica de la guerra de Vietnam que mostraba a una chica desnuda huyendo de un ataque de napalm.


El CEO de Facebook, Mark Zuckerberg, defendió la decisión por primera vez y declaró: "Si bien reconocemos que esta foto es icónica, es difícil crear una distinción entre permitir una fotografía de un niño desnudo en una instancia y no en otras". Facebook Se vio obligado a restaurar la imagen.


¿Cuál es el alcance de las habilidades del aprendizaje profundo en la moderación del contenido?


Dicho todo esto, los casos que mencionamos al principio de este artículo probablemente se resolverán con más ejemplos de capacitación. Tumblr reconoció que habrá errores, y descubrirá cómo resolverlos. Con una red neuronal bien entrenada, Tumblr podrá crear un sistema eficiente que marque el contenido potencialmente inseguro con una precisión razonable y utilizar un equipo de moderadores humanos de tamaño mediano para filtrar los falsos positivos. Pero los humanos se mantendrán al tanto.


Este hilo por Tarleton Gillespie proporciona una explicación justa de lo que probablemente salió mal y cómo lo solucionará Tumblr.




Para que quede claro, el contenido para adultos es una de las categorías más fáciles de contenido para los algoritmos de inteligencia artificial que se deben moderar. Otras redes sociales como Facebook están haciendo un buen trabajo al moderar el contenido para adultos con una mezcla de inteligencia artificial y humanos. Facebook aún comete errores, como bloquear un anuncio que contiene un Estatua desnuda de 30.000 años., pero esos son lo suficientemente raros para ser considerados casos de borde.


Los campos más desafiantes de la moderación automatizada son aquellos en los que la comprensión del contexto y el significado juegan un papel más importante. Por ejemplo, el aprendizaje profundo podría marcar los videos y las publicaciones que contienen contenido violento o extremista, pero ¿cómo puede determinar si una publicación marcada está publicitando la violencia (contenido prohibido) o documentándola (contenido permitido)? A diferencia de las publicaciones de desnudez, donde a menudo hay elementos visuales distintos que pueden diferenciar entre contenido permitido y prohibido, el documental y las publicidades pueden presentar el mismo contenido al mismo tiempo que sirven objetivos totalmente diferentes.


Profundizar en el problema de la moderación es una noticia falsa, donde ni siquiera hay consenso entre los humanos sobre cómo definirla y moderarla de manera imparcial, y mucho menos automatizar la moderación con los algoritmos AI.


Esos son los tipos de tareas que requerirán más esfuerzo humano. El aprendizaje profundo seguirá desempeñando un papel importante en la búsqueda de contenido potencialmente cuestionable entre los millones de publicaciones que se publican todos los días, y permite a los humanos decidir cuáles deben bloquearse. Este es el tipo de aumento de inteligencia que se supone que se deben cumplir las mezclas actuales de inteligencia artificial, lo que permite que los humanos se desempeñen a escala.


Hasta el día (si alguna vez llega) creamos. inteligencia artificial generalSi la IA puede emular el proceso cognitivo y de razonamiento de la mente humana, tendremos una gran cantidad de entornos en los que la combinación de IA limitada (aprendizaje profundo en la actualidad) e inteligencia humana ayudará a realizar tareas que ninguno puede hacer por sí solo. La moderación del contenido es una de ellas.


Esta historia se reedita desde TechTalks, el blog que explora cómo la tecnología está resolviendo problemas ... y creando otros nuevos. Como ellos en Facebook Aquí y síguelos aquí abajo:







FUENTE ORIGINAL DEL ARTICULO LOS MEJORES SITIOS DE TECNOLOGIA https://www.beviral.online

Comentarios

Entradas populares de este blog

Grupos de privacidad que reclaman anuncios en línea pueden dirigirse a víctimas de abuso

¿Puede Apple Watch prevenir los golpes? Nuevo estudio pretende descubrir

Las empresas ofrecen regalos gratuitos, ofertas especiales de cierre y asistencia a los trabajadores...