Facebook usó sus fotos de Instagram para entrenar su reconocimiento de imágenes: ¿otro problema de privacidad?

1
346

Apenas salido de su  rutina de escándalo de privacidad de datos, Facebook podría tener otro problema en sus manos: Instagram. O más específicamente, cómo recopila fotos para mejorar su inteligencia artificial interna.

Facebook acaba de revelar que usa 3,5 mil millones de fotos compartidas públicamente en Instagram para capacitar a su  software de reconocimiento de imágenes. El método funciona increíblemente bien también: Facebook dice que gracias a este modelo, fue capaz de producir una tasa de precisión del 85,4 por ciento al probar su software en ImageNet, un popular conjunto de datos de referencia.

Eso efectivamente hace que el modelo de AI de Facebook sea el mejor sistema de reconocimiento de imágenes del mundo, según el director de Aprendizaje Automático Aplicado de Facebook, Srinivas Narayanan.

Los resultados se dieron a conocer en el escenario durante la conferencia de desarrolladores F8 de la compañía en California, el mismo evento donde anunció el presupuesto Oculus Go junto con un montón de actualizaciones dirigidas a Messenger, Instagram, WhatsApp y otros.

IA de reconocimiento de imagen de Facebook

La investigación de Facebook hace que su tecnología de reconocimiento de imágenes vaya más allá del reconocimiento de objetos. Puede especificar subconjuntos también. Por ejemplo, una foto de un alimento no es solo comida: es comida india o italiana. Lo mismo ocurre con los pájaros, las personas con vestimenta o uniforme y otros objetos. Este nivel de inteligencia podría mejorar la experiencia en Facebook, dice el líder de investigación en visión por computadora Manohar Paluri.

«Puedes ponerlo en descripciones o subtítulos para personas ciegas, o búsqueda visual, o aplicando políticas de plataforma».

Entonces, ¿cómo lo hace Facebook? Primero, tuvo que desarrollar sistemas para encontrar hashtags relevantes en Instagram, lo que finalmente llevó al equipo a crear lo que ellos llaman un «modelo de predicción de hashtag a gran escala». Facebook esencialmente se basa en hashtags para peinar miles de millones de imágenes, y eso es un desafío porque no todos los hashtags son representativos del contenido real de la foto. Por ejemplo, una persona puede etiquetar su publicación con #GoldenGateBridge incluso si el puente en sí no se ve claramente.

Como resultado, Facebook optó por lo que se denomina aprendizaje supervisado débilmente, que emplea una combinación de conjuntos de datos etiquetados y no etiquetados. Construye modelos predictivos aprendiendo de una gran cantidad de ejemplos de capacitación.

Pero, ¿qué pasa con la privacidad?

Discutamos el elefante en la habitación aquí: privacidad. Ir a través de las publicaciones de Instagram de las personas para entrenar su tecnología de reconocimiento de imágenes suena como otro posible escándalo de datos. Curiosamente, Facebook solo usa datos de fotos públicas. Eso significa que las cuentas privadas están excluidas, pero piense en esto: cuando un usuario publica una foto, ¿saben que su contenido podría usarse para capacitar modelos de aprendizaje profundo?

Esa es una pregunta crucial para la red social, especialmente en un momento de gran crisis debido a que la compañía no manejó los datos correctamente. Un mejor reconocimiento de imágenes es, por supuesto, algo que les dará a los usuarios mejores herramientas para seguir adelante, pero también tienen que preguntar a qué costo.

1 COMENTARIO

Los comentarios están cerrados.