Tus viejos tweets regalan más datos de ubicación de los que crees
Tus viejos tweets regalan más datos de ubicación de los que crees
http://platform.twitter.com/widgets.js .Un grupo internacional De los investigadores ha desarrollado una herramienta algorítmica que utiliza Twitter para predecir automáticamente dónde vives en cuestión de minutos, con más del 90 por ciento de precisión. También puede predecir dónde trabaja, dónde reza y otra información que podría preferir mantener en privado, por ejemplo, si ha frecuentado un determinado club de striptease o ha ido a rehabilitación.
La herramienta, llamada LPAuditor (abreviatura de Location Privacy Auditor), explota lo que los investigadores llaman una "política invasiva" que Twitter implementó después. introdujo la capacidad de etiquetar tweets con una ubicación en 2009. Durante años, los usuarios que eligieron etiquetar geográficamente tweets con cualquier ubicación, incluso algo tan geográficamente amplio como "Ciudad de Nueva York", también dieron automáticamente sus coordenadas GPS precisas. Los usuarios no verían las coordenadas mostradas en Twitter. Tampoco sus seguidores. Pero la información del GPS aún se incluiría en los metadatos del tweet y se podría acceder a través de la API de Twitter.
Twitter no cambió esta política en sus aplicaciones hasta abril de 2015. Ahora, los usuarios deben optar por compartir su ubicación precisa y, según un portavoz de Twitter, un porcentaje muy pequeño de personas lo hacen. Pero la gente de datos GPS compartida antes de la actualización permanece disponible a través de la API hasta el día de hoy.
Los investigadores desarrollaron LPAuditor para analizar esos tweets etiquetados geográficamente e inferir información detallada sobre las ubicaciones más sensibles de las personas. Describen este proceso en una nueva revisión por pares. papel que será presentado en la Simposio de seguridad de redes y sistemas distribuidos próximo mes. Al analizar grupos de coordenadas, así como las marcas de tiempo en los tweets, LPAuditor pudo indagar dónde decenas de miles de personas vivían, trabajaban y pasaban su tiempo privado.
Un miembro del equipo de integridad del sitio de Twitter dijo a WIRED que compartir datos de ubicación en Twitter siempre ha sido voluntario y que la compañía siempre ha brindado a los usuarios una forma de borrar esos datos En su sección de ayuda. "Reconocimos en 2015 que podríamos ser aún más claros con la gente al respecto, pero nuestra perspectiva general sobre la ubicación compartida siempre ha sido que es voluntario y que los usuarios pueden elegir lo que hacen y no quieren compartir", dijo el empleado de Twitter. .
Es cierto que siempre ha sido responsabilidad de los usuarios etiquetar geográficamente sus tweets o no. Pero hay una gran diferencia entre elegir compartir que estás en París y elegir compartir exactamente dónde vives en París. Y sin embargo, durante años, independientemente del kilometraje cuadrado de las ubicaciones que los usuarios decidieron compartir, Twitter eligió compartir sus ubicaciones hasta las coordenadas del GPS. El hecho de que estos detalles se explicaran en la sección de ayuda de Twitter no serviría de mucho a los usuarios que no sabían que necesitaban ayuda en primer lugar.
"Si no está al tanto del problema, nunca va a eliminar esos datos", dice Jason Polakis, coautor del estudio y profesor asistente de ciencias de la computación en la Universidad de Illinois en Chicago, especializado en privacidad y seguridad. Y según el estudio, esos datos pueden revelar mucho.
En noviembre de 2016, mucho después de que Twitter cambiara su configuración, Polakis y los investigadores de la Fundación para la Investigación y la Tecnología en Creta comenzaron a extraer los metadatos de Twitter de la API de la compañía. Se basaron en investigaciones anteriores que demostraron que era posible inferir información privada de los tweets etiquetados geográficamente, pero querían ver si podían hacerlo a escala y con más precisión, utilizando la automatización.
Los investigadores analizaron un grupo de aproximadamente 15 millones de tweets etiquetados geográficamente de aproximadamente 87,000 usuarios. Algunos de los datos de ubicación adjuntos a esos tweets pueden provenir de usuarios que querían compartir sus ubicaciones exactas, como, por ejemplo, un museo o un lugar de música. Pero también había muchos usuarios que compartían nada más que una ciudad o vecindad general, solo para compartir su ubicación GPS de todos modos.
A partir de ahí, LPAuditor se puso a trabajar asignando cada tweet a un lugar físico en un mapa y ubicándolo por zona horaria. Eso generó grupos de tweets alrededor del mapa, algunos más ocupados que otros, lo que indica las ubicaciones donde un determinado usuario pasa mucho tiempo, o al menos, mucho tiempo para tuitear.
"Si no eres consciente del problema, nunca vas a eliminar esos datos".
Jason Polakis, Universidad de Illinois en Chicago
Para predecir qué grupo podría corresponder a la casa de un usuario, los investigadores dirigieron a LPAuditor a buscar lugares donde las personas pasaron el
El lapso de tiempo más largo tuiteando durante el fin de semana. La idea era: durante la semana, puedes twittear por la mañana, por la noche y en tu día libre, en un patrón impredecible, pero en el hogar es donde la mayoría de las personas pasan la mayor parte de su tiempo los fines de semana.Cuando se trataba de encontrar lugares de trabajo, hicieron lo contrario, analizando los patrones de tweets durante la semana. LPAuditor analizó las ubicaciones donde los usuarios más tuitearon (sin incluir el hogar), luego estudió los plazos durante los cuales se enviaron esos tweets. Eso les dio a los investigadores una idea de si los tweets podrían haber sido enviados en el transcurso de un turno típico de ocho horas, incluso si ese turno era de un día para otro. Finalmente, la herramienta buscó el período de tiempo que apareció con mayor frecuencia durante la semana y decidió que la ubicación con más tweets en ese período de tiempo era probablemente el lugar de trabajo de la persona.
Cuando llegó el momento de verificar sus respuestas, los investigadores identificaron un grupo de aproximadamente 2,000 usuarios para servir como una especie de verdad fundamental. La compilación de este grupo fue un proceso manual que requirió que dos estudiantes graduados analizaran de forma independiente todos los tweets de la colección para encontrar frases clave que pudieran confirmar que una persona realmente estaba en casa o en el trabajo cuando la envió. Términos como "Estoy en casa" o "en la oficina", por ejemplo, pueden proporcionar una pista. Inspeccionaron cada tweet para ver el contexto que podría proporcionar información adicional.
Luego compararon las ubicaciones de esos tweets con las predicciones de la herramienta y descubrieron que eran muy precisas, identificando los hogares de las personas correctamente el 92.5 por ciento de las veces. No fue tan bueno predecir dónde trabajaba la gente, acertando eso solo el 55.6 por ciento del tiempo. Pero eso, dice Polakis, podría significar simplemente que la ubicación que identificaron como "trabajo" es en realidad una escuela o un lugar donde la persona pasa lo que de otra manera serían las horas de trabajo.
Finalmente, los investigadores decidieron identificar las ubicaciones sensibles que un usuario podría haber visitado. Para ello, compararon las ubicaciones de los tweets con el directorio de empresas y lugares de Foursquare. Estaban buscando lugares como hospitales, centros de atención de urgencias, lugares de culto y también clubes de striptease y bares gay. Cualquier lugar que apareciera a menos de 27 metros del tweet etiquetado geográficamente se consideraría un lugar potencial. Luego, realizaron un análisis similar de palabras clave, en busca de palabras relacionadas con la salud, la religión, el sexo y la vida nocturna, para verificar si un usuario estaba probablemente donde estaba. Usando este método, los investigadores encontraron que LPAuditor tenía razón sobre las ubicaciones sensibles aproximadamente el 80 por ciento de las veces.
Por supuesto, si un usuario está tuiteando sobre, por ejemplo, estar en el médico mientras está en el médico, se podría argumentar que no están tan preocupados por la privacidad. Pero Polakis dice: "La ubicación podría dar más información de la que el usuario quiere decir". En un caso, los investigadores encontraron a un usuario que estaba twitteando acerca de un médico desde una ubicación que las coordenadas del GPS revelaron como un centro de rehabilitación. "Ese es un contexto mucho más sensible que el que estaban dispuestos a revelar", dice.
Incluso cuando el tweet no incluye pistas de contexto, LPAuditor aún podía predecir si una persona había pasado realmente tiempo en un lugar sensible estudiando la duración del tiempo que las personas pasaban allí y la cantidad de veces que regresaban. Sin embargo, los investigadores no pudieron medir la precisión de estas predicciones específicas.
La mayoría de esta investigación se basó en los tweets que se enviaron antes del cambio de política de Twitter en abril de 2015. Ese cambio, dice Polakis, marcó una gran diferencia en términos de la cantidad de datos de ubicación precisos disponibles a través del API. Para medir cuán enorme, los investigadores excluyeron todos los tweets que recopilaron antes de abril de 2015 y encontraron que solo pudieron identificar de manera positiva las ubicaciones clave para aproximadamente una quinceava parte de los usuarios que estaban estudiando. En otras palabras, Polakis dice: "Ese tipo de comportamiento invasivo de Twitter aumentó la cantidad de personas a las que podríamos atacar en 15 veces".
El hecho de que Twitter cambió sus políticas es algo bueno. El problema es que gran parte de los datos de ubicación anteriores a 2015 todavía están disponibles a través de la API. Cuando se le preguntó por qué Twitter no lo había borrado después de cambiar la política, el empleado de integridad del sitio de Twitter dijo: "No creíamos que fuera apropiado volver atrás y tomar la decisión de cambiar unilateralmente los tweets de las personas sin su consentimiento".
Este no es el primer estudio que revela lo que se puede inferir de datos de localización, o incluso tweets etiquetados geográficamente. Pero, según Henry Kautz, un científico informático de la Universidad de Rochester que ha realizado investigaciones similares, este documento hace contribuciones clave. "El avance aquí es que estudiaron dos tipos de ubicaciones: trabajo y hogar, en lugar de una, e hicieron un estudio más amplio con una evaluación más sistemática y un algoritmo más altamente sintonizado, por lo que obtuvieron la respuesta correcta en un porcentaje más alto de El tiempo ", dice Kautz. LPAuditor tampoco es exclusivo de los datos de Twitter. Podría aplicarse a cualquier conjunto de datos de ubicación.
Kautz sostiene que Twitter es una preocupación relativamente pequeña en comparación con otras aplicaciones que continúan utilizando prácticas invasivas de datos de ubicación en la actualidad. Funcionarios del gobierno en Los Ángeles presentaron recientemente una demanda judicial contra la aplicación Weather Channel, propiedad de IBM, por supuestamente recopilar y vender datos de geolocalización de usuarios bajo el pretexto de ayudar a los usuarios a "personalizar[e] datos meteorológicos locales, alertas y pronósticos ". Y esta semana, placa base reportado que los cazarrecompensas están usando los datos de ubicación comprados en T-Mobile, Sprint y AT&T para rastrear a las personas que usan sus teléfonos. Eso a pesar de las empresas promesas públicas Para dejar de vender tales datos. Luego, por supuesto, hay aplicaciones que se infectan con malware y engullen los datos de ubicación.
"El gran problema de hoy no es la gente infame que mira tus tweets etiquetados geográficamente. El problema son las aplicaciones de teléfonos celulares comprometidas que roban todo tu historial de GPS", dice Kautz. "De esos datos se pueden extraer no solo las ubicaciones de su hogar y trabajo, sino también una gran cantidad de lugares significativos en su vida".
Y aún así, Polakis dice que el hecho de que Twitter ya no agregue las coordenadas de GPS a todos los tweets etiquetados geográficamente no es suficiente, dado que los desarrolladores todavía tienen acceso a los datos de años anteriores a 2015. Sí, parte de esa información podría estar obsoleta. La gente se mueve. Cambian de trabajo. Pero incluso la información obsoleta puede ser útil para un atacante, y es poco probable que cambie otra información sensible, como, por ejemplo, la sexualidad de una persona. Este estudio demuestra que no solo es posible inferir este tipo de información a partir de datos de ubicación, sino que una máquina puede hacerlo casi instantáneamente.
Por ahora, dice Polakis, la mayoría de la gente puede hacer es borrar sus datos de ubicación Hoy, y piénsalo dos veces antes de compartirlo en el futuro.
Más grandes historias WIRED
FUENTE ORIGINAL DEL ARTICULO LOS MEJORES SITIOS DE TECNOLOGIA https://www.beviral.online

Comentarios
Publicar un comentario