Vos anciens tweets trahissent votre géolocalisation exacte

Tous les tweets géolocalisés datant d’avant avril 2015 comportent dans leurs métadonnées leur localisation GPS précise. En les analysant, des chercheurs ont réussi à déterminer avec justesse l’adresse du domicile et des endroits que fréquentent ceux qui les ont publiés. 
Twitter
Twitter utilisé depuis un café. CC-Zero

C’est une étude d’ampleur que vient de mener une équipe de chercheurs grecs et américains. D’après leur article (PDF) qui sera présenté au prochain Network ans Distributed System Security Symposium, il est possible de géolocaliser très exactement une personne d’après ses anciens tweets. 

Avant avril 2015 et un changement des conditions générales d’utilisation, les tweets permettaient de déterminer la position précise du smartphone depuis lequel ils étaient publiés. Si un utilisateur indiquait simplement New York City, c’est bien uniquement la ville qui apparaissait dans le tweet. Sauf que l’API donnait, quant à elle, accès à la position GPS exacte. Il y a une différence entre dire que l’on se trouve à New York et préciser où l’on se trouve dans New York. 

Tweets du week-end = tweets à domicile

En analysant 15 millions de tweets de 87 000 utilisateurs différents datant d’avant 2015 avec leur outil baptisé LPAuditor (Location Privacy Auditor), les chercheurs ont réussi à déterminer avec précision où certains d'entre eux habitaient. Ils ont tout d’abord placé sur une carte l’ensemble des tweets d’une personne en leur assignant la date et l’horaire de publication. De quoi indiquer les lieux où elle passe beaucoup de temps et à quel moment. 

En n’analysant que les tweets publiés le week-end, les chercheurs ont fait le pari qu’ils étaient rédigés depuis le domicile de la personne. Ils ont ensuite analysé le contenu des tweets pour savoir s’ils avaient été effectivement publiés depuis le logement de l’utilisateur. Ce dernier peut raconter explicitement qu’il est chez lui ou alors commenter une émission de télévision qu’il regarde depuis son canapé. 

Les déplacements déterminés avec précision

En comparant les résultats de l’analyse des métadonnées disponibles dans l’API et le contenu des tweets, les chercheurs ont ainsi réussi à 92,5 % à déterminer où habitait la personne. En menant la recherche inverse (tweets publiés la semaine, hypothétiquement depuis le lieu de travail donc), la précision n’est montée, quant à elle, qu’à 55,6 %. 

Puis les chercheurs sont allés plus loin, en analysant les autres lieux fréquentés associés à la santé, la sexualité, la religion ou les sorties nocturnes. En comparant la géolocalisation GPS d’un tweet et la base de données de Foursquare, la précision est montée jusqu’à 80 %. 

De l'importance du contexte

Là encore, si un utilisateur tweete qu’il est chez le médecin et ce, depuis le cabinet de ce dernier, on peut imaginer qu’être géolocalisé précisément ne le dérange pas. Sauf que les chercheurs ont, par exemple, trouvé un tweet où l’utilisateur expliquait simplement être chez le médecin, mais les coordonnées GPS révélait qu’il s’agissait d’un centre de désintoxication. On peut donc en déduire que le patient avait des problèmes d’addiction. 

Interrogé par Wired, Twitter indique que les coordonnées GPS ne sont donc plus incluses dans les métadonnées des tweets géolocalisés depuis avril 2015. Pour autant, elles n’ont pas été retirées des anciens tweets. « Nous ne pensions pas qu’il serait approprié de revenir en arrière et de prendre unilatéralement la décision de modifier les tweets de personnes sans leur consentement », explique un porte-parole du service. 

Seule solution pour s’affranchir de cette géolocalisation cachée : effacer ses tweets d’avant avril 2015. C’est ce que propose par exemple un site comme TweetDelete