Petits débuts en python

Hello et bonanée !

Petite entrée en matière en Python, et pour la peine je me suis amusé à faire un petit script à la fois simple et…. inquiétant ?

Tout le monde connait Twitter, ce réseau social ou quasiment tout est public (sauf les messages privés). Twitter permet également de géolocaliser ses tweets.

Personne ne connait le site http://onemilliontweetmap.com/ qui regroupe sur une carte, « tous » les tweets géolocalisés de tout le monde, quasiment en temps réel.

J’ai décidé de faire un truc du genre de one million tweet map, mais focalisé sur une seule personne.

Twitter dispose d’une API assez complète, même si elle possède certaines limites pour éviter les abus, plus d’info sur leurs site de dev

Pour un premier script (après l’incontournable « hello world! »), je dois avouer que je suis pas mécontent du résultat…
Le fonctionnement est simple : on appelle le script :

 $ python tweet2gearth.py -s -c 400 un_utilisateur_twitter

Le script récupère les 400 derniers tweets (ainsi que l’image de profil, au passage) de l’utilisateur, ne garde que ceux possédant une géolocalisation, et exporte ces informations dans un fichier .kml, qu’on peut ouvrir dans Google earth par la suite. radical.

Voilà le résultat, avec un utilisateur, très loquace, pris au hasard dans one million tweet map :

Carte tweets

 

Une fois dans Google earth, on peut classer les repères par ordre croissant… ce qui permet d’avoir une idée plus ou moins claire du trajet qu’a fait la personne sur le laps de temps couvert par les repères.

Pire… En regardant d’un peu plus près les tweet, l’heure et le taux de tweets par endroits, on peut assez facilement déterminer le domicile, le lieu de travail ou les lieux de « loisirs » habituels de l’utilisateur. En analysant plusieurs jeux de données sur plusieurs jours différents, on peut même faire ressortir les habitudes (trajets, horaires de travail, etc…)

Et tout ça, avec des données librement accessibles, gentiment données par des utilisateurs sans doute un peu inconscients.

Vous pouvez trouver ce script (pas très propre, mais après tout, j’apprends…) sur mon github

Publié dans Code Tagués avec : ,