POI Pulse: A Multi-granular, Semantic Signature-Based Information Observatory for the Interactive Visualization of Big Geosocial Data

2015 
The volume, velocity, and variety of data that are now becoming available allow us to study urban environments based on human behaviour with a spatial, temporal, and thematic granularity that was not achievable until now. Such data-driven approaches open up additional, complementary perspectives on how urban systems function, especially if they are based on user-generated content (UGC). While the data sources, such as social media, introduce specific biases, they also open up new possibilities for scientists and the broader public. For instance, they provide answers to questions that previously could only be addressed by complex simulations or extensive human-participant surveys. Unfortunately, many of the required data sets are locked in data silos that are accessible only via restricted APIs. Even if these data could be fully accessed, their naϊve processing and visualization would surpass the abilities of modern computer architectures. Finally, the established place schemata used to study urban spaces differ substantially from UGC-based point-of-interest (POI) schemata. In this work, we present a multi-granular, data-driven, and theory-informed approach that addresses the key issues outlined above by introducing a theoretical and technical framework to interactively explore the pulse of a city based on social media. RESUME: Le volume, la rapidite et la variete des donnees maintenant disponibles permettent d’etudier les milieux urbains en fonction du comportement humain a un niveau spatial, temporel et granulaire thematique sans precedent. De telles methodes axees sur les donnees, et surtout celles fondees sur le contenu genere par l’utilisateur (CGU), proposent d’autres perspectives complementaires sur le fonctionnement des systemes urbains. Les sources de donnees (p. ex., medias sociaux) introduisent des biais precis, mais elles offrent de nouvelles possibilites aux scientifiques et au grand public (p. ex., en repondant a des questions qui, auparavant, necessitaient des simulations complexes ou de vastes enquetes aupres de participants humains). Malheureusement, beaucoup d’ensembles de donnees necessaires sont enfermes dans des reserves de donnees accessibles seulement par l’entremise d’interfaces de programmation d’applications (API) restreintes. Meme si l’on pouvait avoir pleinement accesa ces donnees, leur traitement et leur visualisation naϊfs depasseraient les capacites des architectures informatiques modernes. Enfin, le schema des lieux etabli que l’on utilise pour etudier les espaces urbains est considerablement different du schema des points d’interet (PI) fondes sur le CGU. L’article presente une methode multigranulaire fondee sur la theorie et les donnees qui abordent les principales difficultes soulevees precedemment en introduisant un cadre theorique et technique pour explorer de facon interactive le pouls d’une ville en fonction des medias sociaux.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    21
    References
    76
    Citations
    NaN
    KQI
    []