This shows you the differences between two versions of the page.
— |
prim1516gazouille_nosql [2015/10/20 12:12] (current) mplantev created |
||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====== Intégration d'un moteur NoSQL dans une plateforme d' | ||
+ | |||
+ | * // Thèmes : // BD, réseaux sociaux, big data, data science. | ||
+ | * // Encadrant : // Marc Plantevit, Pierre Houdyer | ||
+ | * // Laboratoire : // [[https:// | ||
+ | * // Equipe : // [[http:// | ||
+ | |||
+ | ===== Contexte ===== | ||
+ | Les réseaux sociaux (e.g., Twitter, Instagram, ...) sont des riches sources d' | ||
+ | Les motivations sont multiples : détection de désastre météorologique, | ||
+ | |||
+ | ===== Existant ===== | ||
+ | Dans ce contexte, | ||
+ | |||
+ | ===== Travail demandé ===== | ||
+ | L' | ||
+ | |||
+ | Dans ce contexte, le travail demandé est le suivant : | ||
+ | |||
+ | * Etude de l' | ||
+ | * Choix et intégration du moteur NoSQL, | ||
+ | * Etude quantitative des gains obtenus. | ||
+ | |||
+ | |||
+ | ===== Quelques Chiffres pour Gazouille ===== | ||
+ | * environ 350 tweets/ | ||
+ | * 1 million de tweets par jour, | ||
+ | * Requêtes sur plus de 6 million de tuples, | ||
+ | * Select : 10 secondes, | ||
+ | * Count : 15 secondes, | ||
+ | * Tweet sauvegardé entre 0.002sec et 0.269sec | ||
+ | |||
+ | ===== Bibliographie ===== | ||
+ | * Pierre Houdyer, Albrecht Zimmermann, Mehdi Kaytoue, Marc Plantevit, Joseph Mitchell, Céline Robardet: Gazouille: Detecting and Illustrating Local Events from Geolocalized Social Media Streams. ECML/PKDD 2015: 276-280 | ||
+ | |||
+ | ===== Informations complémentaires ===== | ||
+ | Ce projet est pertinent pour les étudiants désirant s' | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | < | ||
+ | <script type=" | ||
+ | var gaJsHost = ((" | ||
+ | document.write(unescape(" | ||
+ | </ | ||
+ | <script type=" | ||
+ | try { | ||
+ | var pageTracker = _gat._getTracker(" | ||
+ | pageTracker._trackPageview(); | ||
+ | } catch(err) {}</ | ||
+ | |||
+ | </ |