algoritmo mit prevede trending topics twitter

È possibile predire quali saranno gli argomenti di tendenza (i cosiddetti “trending topics“) su Twitter? Se lo sono chiesto due ricercatori del Massachusetts Institute of Technology di Boston (MIT), Devavrat Shah e Stanislav Nikolov, i quali hanno sviluppato un nuovo algoritmo in grado di farlo. L’algoritmo studiato dai due scienziati sarebbe infatti capace di individuare preventivamente quale parola, hashtag o frase finirà tra i temi più popolari. Le predizioni fatte dai ricercatori del MIT sono state, in media, in anticipo di un’ora e mezza rispetto a Twitter ma in alcuni casi sono arrivate anche fino a quattro ore prima.

Secondo gli esperti la novità potrebbe interessare parecchio a Twitter, che potrebbe iniziare a farsi pagare un sovrapprezzo per gli annunci legati ai trend. La scelta da parte del sito di microblogging dei trending topics, molto ambìti come fonte di pubblicità gratuita, al momento è infatti automatica e avviene grazie a un algoritmo che si basa sul numero di cinguettii su un dato tema e sull’incremento nel tempo degli utenti che fanno riferimento al tema stesso.

Nel corso del loro studio i ricercatori del MIT hanno analizzato 400 argomenti, divisi equamente tra temi di tendenza e non, in un arco di tempo predefinito così da costruire un modello matematico che possa essere applicato a ogni tema e prevederne il “trend” o il “non-trend“. “Il sistema – spiegano i due ricercatori – è in grado di migliorare ulteriormente i suoi risultati con l’aumento della cardinalità del campione utilizzato durante la fase di apprendimento”.

Il nuovo algoritmo in grado di anticipare i trending topics, che sarà presentato il 9 novembre a Boston nel corso dell’Interdisciplinary Workshop on Information and Decision in Social Networks, potrebbe essere applicato anche al di fuori da Twitter. Secondo Shah e Nikolov, infatti, il loro algoritmo predittivo potrebbe essere applicato a una qualsiasi sequenza di misurazioni fatte a intervalli regolari come la vendita dei biglietti per un evento, la durata di una corsa dell’autobus e, perché no, anche l’andamento del mercato azionario. Il modello, però, dovrà essere sicuramente migliorato perché, a quanto pare, la correlazione tra dati storici e dati futuri potrebbe non essere sempre chiara come accade con i tweet.