Είναι ο βασικός ερευνητής του DIMES, ενός project που ευελπιστεί να χαρτογραφήσει τη δομή και τον τοπολογία του internet, και το τελευταίο διάστημα έχει χρησιμοποιήσει εργαλεία data mining για να συλλέξει τεράστιες ποσότητες δεδομένων από δίκτυα file-sharing. Εφαρμόζοντας σε online περιβάλλον καθιερωμένες κοινωνιολογικές θεωρίες που περιγράφουν τη διάχυση της πληροφορίας σε κοινωνικά δίκτυα, μπόρεσε να αναπτύξει έναν αλγόριθμο πρόβλεψης που εντοπίζει μουσικούς με αυξημένες πιθανότητες να εκτοξευτούν από την τοπική σκηνή στην εθνική.
Αρχικά συνέλεξε μισό δισεκατομμύριο αναζητήσεις από την Gnutella, ένα peer-to-peer δίκτυο file-sharing. Μη μουσικές αναζητήσεις, καθώς και αναζητήσεις μουσικών που ήταν ήδη δημοφιλείς φιλτραρίστηκαν και αυτές που έμειναν ταξινομήθηκαν ανά περιοχή (με τη χρήση του IP address). Αν ένας καλλιτέχνης έχει προοπτικές, το κοινό τυπικά θα αρχίσει να τον προσέχει στην περιοχή που αυτός μένει και δίνει συναυλίες. Οι δυνητικοί αστέρες του αύριο θα καταγράφουν χιλιάδες downloads τη μέρα σε τοπικό επίπεδο, ενώ θα παραμένουν σχετικά άγνωστοι σε εθνικό. Μία μεγάλη απόκλιση μεταξύ τοπικής και εθνικής δημοτικότητας είναι σημάδι ενός καλού μέλλοντος.
Η εμφάνιση αυτού του αλγόριθμου αλλάζει σημαντικά τον τρόπο με τον οποίο οι εταιρείες προβλέπουν τα hits. Τα πιο πολλά εργαλεία σήμερα, όπως το Hit Science, συλλέγουν στοιχεία για τον ήχο ενός κομματιού και κατόπιν συγκρίνουν τη μελωδία, το ρυθμό, τα φωνητικά κοκ. με μία βάση που περιλαμβάνει κομμάτια που έχουν γίνει ήδη hits. Η νέα προσέγγιση δεν «ακούει» το κομμάτι, αλλά -πρακτικά- την επικοινωνία των ανθρώπων που το ακούν.
Αλλά αυτός ο αλγόριθμος μπορεί να έχει και άλλες εφαρμογές – όπως π.χ. την πρόβλεψη της εξέλιξης ενός τοπικού πολιτικού. Σε αυτήν την περίπτωση φυσικά τα πράγματα δεν είναι τόσο απλά γιατί απαιτείται καταγραφή και αποκρυπτογράφηση κειμένων – καθώς η διαδικτυακή παρουσία ενός πολιτικού καταγράφεται καλύτερα μέσα από τη δημοτικότητά τους σε discussion forums και chat rooms. Αυτό είναι πολύ πιο απαιτητικό από την απομέτρηση downloads, και δεν λύνεται μόνο με την καταμέτρηση αναφορών και key words, καθώς με κάποιο τρόπο θα πρέπει να ζυγιστούν οι θετικές και οι αρνητικές αναφορές, η έντασή τους και η χροιά τους. Ο δρόμος όμως έχει ανοίξει.