Dans les années 1990, l’ingénieur en informatique et le “quant” de Wall Street étaient les métiers en vogue dans le monde des affaires. Aujourd’hui, ce sont les data scientists les plus prisés. Lorsque Jonathan Goldman a pris son poste en juin 2006 chez LinkedIn, le site de networking professionnel, l’entreprise ressemblait encore à une start-up. La société comptait un peu moins de 8 millions de comptes, et ce nombre augmentait rapidement, les membres existants invitant leurs amis et collègues à les rejoindre. Mais les utilisateurs ne cherchaient pas à établir des liens avec les personnes déjà présentes sur le site au rythme prévu par les dirigeants. Il semblait manquer quelque chose à l’expérience sociale. Comme l’a dit un responsable de LinkedIn, “c’était comme arriver à la réception d’une conférence et réaliser que vous ne connaissez personne. Alors vous restez dans un coin à siroter votre boisson – et vous partez probablement tôt.” Goldman, docteur en physique à Stanford, était intrigué par les liens qu’il voyait se créer et par la richesse des profils des utilisateurs. Tout cela a donné lieu à des données désordonnées et à une analyse difficile, mais à mesure qu’il a commencé à explorer les liens entre les gens, il a commencé à voir des possibilités. Il a commencé à élaborer des théories, à tester ses intuitions et à trouver des modèles qui lui ont permis de prédire dans quels réseaux un profil donné allait atterrir. Il pouvait imaginer que de nouvelles fonctionnalités tirant parti de l’heuristique qu’il développait pourraient apporter de la valeur aux utilisateurs. Mais l’équipe d’ingénieurs de LinkedIn, prise par les défis de la mise à l’échelle du site, ne semblait pas intéressée. Certains collègues ont ouvertement rejeté les idées de Goldman. Pourquoi les utilisateurs auraient-ils besoin que LinkedIn détermine leurs réseaux à leur place ? Le site dispose déjà d’un importateur de carnet d’adresses capable de récupérer toutes les connexions d’un membre. Heureusement, Reid Hoffman, cofondateur et PDG de LinkedIn à l’époque (aujourd’hui président exécutif), avait foi dans le pouvoir de l’analyse en raison de ses expériences chez PayPal, et il avait accordé à Goldman un degré élevé d’autonomie. Il avait notamment donné à Goldman un moyen de contourner le cycle traditionnel de lancement des produits en publiant de petits modules sous forme de publicités sur les pages les plus populaires du site. Grâce à l’un de ces modules, Goldman a commencé à tester ce qui se passerait si l’on présentait aux utilisateurs des noms de personnes avec lesquelles ils n’avaient pas encore établi de liens mais qu’ils semblaient susceptibles de connaître – par exemple, des personnes qui avaient partagé leurs mandats dans des écoles et des lieux de travail. Pour ce faire, il a créé une publicité personnalisée qui affichait les trois meilleures nouvelles correspondances pour chaque utilisateur, en fonction du contexte saisi dans son profil LinkedIn. En quelques jours, il était évident que quelque chose de remarquable était en train de se produire. Le taux de clics sur ces annonces était le plus élevé jamais observé. Goldman a continué à affiner la façon dont les suggestions étaient générées, en incorporant des idées de réseautage telles que la “fermeture du triangle” – la notion selon laquelle si vous connaissez Larry et Sue, il y a de fortes chances que Larry et Sue se connaissent aussi. Goldman et son équipe ont également réduit à un clic l’action nécessaire pour répondre à une suggestion.
Accueil > Blog > Data Science & Machine Learning > Data Scientist : Le métier le plus sexy du 21e siècle