Archives mensuelles : mai 2011

Le juste prix d’un ipad

Avec la sortie des ipads 2, les ipads première génération ont subi une brusque obsolescence. Mais quelle est l’ampleur de cette obsolescence et combien vaut un ipad 1 aujourd’hui ? Pour répondre à cette question, on utilise quelques données glanées sur internet et un peu de modélisation économétrique. Au programme de cet article : d’incroyables biais de sélection, de régressions linéaires époustouflantes et, clou du spectacle, de fabuleux moindres carrés non linéaires ! Continuer la lecture

Publié dans Analyse | 3 commentaires

Extraire des données d’une page web – 3 – Données sur plusieurs pages

Internet est une source inépuisable d’information et de données. Malheureusement, la plupart du temps, les données ne sont pas contenues dans un fichier que vous pouvez utiliser directement pour faire de l’analyse statistique, mais elles sont directement incrustées dans une page web. Ce petit tutoriel a pour ambition d’expliquer comment extraire de telles données à l’aide du logiciel R et de montrer quelques opérations courantes de traitement des données pour les rendre exploitables. Dans cette partie nous montrons comment récupérer des données dispersées sur plusieurs pages. Continuer la lecture

Publié dans R | 3 commentaires

Extraire des données d’une page web avec R – 2 – Données structurées

Internet est une source inépuisable d’information et de données. Malheureusement, la plupart du temps, les données ne sont pas contenues dans un fichier que vous pouvez utiliser directement pour faire de l’analyse statistique, mais elles sont directement incrustées dans une page web. Ce petit tutoriel a pour ambition d’expliquer comment extraire de telles données à l’aide du logiciel R et de montrer quelques opérations courantes de traitement des données pour les rendre exploitables. Dans cette partie nous montrons comment extraire des données structurées. Continuer la lecture

Publié dans R | 4 commentaires