Archives de l’auteur : François Guillem

Changement d’url

Bonjour, Ce blog a changé d’adresse : vous pouvez maintenant le retrouver ici : http://francoisguillem.fr

Publié dans Non classé | Laisser un commentaire

Analyse de données et reconnaissance de formes

Beaucoup des gens avec qui je discute ont l’air de penser que le métier d’analyste de données consiste à inventer des “algorithmes” et à les utiliser.En réalité, le gros du travail de l’analyste de données ne consiste pas à développer ou appliquer des algorithmes, mais à décrire les objets qu’il étudie sous la forme de nombres.

Cet article essaie de montrer que cette étape de description est essentielle et qu’une fois réalisée, on peut faire toutes sortes de choses incroyables. Continuer la lecture

Publié dans Analyse | Laisser un commentaire

Un mot sur les infographies

L’internet est un outil de communication incroyable, mais on ne peut pas nier qu’il y circule tout un tas d’horreurs et d’immondices. Parmi elles, celles qui me répugnent le plus sont de loin les infographies !

L’objectif de cet article est d’expliquer pourquoi je suis ulcéré chaque fois que je vois une infographie et pourquoi vous devriez l’être tout autant que moi ! Continuer la lecture

Publié dans Visualisation | Un commentaire

Argent, politique et… critiques cinéma !

A l’aide de données récupérées sur le site allocine.fr, on essaie de construire une typologie des critiques cinématographiques et de voir ce qui détermine les notes qu’elles attribuent aux différents films. Au delà de la diversité des opinions et des goûts individuels, n’existe-t-il pas un critère objectif de qualité des films ? Continuer la lecture

Publié dans Analyse | 4 commentaires

Cartes de visites

Je viens de recevoir mes nouvelles cartes de visite. Merci à Amélia qui s’est occupée de tout. Au risque de me répéter, si vous avez des données et que vous ne savez pas comment les exploiter, n’hésitez pas à me … Continuer la lecture

Publié dans Non classé | Un commentaire

De l’usage des processus aléatoires dans les administrations

Savez-vous quelle est la probabilité d’avoir des problèmes avec l’URSSAF lorsqu’on décide de créer son entreprise ? Eh bien figurez-vous qu’elle est de 100 % !!

Bon, j’exagère très certainement. Mon estimation ne repose que sur 4 observations (dont mon expérience malheureuse des derniers jours) et n’est donc pas très précise ; il existe vraisemblablement des gens qui n’ont jamais rencontré de difficulté avec cette administration, mais j’attends de les voir ! Continuer la lecture

Publié dans Probabilités | 3 commentaires

Le juste prix d’un ipad

Avec la sortie des ipads 2, les ipads première génération ont subi une brusque obsolescence. Mais quelle est l’ampleur de cette obsolescence et combien vaut un ipad 1 aujourd’hui ? Pour répondre à cette question, on utilise quelques données glanées sur internet et un peu de modélisation économétrique. Au programme de cet article : d’incroyables biais de sélection, de régressions linéaires époustouflantes et, clou du spectacle, de fabuleux moindres carrés non linéaires ! Continuer la lecture

Publié dans Analyse | 3 commentaires

Extraire des données d’une page web – 3 – Données sur plusieurs pages

Internet est une source inépuisable d’information et de données. Malheureusement, la plupart du temps, les données ne sont pas contenues dans un fichier que vous pouvez utiliser directement pour faire de l’analyse statistique, mais elles sont directement incrustées dans une page web. Ce petit tutoriel a pour ambition d’expliquer comment extraire de telles données à l’aide du logiciel R et de montrer quelques opérations courantes de traitement des données pour les rendre exploitables. Dans cette partie nous montrons comment récupérer des données dispersées sur plusieurs pages. Continuer la lecture

Publié dans R | 3 commentaires

Extraire des données d’une page web avec R – 2 – Données structurées

Internet est une source inépuisable d’information et de données. Malheureusement, la plupart du temps, les données ne sont pas contenues dans un fichier que vous pouvez utiliser directement pour faire de l’analyse statistique, mais elles sont directement incrustées dans une page web. Ce petit tutoriel a pour ambition d’expliquer comment extraire de telles données à l’aide du logiciel R et de montrer quelques opérations courantes de traitement des données pour les rendre exploitables. Dans cette partie nous montrons comment extraire des données structurées. Continuer la lecture

Publié dans R | 4 commentaires

Extraire des données d’une page web avec R – 1 – Les Tableaux

Internet est une source inépuisable d’information et de données. Malheureusement, la plupart du temps, les données ne sont pas contenues dans un fichier que vous pouvez utiliser directement pour faire de l’analyse statistique, mais elles sont directement incrustées dans une page web.

Ce petit tutoriel a pour ambition d’expliquer comment extraire de telles données à l’aide du logiciel R et de montrer quelques opérations courantes de traitement des données pour les rendre exploitables.

Dans cette partie nous montrons comment récupérer des données présentées sous forme de tableau. Continuer la lecture

Publié dans R | 27 commentaires