Lectures
Typography
  • Smaller Small Medium Big Bigger
  • Default Helvetica Segoe Georgia Times
Jos de Mul, Big data and online identity. Lecture at the conference Soft data pour les politiques publiques de la ville: une approche critique. Lille: Université  Charles de Gaulle (Lille 3), October 16, 2014.


Soft data pour les politiques publiques de la ville: une approche critique. Jeudi 16 octobre 2014, Lille (lieu à confirmer). Journée organisée dans le cadre du PEPS Décision, indicateurs et politiques publiques

 

Argumentaire

Ces dernières années, les nouvelles technologies ont radicalement changé plusieurs secteurs de la société tels que l'économie, la santé, le transport et d’autres. Un des changements les plus révolutionnaires concerne certainement la diffusion des technologies numériques, notamment le réseau Internet (Castells, 2000). Ce qui rend ce changement particulièrement intéressant est le fait qu'il affecte à la fois la société elle-même et la façon de l’étudier et de la gérer (Benkler, 2006).

D'une part, l'invention des médias numériques a transformé les conditions d'accès à la communication par une partie croissante de la population mondiale. En moins de vingt ans, Internet et le World Wide Web ont joué un rôle crucial dans l'extension des limites spatio-temporelles des interactions humaines : à travers la réduction des coûts de communication ; en surmontant les frontières entre les différentes formes de communication (écrit/oral, public/privé...), et en accélérant la circulation des idées et des connaissances. D'autre part (et en même temps), la communication numérique a secoué les conditions de la recherche et de la politique, en multipliant la disponibilité de traces de phénomènes collectifs. L'avantage des médias électroniques est que toutes les interactions qui les traversent laissent des traces numériques qui peuvent être facilement enregistrées, massivement stockées, puis récupérées et analysées. Ainsi, les médias numériques offrent de nouvelles bases de données énormes qui peuvent être utilisées pour améliorer l'analyse des phénomènes sociaux et, par conséquent, le processus de prise de décision qui leur est lié (Rogers, 2013).

Les traces numériques ne sont pas seulement produites de façon automatique par les technologies numériques, mais aujourd'hui, nous avons aussi de grandes quantités de données provenant de nouveaux fournisseurs de données tels que des membres de réseaux sociaux en ligne et des utilisateurs des plates-formes de partage de contenu.

Les soft data, appelées « soft » en opposition aux « hard data » traditionnels produits par les institutions statistiques, peuvent être définies de façon très générale comme des informations librement disponibles sur Internet, non contrôlées par une administration publique. Elles sont constituées principalement par les nouveaux types de données issues du Web 2.0 (Facebook, Twitter, fils RSS..) qui s’offrent au décideur public comme une source originale et riche d’informations sur les phénomènes sociaux qui ont lieu en ville. Ce qui rend ces données particulièrement intéressantes est leur nature géo-médiatique, c’est à dire le fait qu’elles intègrent une information géographique dans la donnée médiatique (voire par exemple le check-in Facebook).

Traditionnellement, la décision publique liée à la gestion de la ville est basée sur la collecte, la transformation, l'analyse et l'interprétation de ce qui peut être qualifié comme données « hard » à savoir les statistiques officielles et plus généralement les données produites par l'administration publique à différents niveaux (local, urbain, régional, national, international). Ces données ont été soigneusement harmonisées et stockées dans des bases de données, soumises à divers contrôles, complétées par l'estimation de valeurs manquantes et de métadonnées. Ces données représentent une valeur ajoutée exceptionnelle pour les personnes intéressées par la politique urbaine et de cohésion territoriale. Néanmoins, ces dernières années les décideurs publics ont révélé certaines lacunes ou des frustrations importantes liées à ces données, tels que le trop long délai de publication, la couverture insuffisante de certains sujet d'intérêt pour la cohésion territoriale et la définition top-down des données d'intérêt face à des demandes des données de plus en plus participatives.

Or, suite à la croissance exponentielle de l’information disponible sur Internet, un grand nombre d'informations concernant le développement territorial des villes est maintenant disponible sur le Web, en introduisant une concurrence claire pour les producteurs classiques de données. Les soft data fournissent alors des solutions intéressantes aux lacunes de hard data mentionnés ci-dessus : un délai plus court de publication utile pour l'action publique, la couverture de nouveaux sujets d'intérêt et l’élaboration bottom-up d'information sur mesure.

Objectifs de la journée

Face à l’abondance de ces nouveaux types de données, cette journée vise à explorer l’importance et le rôle de ces soft data dans le processus de décision publique concernant la gestion de la ville. Si plusieurs études empiriques ont été réalisées, une réflexion théorique sur l’emploi de ces données dans les politiques publiques est encore absente. Plusieurs questions nécessitent d’être abordées. Nous proposons d’aborder principalement deux questions :

1- La question méthodologique. Les big data ont soulevé beaucoup d'enthousiasme, mais travailler avec eux est tout sauf simple. Outre les problèmes techniques qui pourraient être soulevés par la masse de données, le chercheur doit également faire face à des problèmes politiques, sociaux et éthiques. En particulier, il faut prendre en compte les questions de représentativité des données (nous ne pouvons pas contrôler l'équivalence entre les traces disponibles sur Internet et la population que nous aimerions étudier) ; de protection des données (droit à la confidentialité ; droit d’auteur)  et liées à la nature participative de données. En outre, ces données sont souvent générées par des sources inconnues, de sorte qu'elles peuvent être fausses ou vraiment hétérogènes.

Toutes ces limites peuvent remettre en cause la qualité de ces données, mais il est important de souligner qu’elles sont également des opportunités. D'un côté, nous devons garder à l'esprit ces questions et, si possible, chercher des solutions pour y faire face. De l'autre côté, en contrepartie, la facette hétérogène, inattendue et parfois ingérable de ces données garantie leur intérêt et leur richesse. Nous travaillons avec ces données parce que nous nous attendons à ce que ces caractéristiques puissent nous aider à trouver de nouvelles idées dans l'analyse territoriale qui peuvent être intégrées aux résultats de l'analyse officielle.

Il est alors important avoir des méthodes adéquates pour collecter ces données et les préparer pour l'analyse. Au cours des dernières années, un nouveau groupe de méthodes, appelées « méthodes numériques » (Rogers, 2013), a été développé pour traiter ce type de données. Par « méthodes numériques » nous nous référons à une série de techniques visant à explorer les traces d'interactions en ligne comme source d'information sur les phénomènes sociaux. Les potentialités et les problématiques liées à ces méthodes seront objet de discussion dans la première partie de la journée.

2- Le défi théorique des soft data. L'utilisation de ces informations provenant de nouveaux fournisseurs et concernant de nouveaux thèmes doit être fortement encouragées. Cependant, au de là des enthousiasmes initiaux, l’usage de ces méthodes numériques et en général des traces numériques aujourd’hui sollicite plusieurs questions théoriques. Entre autres, un des éléments les plus problématiques dans l’application de ces méthodes est la gestion du rapport entre hors ligne et en ligne. Le succès des traces numériques est notamment du à leur pouvoir de révéler des caractéristiques des phénomènes qui ont lieu dans l’espace physique. En effet, à travers ces traces, le chercheur peut étudier un phénomène qu’autrement n’aurait pu étudier, au moins de mettre en place une démarche d’enquête de terrain beaucoup plus couteuse en terme de ressources et de temps.

Evidemment la question du rapport entre en ligne et hors ligne n’est pas nouvelle et la distinction même a été à plusieurs reprises mise en discussion. Sans tomber dans les excès d’affirmer en manière absolue cette distinction ou de la rejeter à priori, nous voulons s’interroger sur le type de continuité ou discontinuité générée aujourd’hui par les traces numériques. Quand on étudie un phénomène à travers des traces que les acteurs liés à ce phénomène on laissé sur un blog ou un réseau social, sommes-nous en train d’étudier le phénomène hors ligne qui a lieu dans l’espace physique ? Ou sommes-nous en train d’étudier la projection en ligne du phénomène qui a lieu hors ligne ? Ou cette distinction doit-elle être complètement abandonnée ? Les traces numériques liées à un objet peuvent-elles avoir ou pas une “existence” seulement en ligne?

Programme provisoire (les titres des intervetions sont provisoires)

8h45 Ouverture et présentation de la journée

9h00 Une approche géographique aux soft data
Groupe médias et territoire du CIST (Marina Dufeal, Matthieu Noucher ou Pierre Gautreau)

9h40 Une approche géomédiatique aux soft data
Claude Grasland, Université Paris Diderot et Marta Severo, Université de Lille 3

10h30 -10h45 Coffee break

10h45 Soft data et urban studies
Dominique Boullier, Sciences Po Paris

11h30 Digital methods and geolocation
Richard Rogers, Université d’Amsterdam  

12h30 – 13h30 Déjeuner

Soft data et territoire : une approche critique

13h30 titre à définir
Franck Cormerais, Université de Bordeaux 3

14h15 The redistribution of methods
Noorje Marres, Goldsmiths, University of London

15h30 -15h45 Coffee break

15h45 Big data and online identity
Jos De Mul, Université de Rotterdam

16h30 Algorithmic Governmentality
Antoinette Rouvroy, Université de Namur

17h30 Clôture de la journée

Organisé par :

Equipe Geriico, Université de Lille 3

Département de philosophie, Université de Lille 3

Le groupe « médias et territoire » du GIS Collège International des Sciences du Territoire

Contact :

Alberto Romele This email address is being protected from spambots. You need JavaScript enabled to view it.  

Marta Severo This email address is being protected from spambots. You need JavaScript enabled to view it.

News

This website is currently under (re)construction

Books by Jos de Mul

Search this website

Contact information