dimanche 8 avril 2012

Trop de données ?

.
David Weinberger, Too Big to Know: Rethinking Knowledge Now That the Facts Aren't the Facts, Experts Are Everywhere, and the Smartest Person in the Room Is the Room, 2012, 11,69 $ (kindle)

Trop d'informations et de données à notre disposition dont on ne sait pas la valeur (knowledge overload). Comment ces données sont-elles organisées (metadata), liées (hyperlinked) pour nous trouver, tomber sous nos yeux ? D'où nous sont-elles données ?
Le problème a-t-il pris une ampleur nouvelle avec la mise à disposition des conversations, des données personnelles (réseaux sociaux), avec la consultabilité, l'accessibilité de toutes sortes de documents (produits par les bureaucraties, les administrations, les laboratoires, les médias) ? Un tel constat ne semble  pas nouveau ; il est même au principe de la réalisation d'encyclopédies : au 2e siècle avant notre ère en Chine (huainanzi淮南子), au XVIIIe siècle (Europe)...
Chaque époque trie et met en avant des documents, définissant les savoirs importants, légitimes et leurs modes de classement. Les technologies d'accès semblent toujours en retard sur le volume des données qu'elles ont rendu accessibles.
L'ouvrage de David Weinberger, en bon généraliste et journaliste vulgarisateur, tente une synthèse des problèmes et solutions apportés par le Web. Il les énonce dans les termes de la koinè du Web mais, au moins, il nous épargne les pseudo données statistiques de rigueur et invite à penser Internet dans nos vies, depuis nos vies. Le livre a les inconvénients de ses qualités : on aimerait évidemment que certains points soient approfondis, mais ce n'est pas l'objectif.

Avec le Web, ce n'est pas seulement la quantité d'information disponibles qui s'accroît mais aussi les relatives commodités d'accès qui s'améliorent (restant inégales toutefois selon les personnes et les institutions) et surtout le nombre de personnes accédant à ces données. La scolarisation (dont l'apprentissage des langues) réduit les inégalités d'accès à l'écrit (or, "nous sommes gouvernés par des écrits", répète Pierre Legendre) ; le Web réduit les inégalités d'accès aux documents, aux informations, aux données. Ce constat étant dressé et illustré, mais non démontré, les objections sur les nuisances du Web étant écartées (le Web rend bête, etc. objections faîtes déjà à L'Encyclopédie), David Weinberger en vient à des questions plus difficiles, parmi celles-ci :
  • La sélection et la vérification des données (curation, rôle du modérateur) se heurte au volume des données à traiter. La presse, qui fut prompte à se lancer dans l'écriture partagée et l'interaction avec les lecteurs, fut aussi prompte à y renoncer (cf. le cas du wikitorial du Los Angeles Times cité par l'auteur, ou, plus récemment, le cas du quotidien 20 minutes bloquant les commentaires sur les assassinats politiques de Toulouse au nom d'une "charte de modération"). Ces situations soulignent que tout élément publié est un filtrat et que le filtre est la définition opérationnelle de ce qui est dicible ("politiquement correct"), à un moment donné, dans un lieu donné. Le Web n'a pas desserré la censure de l'expression publique.
  • La pensée formée par le livre au long format ("book-shaped thought", "long-form book") par opposition à la pensée issue du Web et des formats courts (d'allure doxographique). Peut-on penser sans les livres, sans que leurs caractéristiques techniques forment la pensée (début / fin, paragraphes, etc.) ? Par son ouverture, le Web exerce une tentation (distraction ?) ; tous les liens qu'il adjoint au savoir exposent, trament un savoir sans fin, un livre qui ne se ferme pas, s'écrit en continu, et tendrait vers une sorte de "grand livre du monde" galiléen. Le Web comme facteur d'irrésolution ?
    • Les publications scientifiques : avec ou sans comité de sélection (les pairs). Trop de science ? Les revues Nature et Science refusent 98% des articles qui leur sont soumis (sans compter l'auto-censure des auteurs). Risque de conformisme et de restriction de l'innovation. Tous experts, crowd science  ?
    • Reste l'exploitation de toutes ces données par le marketing : "Big data". La quantité croissante de données fait produire un saut qualitatif à l'analyse. Mais de cela il est peu question dans cet ouvrage.

    1 commentaire:

    1. Le monde actuel se confronte plus que jamais, à des situations paradoxales et la surabondance des informations n'en est qu'un exemple.
      Plusieurs questions se posent:
      Comment trier les données, est-on à même de gérer leurs sources, leur véridicité? En fait d'assurer un enchainement logique...
      Par rapport aux livres, le Web offre l’accès aux informations, d'une manière apparemment démocratique, mais pourtant inégale. Les trois questions que l'auteur pose visent des réalités auxquelles les utilisateurs du Web se confrontent: la censure de l’expression publique, le manque de cheminement de l'information transmise par le Web, éparpillée, et discontinue, ce qui crée une fausse impression des certains savoirs acquis.
      Quand à moi, quelle que soit l’époque à laquelle on se rapport, le rôle de l’éducation dans la préservation et l'exploitation des données est primordial.

      RépondreSupprimer