vendredi 23 octobre 2009

Cerveau et ordinateur

Internet contient maintenant des milliards de documents: pages HTML, images, fichiers de texte, sons, vidéos, etc. Les moteurs de recherche permettent d’indexer cette masse. Cependant il est difficile d’ordonner les différents résultats afin que l’utilisateur soit satisfait de la réponse. Google utilise par exemple le critère des liens entrants: plus une page est liée, plus elle apparaîtra haut dans la liste. C’est pourquoi nous avons souvent l’impression de tomber sur le bon site en faisait une recherche dans Google: ce sont les sites les plus populaires qui viennent en premier. Mais qu’en est-il de tous les fichiers qui composent les sites Web. Prenons une personne qui recherche une image de pommier. Il en existe des centaines de milliers. Mais comment offrir les images les plus intéressantes dans la première page de résultats? Flickr gère plus de trois milliards d’images, ce qui rend le tri assez ardu. Son équipe de développement s’est penchée sur la question et elle y a répondu par le concept d’interestingness. On relève les traces d’activités autour de l’image: clic, choix comme favori, commentaires, etc. Grâce à cela, on arrive à mettre en évidence des images intéressantes. Le résultat est rarement décevant:

http://www.flickr.com/explore/interesting/

http://www.flickr.com/explore/interesting/2009/10/

Pour obtenir ce résultat, on n’a pas seulement eu recours à l’ordinateur. On a aussi utilisé l’activité humaine. En effet, un ordinateur, si puissant soit-il, ne peut déterminer ce qui est beau ou intéressant.

Luis von Ahn, chercheur à la Carnegie Mellon University, se penche sur cette question depuis des années. Il est persuadé par l’idée que les ordinateurs sont limités et qu’ils ne pourront jamais effectuer certaines tâches qui sont simples pour le cerveau humain. C’est lui qui a lancé le fameux ESP game, qui permettait d’attribuer des mots-clés à des images. Deux partenaires, mis ensemble par hasard, doivent attribuer des mots-clés (ou tags) à des images. Si les mots-clés des deux joueurs correspondent, des points sont attribués à chacun. Les joueurs cumulent les points de toutes les parties qu’ils jouent: à celui qui en obtient le plus. Attention, le jeu est plus addictif qu’il en a l’air. Google a repris ce jeu et l’a intégré à Google Images sous la forme du Google Image Labeler:

http://images.google.com/imagelabeler/

Luis von Ahn a continué de développer ses idées à travers d’autres jeux. On les trouve tous maintenant sur un site intitulé GWAP: games with a purpose.

Gwap

http://www.gwap.com/

Il s’agit de véritables jeux où les participants accumulent des scores: les points glanés dans les différents jeux s’additionnent. Le but de ces jeux est d’ajouter aux documents soumis différentes métadonnées. On retrouve donc l’ESP Game. Avec Tag a Tune, les deux joueurs écoutent un morceau de musique qu’ils doivent caractériser. En lisant les mots-clés de l’autre, chaque joueur doit essayer de deviner si tous deux écoutent le même morceau. Le but est donc d’attribuer des tags à des morceaux de musique. Verbosity offre tour à tour à chacun des joueur un terme: l’un doit le caractériser, tandis que l’autre le devine. Visiblement, il s’agit d’établir des associations de termes. Avec Squigl, chacun des partenaire doit entourer ce qui correspond à un terme donné sur une image: le jeu indique “ours” et le joueur doit entourer l’endroit où il voit un ours sur l’image. Enfin Matchin (le plus addictif selon moi) présente à deux partenaires deux images: chacun doit indiquer celle qui lui plaît le plus. Si les deux joueurs choisissent la même image, ils reçoivent des points. S’ils optent pour la même photo plusieurs fois de suite, le nombre de point obtenus par tour augmentent. Le but de ce jeu est de mettre en avant les images de bonne qualité et d’écarter celles qui sont moins belles (comme les photos prises en fin de soirée et postées sur Facebook). On retrouve l’interestingness de Flickr.

Gwap

Non seulement ces jeux sont utiles, car ils permettent d’indexer des masses énormes de documents, mais ils sont aussi basés sur la collaboration plutôt que sur l’opposition. A l’heure des jeux de type “Kill them all”, cela vaut la peine d’être mentionné.

Le site GWAP prétend aussi qu’il peut deviner votre genre avec 10 paires d’images où il faut dire celle que l’on aime le mieux. Mais ça ne marche pas à tous les coups.

Luis von Ahn est aussi le créateur du Captcha, ce système anti-spam bien connu, évitant aux robots de placer des commentaires sur les blogs ou d’envoyer des messages par formulaire Web. Il l’a conçu dans le même esprit d’utilité et de contribution du cerveau humain à des projets informatiques. Le Captcha soumet deux images représentant des termes écrits que l’utilisateur doit retranscrire. Ces deux termes proviennent de la numérisation de livres ou de journaux. L’un des deux termes a été reconnu correctement par le programme de reconnaissance de caractères (OCR), alors que l’autre a été mal lu (le logiciel d’OCR étant capable de reconnaître ses erreurs). L’utilisateur ignore lequel des deux mots est correcte. S’il transcrit correctement le terme qui a été lu de manière juste par l’ordinateur, le système part de l’idée que le second est aussi juste. Les couples de terme sont soumis plusieurs fois et si on obtient toujours le même résultat, la lecture “humaine” est validée. Ce système est utilisé pour améliorer la numérisation d’ouvrages qui sont intégrés aux Internet Archives. Le nombre de transactions quotidiennes passant par le Captcha étant de 200 millions, l’amélioration de la numérisation est donc réelle.

Captcha

http://recaptcha.net/

Internet Archives

Page de Luis von Ahn sur le site de la Carnegie Mellon University

A travers ces exemples remarquables, comme dans les réseaux sociaux, on sent l’imbrication de plus en plus grande entre cerveau électronique et cerveau biologique. Chacun de ces cerveaux a ses propres limites: les puces ont des puissances de calcul qui dépassent largement tout ce que nos neurones peuvent faire, mais elles ne peuvent exécuter que les tâches qui ont été programmées. Le cerveau humain a des compétences que jamais un ordinateur n’aura: imagination, conscience. En revanche, il peut utiliser les machines pour augmenter certaines fonctions: on songe en premier lieu à la mémoire.

Cette proximité toujours plus grande entre l’homme et la machine doit nous faire un peu réfléchir. Il devrait toujours revenir à l’homme de déterminer le partage des tâches. Et cela passe par une connaissance du fonctionnement d’un ordinateur auquel on a tendance à accorder trop d’intelligence et donc le développement, à large échelle, d’une culture informatique à ne pas confondre avec des compétences dans l’utilisation de l’informatique.

samedi 3 octobre 2009

Un monde d’ombres

Nielsen, un des spécialistes des statistiques d’utilisation du Web, nous apprend que le temps passé sur les sites communautaires (réseaux sociaux et blogs) correspond désormais à 17% du temps passé sur Internet. Il y une année, le temps passé sur ce type de sites était de 6%. Cette proportion a donc triplé en un an. Nielsen interprète cette augmentation comme un changement profond de l’usage d’Internet: les utilisateurs souhaitent de plus en plus être connectés, communiquer et partager.

http://en-us.nielsen.com/main/news/news_releases/2009/september/nielsen_reports_17

Une autre étude, faite par le Pew Internet and American Life Project, montre aussi un comportement intéressant des internautes. Elle s’intéresse à une population identifiée comme des utilisateurs d’Internet à la recherche d’informations économiques sur la crise et qui correspond à 69% des adultes américains et à 88% de tous les utilisateurs d’Internet de ce pays. Une enquête parmi cette population a permis d’établir que 74% d’entre eux vont en ligne pour se détendre et oublier la crise. Que font-ils? Ils regardent des vidéos, écoutent de la musique, jouent, tchattent avec des amis ou bien créent des contenus. Si on observe les différentes classes d’âge, les 18-29 ans sont 88% à aller se détendre en ligne. Les chercheurs ont aussi observé qu’il n’y a aucune corrélation entre ces pratiques et la situation économique de ces utilisateurs, qu’ils aient été affectés ou non par la crise.

http://www.pewinternet.org/Reports/2009/16–The-Internet-as-a-Diversion.aspx

Internet est né dans les milieux académiques et, dans les premiers temps, il était essentiellement lié à la connaissance. Cette fonctionnalité n’a d’ailleurs pas disparu: il suffit de consulter Wikipédia pour s’en convaincre. Est venue ensuite l’idée du centre commercial total. Après bien des péripéties, Internet s’est installé confortablement dans des marchés de niche. Aujourd’hui il joue un rôle de plus en plus important dans la socialisation et il est bien possible que cette crise financière et économique soit un catalyseur.

Depuis longtemps et peut-être même avant Internet, les lieux de socialisation ont périclité. Il devient de plus en plus difficile de rencontrer quelqu’un dans un restaurant ou dans un train. Aujourd’hui, c’est avec Facebook qu’on trouve ses amis ou qu’on maintient son réseau social. Mais on peut aussi faire toutes sortes d’activités en ligne: écouter de la musique, voire de véritables concerts (dans Second Life), visiter des musées et des sites (comme la Cité interdite de Pékin), danser (toujours dans Second Life et dans d’autres univers virtuels). Quand on tient de tels propos, la remarque qui revient souvent est: “comment se contenter de cela?”. Une soirée à visionner des vidéos amateurs sur You Tube constitue-t-elle une alternative à une séance de cinéma ou même de home cinema? Un concert dans Second Life vaut-il une performance en salle? Une image numérique remplace-t-elle une peinture?

Bal dans Second Life

Il semble que cela soit de plus en plus le cas. C’est en tout cas ce que prétend un article du magazine Wired, sous le titre “The Good Enough Revolution: When Cheap and Simple are just fine”. D’après ce texte, il existe bien des exemples où une variante de qualité moindre (mais suffisante) est préférée parce que bon marché et simple à utiliser. Pendant longtemps, la qualité a été une valeur et on ne rechignait pas à la dépense pour l’obtenir. Maintenant, c’est l’usage qui prime. L’exemple le plus évident est celui du format mp3 pour la musique. Il ne présente pas la perfection souhaitée pour certains mélomanes, mais le commun des mortels s’en contente, s’il l’on en croit le succès qu’il a rencontré. On peut aussi mentionner les netbooks, des petits ordinateurs qui permettent essentiellement de se connecter sur Internet et de faire un peu de courrier. On peut aussi songer à Skype qui permet d’appeler d’autres personnes gratuitement ou à très bas prix. La qualité du son parfois médiocre est largement compensée par d’autres avantages.

http://www.wired.com/gadgets/miscellaneous/magazine/17-09/ff_goodenough

D’une part, le temps passé en ligne est de plus en plus consacré à des activités de socialisation. D’autre part, tous les transferts d’activités vers des alternatives digitales s’imposent de plus en plus dans les usages, visiblement sans nostalgie pour des solutions de qualité supérieure, mais plus compliquées, moins accessibles et plus onéreuses. L’hypermonde est-il en train de prendre le pas sur le monde réel? Si c’est le cas, quelles en seront les conséquences? Pour l’instant, on a le sentiment d’être dans des cycles de virtualisation qui s’enchaînent. Mais qu’en est-il de l’actualisation. Comment cette vie sociale virtuelle peut-elle s’ancrer dans la réalité tangible? Nos doubles numériques peuvent-ils se substituer à nos personnes réelles?

Après une période exploratoire, il y aura forcément décantation. Si Internet peut jouer un rôle indéniable dans la socialisation, cela ne signifie pas forcément que ces liens sociaux ne doivent être entretenus et vécus qu’en ligne. Les masques numériques doivent à un moment ou à un autre tomber et laisser la place à un vrai visage. Finalement nos doubles numériques font partie de nous-mêmes, comme notre propre ombre. Mais qui a envie de vivre dans un monde d’ombres?

Ombres