dimanche 25 mai 2008

Je sème à tout vent

La fameuse devise du dictionnaire Larousse invite à la diffusion du savoir. Il faut admettre qu'Internet joue un rôle de plus en plus prépondérant dans la recherche d'informations et de connaissance. C'est en tout cas ce que laisse penser le fait que le moteur de recherche Google et l'encyclopédie collaborative Wikipédia soient parmi les sites les plus consultés.

http://www.comscore.com/press/data.asp

L'encyclopédie Wikipédia constitue de fait un véritable défi pour les encyclopédies traditionnelles. Ces dernières ont des contenus produits par des spécialistes et passant par divers contrôles de qualité. Elles ont fait une première mutation sur CD-Rom, il y a quelques années déjà. Le CD-Rom ne posait pas de problème de monétarisation. En revanche, la mise en ligne est plus complexe. Les principales encyclopédies proposent un abonnement:

http://www.oxfordreference.com/

http://info.britannica.co.uk/

http://www.universalis.fr/

Mais Wikipédia offre ses contenus gratuitement et, de surcroît, elle permet aux internautes de participer aux contenus. C'est certainement ce qui a incité Larousse à proposer le contenu d'une encyclopédie gratuiteme en ligne et à inviter tout un chacun à contribuer à son enrichissement. Le site Internet de l'encyclopédie comporte (ou comportera prochainement) même des fonctionnalités visant à instaurer une certaine collaboration entre les contributeurs. Les articles des internautes font aussi l'objet de votes.

Larousse

http://www.larousse.fr/

Si l'on compare Wikipédia et Larousse, on a deux modèles différents de collaboration.

- collaboration totale et partielle: Larousse offre potentiellement deux séries d'articles, ceux qui ont été composés par des experts et ceux des internautes. Wikipédia ne fait pas une telle distinction et mise sur l'intelligence collective pour l'amélioration de ses contenus.

- dans le cas de Larousse, chacun conserve la maîtrise de ses contenus, aussi bien les experts que les contributeurs libres. Une fonctionnalité permettant de proposer des modifications est cependant prévue pour les articles des contributeurs.

Il sera intéressant de voir si un mode de collaboration qui reconnaît encore un auteur à une contribution dans l'encyclopédie, même si cet auteur finit par bénéficier des informations d'autres internautes, suscite un intérêt. On quitte un peu le monde de la collaboration pour entrer dans celle de la participation. On peut d'ailleurs se demander qu'est-ce qui motivera les lecteurs à signaler des erreurs ou des améliorations dans un article de Larousse, alors que Wikipédia les autorise à intégrer les corrections eux-mêmes. C'est finalement le choix du contributeur qui sera déterminante: souhaite-t-il voir son texte être modifié (jusqu'à devenir méconnaissable) ou préfère-t-il composer un texte qu'il juge lui-même digne de publication et que seul le vote des internaute viendra sanctionner?

dimanche 18 mai 2008

Les amateurs

Un des livres qui a nourri le débat à propos du Web 2.0 porte un titre qui ne laisse aucun doute sur le parti-pris de son auteur: “Le Culte de l’amateur. Comment Internet détruit notre culture?”. Andrew Keen livre une critique impitoyable sur l’Internet d’aujourd’hui, se désolant de ce qu’on laisse le champ libre à des amateurs, alors que les positions de certains professionnels comme les journalistes, les libraires, les éditeurs de musique, sont de plus en plus fragilisées. Il regrette que les personnes de talent soient concurrencées par des amateurs, sans toutefois définir ce qu’il entend par talent. Même pour le terme amateur, l’auteur se contente d’une définition dictionnaire, sans chercher à savoir qui sont ceux qu’il nomme amateurs et pourquoi ils contribuent aux contenus d’Internet. Seuls les professionnels sont, à ses yeux, capables d’un travail sérieux. L’auteur défend un point de vue corporatiste et, de surcroît, il confond l’ensemble du Web participatif avec Wikipédia, le site dans sa ligne de mire. Il omet de mentionner le mouvement open source qui est le modèle de base pour la collaboration en ligne. Il ne fait pas la différence entre la collaboration où chaque participant est sur pied d’égalité (Wikipédia) et le crowdsourcing, c’est-à-dire le fait que l’on confie une tâche précise à une foule de personnes. Nous avons donné dans ce blog plusieurs exemples de projets de nature scientifique où des tâches sont confiés à une multitude de passionnés:

On pourrait encore mentionner ce site de crowdsourcing visant à traduire une encyclopédie rédigée en grec et datant de l’époque byzantine:

En fait, la limite entre amateurs et professionnels se fait de plus en plus ténue sur Internet. On compte parmi les blogueurs de nombreux professionnels qui parlent des sujets dont ils sont spécialistes, partageant leurs réflexions avec leurs pairs. Ils ont la compétence des professionnels, mais ils ne sont pas rétribués directement pour leur blog, qui fait plutôt partie de leur “self-marketing”.

Pour revenir au terme “amateur”, n’oublions pas qu’il vient du latin amare (aimer) et qu’il désigne quelqu’un qui a un goût vif pour quelque chose, quelqu’un qui cultive les beaux-arts sans en faire sa profession (musique, peinture) et, en mauvaise part, un homme d’un talent médiocre. Andrew Keen retient la dernière définition, alors que dans le domaine du Web collaboratif, c’est la seconde qui s’impose. De nombreuses personnes entretiennent et développent des compétences dans un domaine sans que cela devienne une profession, soit parce qu’ils ont découvert ce domaine a après leur formation, soit parce qu’ils l’ont étudié mais n’ont pas pu l’exercer professionnellement. De surcroît, il existe de nombreux domaines où mondes professionnels et amateurs coexistent sans que cela pose problème, comme le sport. Enfin, il faut peut-être retourner un peu dans le passé pour réaliser que la professionnalisation de la science est relativement récente. De nombreux domaines scientifiques doivent une partie de leur développement à des amateurs, au bon sens du terme.

Andrew Keen consacre de nombreuses pages de son livre à pleurer sur la mort ou la longue dégénérescence des industries du livre et de la presse, de la musique et du cinéma. Il attaque au passage le concept de longue traîne de Chris Anderson, sans toutefois livrer son argumentation (traiter une théorie d’utopique ne suffit pas). On commence toutefois à sortir de ce qu’on peut considérer comme le Web 2.0 stricto sensu. Il s’agit plutôt d’une révolution dans le mode de distribution de certains produits. Si le Web 2.0 y est pour quelque chose, c’est uniquement dans le phénomène des recommandations: les internautes ont la possibilité de créer des notices où ils donnent leur avis sur tel ou tel produit. Autrefois, les critiques faisaient les succès. Aujourd’hui ce sont les commentaires des internautes et les blogs. La longue traîne, plus qu’un modèle à suivre, est une constatation faite sur l’observation des ventes de livres dans Amazon. La distribution d’ouvrages ou de CD via Internet s’avère plus efficace, car elle met un produit à disposition de son public potentiel grâce aux mots-clés. Sur le fond et notamment sur la question de la propriété intellectuelle mise à mal par le Web actuel, de nombreux auteurs ont déjà mis en évidence le fait qu’elle devait être revue.

Andrew Keen se défend de vouloir jeter le bébé avec l’eau du bain, ayant lui-même travaillé dans la Silicon Valley. Pourtant c’est bien ce qu’il fait. Son propos devrait se restreindre à ce qu’on appelle Web 2.0 ou Web participatif: la blogosphère, Wikipédias, etc. Mais il critique bien d’autres facettes d’Internet qui n’ont rien à voir avec la participation, comme les jeux d’argent en ligne ou les problèmes de sécurité. En ce qui concerne la critique de ce qui constitue exclusivement le Web 2.0, à savoir la participation et la collaboration, son argumentation est bien faible. Surtout, il ne met pas en balance les avantages (coût, mobilisation) avec les inconvénients (qualité, crédibilité). Le Web participatif et collaboratif doit encore mûrir. Mais quand on voit l’évolution de Wikipédia, qui a peu à peu mis en place diverses systèmes pour améliorer sa qualité, on est en droit de croire que c’est possible.

Ce que ce livre ne dit pas (ou trop peu), c’est la profondeur des changements qui sont en train de se produire. Les utilisateurs d’Internet ne veulent plus être passifs comme l’étaient les lecteurs des journaux papier. Ils veulent participer aux contenus. Mais il existe plusieurs degrés de participation, du commentaire à la co-création. Chacun finira par trouver sa place, qu’il soit amateur ou professionnel.

samedi 10 mai 2008

Nuage de mots-clés

Le nuage de mots-clés (ou tags cloud) s’est imposé comme mode de visualisation des contenus d’un site Web, soit à partir des mots utilisés dans le site, soit à partir des mots-clés déterminés par les auteurs du site ou encore à partir des termes utilisés dans le moteur de recherche. Il met en évidence les termes les plus courants grâce à un agrandissement proportionnel à leur incidence. Ce mode de visualisation a été popularisé notamment par des sites comme Flickr. Le nuage de mots-clés permet de prendre connaissance du contenu d’un site en un clin d’oeil, de voir les thèmes principaux abordés et aussi d’accéder aux pages où se trouvent les mots en question.

De nombreuses applications de publication sur Internet, comme les blogs, offrent cette fonctionnalité. Certains sites offrent également la possibilité de générer des nuages de mots et de les intégrer. Le nuage ci-dessus a été créé à partir du site http://web.mozbot.info/. Il s’agit cependant d’une copie d’écran, car WordPress ne reprend pas le code correctement. Ce site offre la possibilité de paramétriser le nuage de mots-clés, en choisissant les termes que l’on souhaite montrer dans une liste exhaustive, les couleurs, le nombre d’occurence minimale. Il est aussi de générer des expressions (comme “musée virtuel”) Ce qui manque en revanche, c’est d’associer les termes correspondant à une même entrée dans le dictionnaire: virtuel, virtuelle, virtuels, virtuelles apparaissent séparément. De plus, d’après les tests effectués, seule une page est prise en compte.