klogfr

24.9.04

Systemes automatiques d'agregations de contenus

Document produit dans le cadre de la rencontre RUR@L TIC organisée par le Pays du Trégor-Goëlo (le 24 septembre 2004), et plus spécifiquement dans le cadre d'une intervention intitulée "Systèmes automatiques d'agrégations de contenus" pour la réunion professionnelle du Syndicat mixte Mégalis Bretagne, Commission "Usages et Services aux Citoyens" coordonnée par Michel Briand.

Ce document est à compléter dans sa lecture par des ressources sur l'agrégation de contenus déjà publiées sur ce même espace Web :
Comment faire de la veille informative ou d'opinion via Internet ? (XML, agrégation de contenu, fils de nouvelles RSS et Atom) et l'article Vocabulaire : agrégation de contenu, syndication et fils RSS.



PREAMBULE


Aujourd'hui et dans l'avenir, l'agrégation de contenus tend à redéfinir, via l'utilisation et l'usage d'outils automatisés liés à l'informatique et à l'Internet, le schéma d'information, de communication et d'échange d'une manière générale et, pour ce qui nous préoccupe, dans le monde des collectivités locales, le schéma informationnel entre les employés, la structure hiérarchique traditionnelle fonctionnariale dans son fonctionnement, le tissu économique et social local, le monde associatif et les citoyens.



L'AGREGATION DE CONTENUS : UNE NAISSANCE A LA CROISEE DES CHEMINS DU WEB


L'agrégation de contenus est née aux Etats-Unis en 1997 (http://davenet.scripting.com/1997/12/15/scriptingNewsInXML) autour de la norme RSS à partir d'un croisement d'idées entre la navigation internet (navigateur Netscape), la publication personnelle (Dave Winer et son logiciel de publication personnel et collectif de contenus devenu Radio Userland) et le langage informatique dit XML.

L'une des problématiques de l'agrégation de contenus est de pouvoir, du point de vue de la personne productrice d'information (au sens "data", donc informatique du terme) mettre en ligne une information organisée et structurée de manière à ce que celle-ci puisse être rediffusée, échangée voire réutilisée sur Internet ou hors ligne.

Du point de vue de l'internaute utilisateur de cette information, l'agrégation de contenus obtenue va lui permettre d'effectuer un travail de sélection organisé de l'information, d'archivage, de redistribution et d'échanges "in fine" en ligne.



QUE CONTIENT DANS LES FAITS CETTE INFORMATION PRODUITE DITE "FIL DE NOUVELLES" ?


Tout d'abord, il s'agit d'une description basée sur une syntaxe (organisation langagière informatique) :
- la norme de syndication utilisée : RSS, Atom (et ses versions afférentes),
- le titre du site Web produisant l'information,
- le canal, c'est-à-dire l'adresse générique du site Web produisant l'information (ou URL générique),
- la date et l'heure de production du document en ligne (et éventuellement de sa modification),
- la langue utilisée (exemple : le français),

Puis, des informations relatives à chaque article diffusé en ligne :
- titre de l'article,
- lien de l'article (URL),
- la date et l'heure de sa mise en ligne (et éventuelle modification),
- l'auteur de l'article (nom),
- l'éventuelle catégorie/rubrique spécifique attachée à l'article,
- la description de l'article, c'est-à-dire une partie de l'article (premiers mots, voire titre et chapeau, voire titre et résumé) ou son intégralité (c'est un choix du diffuseur).

Le contenu produit peut être textuel, mentionner des hyperliens, être de nature sonore et vidéo. Ce contenu produit dit "syndicable" ou "fil RSS" ou "fil de nouvelles" ne respecte pas la mise en page du site Web traditionnel mais mentionne avec fidélité son contenu.

Exemple : en indiquant l'adresse suivante dans votre navigateur Web préféré : http://mediatic.blogspot.com/rss/mediatic.xml , vous pouvez visionner le contenu syndiqué généré par le site Web suivant : http://mediatic.blogspot.com.



COMMENT PRODUIRE ET GENERER CES DONNEES A PARTIR D'UN SITE WEB ?


Tout site Web dynamique en .php, perl ou .asp ou utilisant le logiciel de publication de contenu SPIP, des logiciels de blogs (Dotclear, WordPress...) ou plate-formes en ligne de blogs (tels Blogger, LiveJournal, etc.) ou CMS (systèmes de gestion de contenus) génèrent automatiquement ces fils de nouvelles qu'il est éventuellement possible de personnaliser (partie de l'article à diffuser (premiers mots, voire titre et chapô, voire titre et résumé) ou de diffuser dans son intégralité.

Vous pouvez obtenir ces renseignements auprès du concepteur du site Web en question pour savoir quel contenu est généré, sous quelle norme (RSS, Atom... ?).

Vous pouvez diffuser un seul flux ou catégoriser ces flux par rubriques (pour une plus grande personnalisation).

Il existe aussi des services gratuits pour créer ou générer un fil de nouvelles pour votre site Web. Cette génération a un coût très faible voire gratuit.



A QUOI CELA SERT DE PRODUIRE DES FILS DE NOUVELLES ?


Les questions à se poser en amont sont les mêmes qui concourrent à la création d'un site Web, par exemple : quel contenu vais-je produire ? pourquoi ? pour qui ? pour quelles utilisations ? quels sont les modes d'échanges et de participations que je vais mettre en place avec le citoyen et/ou l'internaute ?

Je vais pouvoir en tant que producteur d'infos diffuser des infos ciblées à un groupe d'internautes que je ne connais pas forcément mais qui sont censés être intéressés par mes informations et qui vont s'y abonner pour les recevoir de façon automatisée, les consulter voire les archiver.



EXEMPLES D'UTILISATION DE FILS DE NOUVELLES GENERES PAR DES COLLECTIVITES TERRITORIALES OU L'ETAT


La Ville de Costa Mesa en Californie (http://www.ci.costa-mesa.ca.us/) a créé un fil RSS général rubriqué (Headlines, Special Events, Public Hearings, Bids, Employment...) pour diffuser ses infos aux administrés mais également à la Presse et à ses interlocuteurs habituels. La présentation du fil RSS de la Ville de Costa Mesa est disponible ici : http://www.ci.costa-mesa.ca.us/rss.htm.

En Bretagne, via le site Web du Centre Nautique de Plérin hébergé sur le site de la Ville (http://www.ville-plerin.fr/centrenautiqueplerin/), on peut être tenu au courant des activités nautiques sportives proposées (calendrier sportif, tarifs, présentation de l'équipe du centre nautique...).

Le site officiel de Dinant en Belgique (http://www.dinant.be) propose via son fil RSS l'actualité de la ville : diffusions des comptes-rendus (procès verbaux) de l'équivalent de nos conseils municipaux, les ordres du jour des conseils communaux, les plans communaux...) : http://www.dinant.be/rss/news.rss.

La Préfecture de l'Aisne possède un fil RSS (http://www.aisne.pref.gouv.fr/backend.php3) d'actualités : avis d'enquêtes publiques, infos sur le recueil des actes administratifs...

Le site Web A-Brest.net (http://www.a-brest.net) proposé par le service Démocratie Locale et Citoyenneté de la Ville de Brest s'inscrit dans une démarche coopérative où l'intégralité des articles publiés sont également diffusés par fil de nouvelles. Voici l'adresse de ce fil : http://www.a-brest.net/backend_full.php.

On peut bien sûr imaginer de publier une lettre d'information par fil de nouvelles, d'envoyer des alertes (météo, santé par exemple).



QUELS AVANTAGES DANS L'UTILISATION D'UN FIL DE NOUVELLES POUR L'INTERNAUTE QUI LE CONSULTE ?


Un gain de temps notable :
l'internaute reçoit l'information directement sans avoir la nécessité de visiter le site Web pour trouver ce qu'il recherche. Il peut voir s'afficher sur son ordinateur l'information dès qu'elle est publiée.

Une veille pointue et efficace :
se tenir informé sur un domaine particulier, dans un secteur d'activité précis, faire de la veille par un mot clé ? Tout ceci est possible grâce aux agrégateurs de contenus.

Une sélectivité de l'information :
l'internaute choisit une ou plusieurs sources à sa guise. Il organise cela à son gré.

Halte au spam :
du fait que chacun sélectionne ses propres sources de fils de syndication, on est peu touché par des envois publicitaires comme on peut l'être suite à l'inscription à des lettres d'informations par courrier électronique.

L'archivage :
l'internaute peut conserver l'information et/ou l'article en question pour le consulter plus tard ou le garder en mémoire.

La rediffusion de l'information :
si l'internaute est producteur de contenu sur le Web, il peut afficher le fil de syndication sur son propre site Web, donc assurer la rediffusion de votre contenu. Sur ce point précis, il se produit un échange.



COMMENT REPERER UN FIL DE NOUVELLES SUR UN SITE WEB ?


Surveillez les bas de pages Web, sur les côtés, voir en en-tête : les logos ou les mots XML, RSS, RDF, Atom, syndication et cliquez sur ceux-ci.

Le clic peut avoir 2 effets :
- expliquer la syndication du site Web en question et comment cela fonctionne,
- constituer le lien direct du fil de syndication du site Web sur lequel on se trouve.

De nombreux médias, des sites Web personnels, des sites Internet d'associations et de sociétés possèdent des fils dits RSS. Il existe des annuaires de fils RSS francophones, anglophones pour repérer ces fils de syndication.



COMMENT LIRE CE CONTENU SYNDICABLE ET COMMENT SE CONSTITUER SA "REVUE DE PRESSE" (EN QUELQUE SORTE) DE FILS DE SYNDICATION ?


Tout simplement en utilisant ce qu'on appelle un agrégateur de contenus. Celui-ci ne peut fonctionner que s'il y a une connexion Internet.

Il en existe 4 types d'agrégateurs de contenus, gratuits pour la plupart (et en licences "logiciel libre" ou non) :

1) un programme ou logiciel que l'on télécharge sur Internet et que l'on installe ensuite sur un ordinateur. Ce logiciel s'apparente dans son fonctionnement à une messagerie électronique,

2) une solution en ligne où l'on s'inscrit (le plus souvent, il faut mentionner une adresse de courrier électronique et un mot de passe de votre choix) et la gestion de cet espace est donc personnel,

3) on intègre un "plug-in" (petit logiciel téléchargeable et auto-exécutable) à son navigateur Web classique qui va lui permettre de jouer ce rôle d'agrégateur de contenus,

4) l'utilisation d'un navigateur Web qui comprend déjà une fonction "agrégation de contenus". C'est le cas de Opera par exemple. Cela va devenir commun dans les prochaines générations de navigateurs Web.



COMMENT FONCTIONNE UN AGREGATEUR DE CONTENUS ?


Il suffit de repérer une source de fil de nouvelles qui est une URL propre (http://mediatic.blogspot.com/rss/mediatic.xml) puis de la copier dans une fenêtre et ensuite de s'abonner à cette source.

A intervalle régulier ou sur simple demande, votre agrégateur va vérifier si la source a diffusé de nouveaux articles.
L'interface de votre agrégateur est bien entendu personnalisable et comprend différentes fonctionnalités selon les logiciels d'agrégation de contenus utilisés.



LE FUTUR DE L'AGREGATION DE CONTENUS


La mobilité :
via des interfaces Wap par exemple, il est déjà possible de consulter des sources agrégées sur tout outil mobile connecté à Internet (téléphone-photo, assistant personnel de type PDA?),

Certains prédisent qu'à terme, l'agrégation de contenus remplacera le courrier électronique ce dernier étant de plus en plus "noyé" par le Spam.
Toutefois, l'agrégation de contenus ne place pas les interlocuteurs au même niveau dans le schéma communicationnel et, à ce titre, ne peut pas remplacer le caractère discrétionnaire et d'égal à égal avec un homologue internaute tel qu'on peut le connaître via l'utilisation du courrier électronique dans sa forme traditionnelle,

Les agrégateurs de contenus consomment de la bande passante, autrement dit, du "trafic" sur Internet (on emploie là une image "automobile") ce qui a pour effet d'encombrer les réseaux et donc de ralentir la vitesse de transmission d'information sur Internet,

On assiste au développement considérable de procédés alliant les systèmes d'échange de fichiers de pair à pair ("peer to peer") et la notification par fils RSS dès que des nouveaux fichiers sont mis en ligne. Il est ainsi possible de personnaliser ces notifications/avertissements en fonction de choix ou de goûts,

Vers le Web sémantique :
l'organisation descriptive des données de syndication produites permet aussi leur organisation thématique. Si l'on se met d'accord sur une même organisation par champ sémantique ou sur les catégorisations des informations diffusées, cela peut aider à trouver des informations de plus en plus pertinentes sur le Web. C'est une des pistes de l'avenir d'Internet.

L'agrégation de contenus tend à démocratiser le contenu du Web. D'importants médias s'y mettent et aussi des associations, des particuliers. Il met à égalité le contenu produit par telle source ou telle autre source, d'où l'importance d'apprendre l'écriture Web, de porter un regard critique et citoyen sur les utilisations de l'Internet et ce qu'on y trouve.

L'agrégation s'inscrit dans une démarche volontaire coopérative sur le Web basée sur le don du contenu et son partage (en respectant la source bien entendu). L'information produite est décentralisée.

7.9.04

Creer son journal en ligne ou son blog : fiche pedagogique

Cette fiche pédagogique a été réalisée par Nathalie Caclard du Centre d'Information et de Documentation Jeunesse de Paris dans le cadre de la formation d'animateurs d'Espaces Publics Numériques et d'ateliers mensuels gratuits et collectifs de création de blogs pour le grand public, toujours au CIDJ (101, quai Branly).

Objectifs :
- Initier le public à un type de publication "novateur"
- Sensibiliser le public à l'écriture et lui permettre de s'exprimer
- Créer un journal en ligne
- Initier à l'usage d'un téléphone photo et envoyer ses photos sur son blog

Public :
Toute personne ayant déjà une boîte aux lettres électronique.

Durée de l'atelier :
2h30


PROGRAMME

Etape n°1 : un site Internet, çà sert à ... ?

Autour d'une réflexion de groupe sur cette question, il s'agit de compléter par des verbes (les noter sur un paper-board). Un site Internet, çà sert à : partager, voyager, télécharger, informer... Ce qui permet de dégager les grandes lignes en les regroupant par champs sémantiques. Puis aborder comment peut-on créer un site internet ? Ce qui permettra d'enchaîner sur les blogs.

Etape n°2 : et un blog, çà sert à quoi... ?

Définition du blog (origine, statistiques...) et de ses principales caractéristiques. Il s'agit ici de donner les bases de l'environnement du blog. On peut commencer par les amener à réfléchir sur le processus et la valeur de l'expression individuelle.

Etape n°3 : découverte de l'univers "blogosphérique"

A partir d'une grille d'analyse, visite de blogs (une sélection est faite au-préalable par l'animateur multimédia) afin de faire ressortir les différentes tendances existantes (blogs d'actualités, blogs intimistes, photoblogs, sketchblogs...), leur originalité...
Cette étape doit donner lieu à des réactions, des remarques du public qui doit comparer différents blogs et analyser les différences de point de vue (exercice 1 : par exemple comparer le même sujet ou le même thème dans plusieurs blogs...).
En analysant le fond et la forme, l'animateur enchaîne sur les techniques de bases de rédaction d'articles (quelques conseils pour "bien écrire").
Il s'agit de dégager les grandes lignes du fond et de la forme.
Cette étape est très importante pour susciter l'envie chez le public de créer son propre blog.

Etape n°4 : créer son blog

Après la création des blogs, l'initiation s'élargit au moblog avec des mobiles photos. Chaque utilisateur prend une photo et l'envoie sur son blog.


RESSOURCES

Outils et matériels à prévoir pour la séance

- Une grille d'analyse,
- Téléphones photos.


DOCUMENTS A REMETTRE AU PUBLIC

- Un mémo de la séance (un rappel des fonctionnalités de l'outil utilisé),
- Des articles de presse sur le sujet,
- Une liste de site de références.