Logo Feed43 Feed43 est un service web qui permet de générer un flux RSS à partir de n’importe quelle page Internet. Il peut donc se révéler particulièrement utile pour suivre des sites qui ne proposent pas encore de fils de syndication ou pour surveiller les modifications de contenu de ceux qui ne se prêtent pas habituellement à ce genre d’utilisation (par exemple dans le cadre d’une veille concurrentielle). L’avantage de la technologie RSS est de pouvoir ensuite centraliser en un seul endroit tous ces flux et d’être alerté d’éventuelles mises à jour sans avoir à consulter chaque site.

Feed43 est un outil très puissant mais qui - en contrepartie - est un peu complexe à prendre en main. Cette complexité va également dépendre pour beaucoup de la page à analyser et des informations à récupérer. Prenons l’exemple de CSSTux, une galerie qui recense des sites au design réussi :

CSSTux

CSSTux, pour une raison qui m’échappe, ne propose pas de fil de syndication pour recevoir les nouveaux sites ajoutés à cette galerie. Grâce à Feed43, il suffit donc de remplir un formulaire en commençant par préciser l’adresse de la page à analyser :

http://www.csstux.com/index.php

Feed43 va alors charger le contenu de cette page et l’afficher dans un des champs du formulaire. Ensuite, il va falloir lui expliquer quelles données il doit extraire en spécifiant des motifs de recherche. Par exemple ici, on doit indiquer à Feed43 de se focaliser seulement sur le tableau qui contient les vignettes de chaque site (grâce au champ Global Search Pattern) :

<table style='margin:auto; border:0px;'{%}</table>

Les informations à retenir sont spécifiées grâce à l’expression {%}. Maintenant, il ne reste plus qu’à découper ces informations en éléments distincts (grâce au champ Item (repeatable) Search Pattern) :

<a href="{%}"{*} title="{%}">{%}</a>{*}</td>

Le résultat de l’extraction s’affiche juste en dessous (l’expression {*} permet de spécifier n’importe quelle chaîne de caractères). Il est donc très facile de tester plusieurs motifs différents et de les optimiser.

La dernière étape consiste à remplir des champs d’informations pour le nouveau flux RSS et surtout à effectuer la correspondance entre les informations trouvées et celles à afficher dans le flux. Dans notre exemple, il faut juste indiquer l’emplacement du titre des sites dans le résultat de l’extraction (grâce au champ Item Title Template) :

{%2}

Il faut suivre la même logique pour le lien vers ces sites (champ Item Link Template) :

{%1}

Et pour la vignette elle-même (champ Item Content Template) :

{%3}

Comme vous l’aurez sûrement deviné, les numéros correspondent aux emplacements dans le motif de recherche cité plus haut. Une prévisualisation du contenu du flux RSS permet ensuite de vérifier que tout est en ordre. Il ne reste plus qu’à ajouter l’adresse de ce nouveau flux à son lecteur RSS préféré :

http://feed43.com/2434377564335401.xml

Et voilà !

Aperçu d’un flux généré par Feed43 dans Netvibes

Il existe bien sûr d’autres services de ce type (également appelés HTML-to-RSS services) comme FeedYes ou encore FeedFire. Il faut noter que si la structure de la page surveillée change, il faudra alors mettre à jour les motifs de recherche en conséquence. Feed43 est donc un service utile et facile à mettre en place, mais qui nécessite d’être familiarisé avec le langage HTML.

A lire également

Vous pouvez continuer votre lecture sur des sujets similaires en consultant les articles suivants :

Les visiteurs qui ont vu cette page ont consulté ensuite :

A savoir

La rédaction de cet article a nécessité 1 heure et 38 minutes. Si vous le souhaitez, vous pouvez être prévenu de la parution de nouveaux articles en vous abonnant par RSS ou par email.


8 commentaires à propos de “Feed43, ou comment créer un flux RSS à partir d’une page web” :

  1. Dans le même style, il y a également www.page2rss.com que je j’utilise en veille et qui fonctionne assez bien ;-) dans le sHTML-to-RSS mais Feed43 à l’air pas mal pour le paramétrage.

  2. A noter qu’il existe aussi des outils similaires mais reposants sur les microformats comme hAtom2atom (http://lukearno.com/projects/hatom2atom/)ou hAtom2rss (http://xoxotools.ning.com/hatom2rss.php).

    Le travail est à faire côté serveur mais c’est probablement plus simple que générer du RSS pour ceux qui ne maitrisent que le HTML et les CSS.

  3. Ha ouai c’est puissant comme outils!!

  4. Et comme agrégateur de feeds, il y a aussi Yahoo! Pipes qui est intéressant.

  5. Y’a beaucoup plus simple : feedity :) un bon service qui s’améliore souvent.

  6. Je consulte régulierement ton site, et je suis énormément déçu de voir que mon précédent post n’apparait pas, celui qui disait que j’avais l’impression que tu t’essouflais concernant Loomiz, ne voyant plus aucun post à ce sujet depuis bien des semaines …

    Bravo pour la censure !!

  7. Tu parles de quel commentaire Samy ? Car tu en as laissé un deuxième parfaitement identique dans un autre article (la revue de presse pour ne pas le nommer). Bien sûr, si tu n’avais pas une adresse email fictive, tu aurais très certainement reçu mon message qui te prévenait de la suppression de tes commentaires (car n’ayant rien à voir avec les billets dans lesquels ils ont été postés) et t’invitant à en poster un nouveau dans l’article Happy Birthday. J’en profitais également pour m’excuser de manière générale auprès de tous ceux qui voudraient avoir des nouvelles de Loomiz et pour dire que je travaille actuellement sur une mini série d’articles pour faire le bilan de l’année passée.

    Tu parles de censure, moi j’appelle ça du spam.

  8. Bonjour,

    Un peu de buzz autour d’un service que j’ai développé qui permet également de convertir une page web en RSS.

Ajouter un commentaire

Les informations obligatoires sont indiquées par une étoile rouge *.


2 rétroliens à propos de “Feed43, ou comment créer un flux RSS à partir d’une page web” :

  1. Brève 02: htaccess, xhtml, formatage et feed43
    Le 19 octobre 2007 à 22:52
  2. Les 90 principales ressources relatives aux flux RSS | Zoonix
    Le 13 juin 2008 à 17:27

Non, c'est vraiment le nouveau nom d'Haystack. Par contre, je ne savais que 37Signals avait rajouté la France dedans.

A Propos

Je m’appelle Stéphane Thomas et je suis Ingénieur Senior expert dans le développement d'applications web complexes. Etant également un peu Entrepreneur, j'ai tenté l'aventure de la création d'un nouveau service Internet appelé Loomiz. Je suis maintenant le cofondateur d'Hitomi Studio, un studio de développement spécialisé dans la réalisation de sites ecommerce haut de gamme pour de jolies marques.

Lire la suite…