Feed43, ou comment créer un flux RSS à partir d’une page web
Publié le 16 oct 07 à 12:47 | Catégorie : Web 2.0 | 10 commentaires
Feed43 est un service web qui permet de générer un flux RSS à partir de n’importe quelle page Internet. Il peut donc se révéler particulièrement utile pour suivre des sites qui ne proposent pas encore de fils de syndication ou pour surveiller les modifications de contenu de ceux qui ne se prêtent pas habituellement à ce genre d’utilisation (par exemple dans le cadre d’une veille concurrentielle). L’avantage de la technologie RSS est de pouvoir ensuite centraliser en un seul endroit tous ces flux et d’être alerté d’éventuelles mises à jour sans avoir à consulter chaque site.
Feed43 est un outil très puissant mais qui - en contrepartie - est un peu complexe à prendre en main. Cette complexité va également dépendre pour beaucoup de la page à analyser et des informations à récupérer. Prenons l’exemple de CSSTux, une galerie qui recense des sites au design réussi :
CSSTux, pour une raison qui m’échappe, ne propose pas de fil de syndication pour recevoir les nouveaux sites ajoutés à cette galerie. Grâce à Feed43, il suffit donc de remplir un formulaire en commençant par préciser l’adresse de la page à analyser :
http://www.csstux.com/index.php
Feed43 va alors charger le contenu de cette page et l’afficher dans un des champs du formulaire. Ensuite, il va falloir lui expliquer quelles données il doit extraire en spécifiant des motifs de recherche. Par exemple ici, on doit indiquer à Feed43 de se focaliser seulement sur le tableau qui contient les vignettes de chaque site (grâce au champ Global Search Pattern) :
<table style='margin:auto; border:0px;'{%}</table>Les informations à retenir sont spécifiées grâce à l’expression {%}. Maintenant, il ne reste plus qu’à découper ces informations en éléments distincts (grâce au champ Item (repeatable) Search Pattern) :
<a href="{%}"{*} title="{%}">{%}</a>{*}</td>Le résultat de l’extraction s’affiche juste en dessous (l’expression {*} permet de spécifier n’importe quelle chaîne de caractères). Il est donc très facile de tester plusieurs motifs différents et de les optimiser.
La dernière étape consiste à remplir des champs d’informations pour le nouveau flux RSS et surtout à effectuer la correspondance entre les informations trouvées et celles à afficher dans le flux. Dans notre exemple, il faut juste indiquer l’emplacement du titre des sites dans le résultat de l’extraction (grâce au champ Item Title Template) :
{%2}Il faut suivre la même logique pour le lien vers ces sites (champ Item Link Template) :
{%1}Et pour la vignette elle-même (champ Item Content Template) :
{%3}Comme vous l’aurez sûrement deviné, les numéros correspondent aux emplacements dans le motif de recherche cité plus haut. Une prévisualisation du contenu du flux RSS permet ensuite de vérifier que tout est en ordre. Il ne reste plus qu’à ajouter l’adresse de ce nouveau flux à son lecteur RSS préféré :
http://feed43.com/2434377564335401.xml
Et voilà !
Il existe bien sûr d’autres services de ce type (également appelés HTML-to-RSS services) comme FeedYes ou encore FeedFire. Il faut noter que si la structure de la page surveillée change, il faudra alors mettre à jour les motifs de recherche en conséquence. Feed43 est donc un service utile et facile à mettre en place, mais qui nécessite d’être familiarisé avec le langage HTML.
A lire également
Vous pouvez continuer votre lecture sur des sujets similaires en consultant les articles suivants :
- Les opérations de base dans Subversion
- Comment filtrer les articles des blogs à fort traffic ?
- Surveiller son serveur avec Cacti
- 10 startups dans lesquelles j'investirais...
Les visiteurs qui ont vu cette page ont consulté ensuite :
- 45 applications web 2.0 françaises (76 lectures)
- S’abonner (49 lectures)
- Evaluer la notoriété d’un site web ou d’un blog (21 lectures)
A savoir
La rédaction de cet article a nécessité 1 heure et 38 minutes. Si vous le souhaitez, vous pouvez être prévenu de la parution de nouveaux articles en vous abonnant par RSS ou par email.
2 rétroliens à propos de “Feed43, ou comment créer un flux RSS à partir d’une page web” :
-
Brève 02: htaccess, xhtml, formatage et feed43
Le 19 octobre 2007 à 22:52 -
Les 90 principales ressources relatives aux flux RSS | Zoonix
Le 13 juin 2008 à 17:27
8 commentaires à propos de “Feed43, ou comment créer un flux RSS à partir d’une page web” :
Dans le même style, il y a également www.page2rss.com que je j’utilise en veille et qui fonctionne assez bien
dans le sHTML-to-RSS mais Feed43 à l’air pas mal pour le paramétrage.
Guillaume le 16 octobre 2007 à 15:36 (#1)
A noter qu’il existe aussi des outils similaires mais reposants sur les microformats comme hAtom2atom (http://lukearno.com/projects/hatom2atom/)ou hAtom2rss (http://xoxotools.ning.com/hatom2rss.php).
Le travail est à faire côté serveur mais c’est probablement plus simple que générer du RSS pour ceux qui ne maitrisent que le HTML et les CSS.
Oncle Tom le 16 octobre 2007 à 15:49 (#2)
Ha ouai c’est puissant comme outils!!
eMeRiKa le 16 octobre 2007 à 16:53 (#3)
Et comme agrégateur de feeds, il y a aussi Yahoo! Pipes qui est intéressant.
Karl Demers le 17 octobre 2007 à 15:16 (#4)
Y’a beaucoup plus simple : feedity
un bon service qui s’améliore souvent.
alesas le 17 octobre 2007 à 23:33 (#5)
Je consulte régulierement ton site, et je suis énormément déçu de voir que mon précédent post n’apparait pas, celui qui disait que j’avais l’impression que tu t’essouflais concernant Loomiz, ne voyant plus aucun post à ce sujet depuis bien des semaines …
Bravo pour la censure !!
Samy le 19 octobre 2007 à 12:36 (#6)
Tu parles de quel commentaire Samy ? Car tu en as laissé un deuxième parfaitement identique dans un autre article (la revue de presse pour ne pas le nommer). Bien sûr, si tu n’avais pas une adresse email fictive, tu aurais très certainement reçu mon message qui te prévenait de la suppression de tes commentaires (car n’ayant rien à voir avec les billets dans lesquels ils ont été postés) et t’invitant à en poster un nouveau dans l’article Happy Birthday. J’en profitais également pour m’excuser de manière générale auprès de tous ceux qui voudraient avoir des nouvelles de Loomiz et pour dire que je travaille actuellement sur une mini série d’articles pour faire le bilan de l’année passée.
Tu parles de censure, moi j’appelle ça du spam.
Stéphane le 21 octobre 2007 à 18:11 (#7)
Bonjour,
Un peu de buzz autour d’un service que j’ai développé qui permet également de convertir une page web en RSS.
balluche le 21 novembre 2007 à 23:44 (#8)
Ajouter un commentaire