Outils pour utilisateurs

Outils du site


doc:veille:flux_rss

Ceci est une ancienne révision du document !


Flux RSS

Ressources

Création de flux pour des pages n'en ayant pas

Cela s'appelle du « screen scraping » ou « scraped pages ». Rechercher « scraping web pages with free software ».

Quelques liens collectés rapidement :

Services non-libres

  • http://www.rsspect.com/ se contente de signaler par RSS quand une page, ou plus généralement tout document ou fichier en ligne, est modifiée.
  • idem pour http://www.feedwhip.com/ (combiné à une possibilité d'envoi par email).
  • http://www.trackengine.com/ permet de repérer un changement localisé sur une partie seulement d'une page (et en excluant par exemple des modifications mineures et en spécifiant des mots-clés si l'on souhaite). TrackEngine notifie le changement par mail (mais il est toujours possible d'utiliser un service transformant un envoi de mail en RSS). Attention : le service est limité à 5 pages ou 100 Ko par compte utilisateur.
  • http://feed43.com/ - Feed for free, est un service de scraping beaucoup plus abouti et puissant mais plus technique et aussi plus complexe à utiliser. L'utilisateur indique quelle est la structure (analyse du code html) des parties récurrentes sont à extraire de la page et à partir de ces extractions comment composer le fil RSS. Possibilités de renommer le flux ainsi créé, de le publier ou de garder l'édition privée et d'exporter la liste de flux créés en .opml. À noter que le service Feed43 ajoute une ligne d'auto-promotion à la fin de chaque items du flux (« Delivered by Feed43 service »). Il existe un usercript Greasemonkey Feed43 Feed Cloner très pratique pour la création de flux à partir de pages similaires (par exemple appartenant à un même site et structurées de la même façon).

Dangers

Google Reader

doc/veille/flux_rss.1160345012.txt.gz · Dernière modification: 2006/10/29 22:54 (modification externe)