mardi 24 mars 2009

Collecter données sur Internet

La séquence des étapes proposées pour collecter les données qui viennent d’internet est présentée dans la Figure 1.


Le début du processus est la récupération des données sur internet, les sources proposées sont trois : les news de la journée, les blogs individuels et les services de base de données des news sur internet. Les deux premières sources seront collectées en utilisation du service de NewsGator (Voir Récupérer donnés Flux RSS (Reader RSS – FeedDemon)) ; pour la source de base de données des news sur internet on va utiliser le service de FACTIVA (Voir Récupérer donnés de FACTIVA).

Après la récupération des données, on doit processeur les données avec un logiciel Aproxima qui a été construit pour cette finalité, ce logiciel prend les données sauvegardes sur l’ordinateur et les transforme dans petits fichiers pour son
utilisation dans les logiciels d’analyses sémantique (Voir Utilisation du logiciel Aspirateur de contenus).

Finalement les données sont traitées dans le logiciel d’analyses sémantique et les résultats sont présentés pour à l’utilisateur final (Voir Indexation avec ZOOM).

Télécharger document Complet
Télécharger Logiciel Aproxima




Aucun commentaire: