Voir theme Groupe 4 "système d'information, Internet" qui
correspond très bien.
Système de Base de données et de Bases de connaissance
Dans le contexte du web les données sont hétérogènes, dispersées, et
faiblement structurées, et leur utilisation potentielle très
variée. Tout cela impose un changement important de point de vue par
rapport aux systèmes de gestion de bases de données centralisés et
homogènes.
Il est fondamental de concevoir des outils permettant de structurer ou
d?indexer automatiquement les données pour faciliter leur accès. Des
outils d?intégration d?informations provenant de sources de données
hétérogènes sont aussi nécessaires. Tous ces outils doivent pouvoir
traiter des données exprimées en grande partie sous la forme de textes
en langue naturelle. Il est donc important de prendre en compte cet
aspect textuel des données tout en exploitant la structure des
documents quand elle existe explicitement (documents XML) ou en la
découvrant par des outils de " text mining ".
Enfin, il est important de créer un lien personnalisé base de
donnée/utilisateur : qui a besoin de quoi avec quel point de vue ?
Les aspects à prendre en compte :
Structuration flexible des données pour un accès personnalisé aux
données . Le Système d?Information doit être " user centric
". Cette approche est également valable dans l?industrie et la
production.
Outils efficaces d?interrogation de bases de documents structurés
(XML). XML tend à devenir un format standard d?échange de données
sous la forme de documents structurés par des balises. Il est
important de fournir des outils d?interrogation fondés sur de
réels langages de requêtes, et exploitant la structure du langage
XML pour répondre aux requêtes de manière précise et efficace.
Entrepôts de données sur le WEB: Outils permettant la
constitution, le partage d'informations recherchées sur le web en
fonction des besoins de l'entreprise, d'un point de vue,d'un
domaine. Outils de publication (de mise a disposition,
d'indexation) de documents en fonction d'un domaine, d'un marché,
d'un point de vue...
Fouille de données Problèmes d?interfaces avec les Bases de
Données, approfondissement et efficacité voire combinaison des
méthodes fondées sur des traitements statistiques aussi bien que
celles fondées sur l?apprentissage, le traitement de la langue, la
modélisation, les ontologies, ?
Une part importante des données, même sous format XML, reste sous
forme textuelle. Il est important de fournir des outils robustes
et efficaces capables d?extraire de l?information à partir de
textes.
Visualisation On doit migrer de la présentation de données vers la
visualisation d?information.
Voir
theme 1.3.1. «La numérisation, le stockage et l'utilisation des fonds
d?information scientifique, technique et culturelle»
Ces informations constituent une part importante du patrimoine
national dans le domaine des sciences et des techniques qu?il est
nécessaire de sauvegarder et donc il faut assurer la
disponibilité. L?enjeu d?aujourd?hui est de garantir que ces gisements
soient exploitables demain pour des usages qui ne sont pas encore
connus et qui restent à explorer.
Différents aspects sont concernés :
la pérennité des matériels et logiciels pour assurer la
conservation des ?uvres patrimoniales (incunables, estampes, fonds
rares, film du patrimoine) ;
les supports et les formats de stockage et d?enregistrement ;
la garantie de pouvoir exploiter les informations dans le futur
pour des usages non prévus à ce jour (problème du balisage de
l?information, de l?exploitation collective et coopérative, etc.);
la mise en place d'ateliers expérimentaux de production d'?uvres
multimédia dans les domaines de l'information (scientifique,
technique, pédagogique) selon des critères assurant leur usabilité
dans des contextes divers ;
l'agrégation de contenus audiovisuels et de documents multimédia
dans des applications spécifiques, tels que les Systèmes
d'Information Géographiques (SIG), et l?exploitation de ces
dispositifs intégrés dans le cadre de différents domaines
applicatifs, tels que le tourisme, l?éducation ou la culture.