polish english cesky francaise italiano portugues

 

Coordinateur du projet
Infovide-Matrix S.A.
ul. Kolejowa 5/7
01-217 Warszawa
POLAND
tel.(48 22) 534 74 00 - 01
fax (48 22) 534 74 02
Autres partenaires:
  • Polska Biblioteka Internetowa
  • TiP Sp. z o.o.
  • Synapse Développement SARL
  • Priberam Informática Lda.
  • Expert System S.p.A.
  • Národni knihovna Èeské republiky
  • Vysoká ¹kola ekonomická v Praze

  • M-CAST
    Multilingual Content Aggregation System basé sur le moteur de recherche TRUST
    (projet e-Contenu n° EDC 22249 M-CAST)

    Ce projet a pour objet de développer une infrastructure multilingue autorisant des producteurs de contenus a accéder, a rechercher et a extraire l'information de grands corpus de textes multilingues, provenant du Web, de maisons d'éditions, d'agences de presse ou de bases de données scientifiques.

    Systeme

    Le systeme M-CAST prendra en compte le développement des bibliotheques numériques en rassemblant les données numériques disponibles dans différents formats et différents lieux. Le systeme sera testé sur deux bibliotheques, pour lesquelles seront créés des Portails d'unification de Contenu Multimedia (M-CAPs), en utilisant leurs portails actuels et leurs infrastructures. Les portails permettront de fournir des réponses aux questions en langage naturel dans de grands corpus de données multilingues. L'interface de présentation des portails sera multimedia afin d'autoriser la reproduction de copies numérisées de vieux documents, les documents administratifs, les partitions musicales, les vidéos, les images, etc., meme si le texte seul sera indexé.

    Technologies linguistiques

    M-CAST sera basé sur les résultats de TRUST - Moteur de Recherche Sémantique et Cognitive pour retrouver de l'Information par des méthodes sémantiques (Multilingual Semantic and Cognitive Search Engine for Text Retrieval Using Semantic Technologies (IST-1999-56416) projet financé par le 5e Programme-Cadre de la Communauté Européenne pour la Recherche et le Développement Technologique. Le moteur de recherche TRUST, developpé pour 4 langues (Français, Italien, Polonais et Portugais) sera converti d'un programme monoposte sous Windows en application serveur. Les ressources linguistiques de TRUST serons utilisées et mises a jour. L'ontologie linguistique (taxonomie) utilisée par le moteur sera convertie afin d'etre compatible avec la Classification Décimale Universelle (CDU) utilisée par de nombreuses bibliotheques dans le monde. Deux autres langues seront prises en compte: l'anglais - développé par un des partenaires de TRUST, et le tcheque - développé durant le projet M-CAST.

    Méthodologie

    Le systeme M-CAST sera l'élément central du portail M-CAP et sera développé en conformité avec la méthodologie "Knowledge-based Content Management Application Design Methodology" conçue par Infovide-Matrix S.A. dans un autre projet du 5e Programme-Cadre de la Communauté Européenne - ICONS - Intelligent Content Management System - IST-2001-32429.

    Implémentation

    Les portails seront déployés et testés dans deux bibliotheques publiques: La Bibliotheque Internet Polonaise et la Bibliotheque Nationale Tcheque afin de permettre, sur l'ensemble de leurs ressources numériques disponibles en ligne, de poser des questions en langage naturel et d'obtenir des réponses issues des corpus multilingues.

    Réalisation

    A la fin du projet un produit commercialisable pour la gestion de connaissances multilingues sera disponible. L'exploitation commerciale des résultats dans les bibliotheques (recherche d'information, classification de catalogues), la gestion de contenu (acquisition et unification de contenus, statistiques de diffusion, débroussaillage), les bases de données bibliographiques, les informations de service dissémination sélective de l'information, personnalisation, découverte du savoir) et dans les réseaux de données sémantiques est prévu.

    __________________________________________________________________________________________

    Le projet M-CAST est développé avec le soutien financier de la Communauté Européenne dans le cadre du programme communautaire pluriannuel visant a encourager le développement et l'utilisation du contenu numérique européen sur les réseaux mondiaux ainsi qu'a promouvoir la diversité linguistique dans la société de l'information (2001-2005).