|
|

Un des problèmes importants auquel on a à faire face lors de l'accès à une infrastructure, à un service ou à une banque de données, est de formuler des requêtes en tenant compte des concepts, du vocabulaire et de la langue utilisés par les fournisseurs de cette infrastructure, ces services ou ces banques données. Certains outils tiennent compte des synonymes mais pas des quasi-synonymes, alias, polysémies et des termes englobants ou englobés, ce qui donne de mauvais résultats. Bref, les ontologies des utilisateurs et des fournisseurs sont différentes.
Le problème est de taille et n'est pas propre à l'information géospatiale. On n'a qu'à penser aux moteurs de recherche sur le Web qui ont investi, et continuent d'investir, des sommes importantes en recherche dans ce domaine ou même au concept du « Semantic Web » qui fait l'objet de plusieurs articles.
Prenons, à titre d'exemple, le portail de découverte de GéoConnexions. L'utilisateur qui recherche des données sur le cadastre ne se voit pas offrir ce sujet dans la liste de sujets pré-établis. Il doit donc entrer « cadastre » comme mot-clé, mais cette recherche ne retourne aucun jeu de données. Il existe pourtant plus d'une trentaine de jeux de données portant sur ce sujet, mais elles sont documentées en anglais ou utilisent une ontologie différente. Une recherche similaire sur les ressources halieutiques au Canada ne retournera des jeux de données que si le sujet est entré au pluriel.
Un utilisateur pourrait également vouloir obtenir de l'information sur l'épaisseur de la couche d'ozone sur Montréal. Le serveur d'Environnement Canada possède des données atmosphériques sur le Canada, celui de la ville de Montréal des données sur la pollution et celui du Québec des données environnementales. Tous pourraient fournir l'information désirée si l'analyse sémantique était réalisée correctement.
Cette problématique est encore plus importante lorsque les données sont dans plusieurs langues et qu'une traduction d'une langue à l'autre n'est pas directe, un terme dans une langue pouvant avoir plusieurs significations dans une autre. Il faut alors identifier le langage à utiliser à la fois pour la question et la réponse.
C'est pour cette raison qu'un outil d'ontologie géospatiale devient essentiel (une ontologie est considérée comme une collection de descriptions explicites, complètes et consensuelles de l'ensemble des concepts d'un domaine dans le contexte le plus large où ces concepts ont un sens précis, et sans aucune restriction ou règle correspondant à une utilisation particulière). Afin d'être applicable dans plusieurs usages, cet outil doit être disponible comme un service Web accessible en tout temps, via une interface normalisée, par d'autres services, des applications ou des outils. Ce service doit aussi se conformer à plusieurs normes et être enregistré en bonne et due forme.
Le service d'ontologie géospatiale multiusage, multinorme et multilingue OGM³ :
-
permet d'élaborer les réseaux sémantiques relatifs aux principales ontologies, ou domaines d'application, et de gérer les relations entre certains thésaurus déterminés (GCMD, IHO S57, ISO B6, données cadre, taxonomies, etc.) en plusieurs langues;
-
offre une interface normalisée aux autres services et outils d'infrastructures géospatiales, notamment la découverte, le catalogage et l'intégration de jeux de données, en leur offrant les ontologies, leurs définitions, des traductions, les synonymes, termes similaires, etc.
Dans le cadre de la mise au point d'infrastructures ou de bases de données géospatiales, grâce au service OGM³ :
-
les développeurs de portails ou d'outils de recherche pourront améliorer les réponses aux recherches faites dans plusieurs langues;
-
les fournisseurs de données qui documentent leurs jeux de données pourront mieux décrire leurs contenus;
-
les fournisseurs de données pourront mieux établir la correspondance entre les données de sources multiples (autres ministères, provinces, municipalités).
Le service OGM³ est considéré comme autonome et accessible via un protocole Web normalisé basé sur XML. Il est décrit en utilisant la norme WSDL. Celle ci permet de définir le type de service, les messages de transmission, les opérations, les types de ports, la liaison, etc. - référence à la figure suivante qui décrit les technologies du serveur OGM³.

Les données sont stockées dans des fichiers ou un système de gestion de base de données (SGBD) afin de permettre d'indexer les mots-clés et de faciliter leur gestion. L'accès aux données se fait par l'intermédiaire de JDBC et les essais ont été réalisés avec les SGBD Access, MySQL et Oracle.
La constitution des ontologies est faite par l'intermédiaire de Protégé-2000, adapté pour le rendre conforme au modèle des données et aux concepts et orientations proposées.
Le serveur utilise plusieurs normes, notamment :
-
les normes W3C; WSDL, SOAP et UDDI;
-
les normes Web sémantique RDF et OWL;
-
les normes ISO/TC211:
-
19109 - règles de définition de schémas d'applications;
-
19110 - catalogues d'objets géographiques (thésaurus);
-
19112 - référence par identificateur (toponymes).
-
l'OGC Reference Model for Open Distributed Processing (RM-ODP);
-
ISO 639 pour la définition des langages;
- les normes pour les thesaurus ISO 2788 et ISO 5964.
OGM³ a été testé avec Environnement Canada, Pêches et Océans Canada, Ressources naturelles Canada, la Défense nationale et le ministère des Ressources naturelles, de la Faune et des Parcs du Québec. Le programme GéoConnexions a contribué financièrement au projet.
|