Modélisation des données biologiques : Bio-informatique (2)
Résumé
Les bases de données dédiées à la biologie moléculaire sont un complément essentiel aux données de la littérature. Il existe aujourd’hui une grande variété de bases de données hétérogènes. Cette diversité s’explique, certes, par la variété des données biologiques, qui ne se limitent pas aux séquences, mais aussi par la variété des objectifs qui ont présidé à leur conception. Le problème majeur de la gestion des données biologiques ne résulte donc pas tant de leur volume que de cette hétérogénéité, tant en termes de nature que de format. La question fondamentale est ainsi de savoir comment intégrer ces données biologiques afin de les rendre accessibles et exploitables aussi facilement que si elles figuraient dans une seule et même base. L’examen des différentes solutions techniques proposées met en évidence la nécessité, dans tous les cas, d’expliciter et de représenter formellement les entités concernées et leurs relations. Un exemple simple mais complet de modélisation illustre cette démarche. In molecular biology, databases form an essential complement tothe data contained in the literature. Nowadays there exists a large number of databases of heterogeneous data. On the one hand, this diversity can be explained by the variety of biological data, going wel beyond sequences. On the other hand, the databases have been designed with different objectives in mind. The major problem for the management of biologica data is therefore no so much their volume as their hete-rogeneity (nature of the data, representational formats). Consequently, the fundamental question is to integrate the biological data in order to make them accessible and to exploit them as easily as if they were contained in the same database. The review discusses the different technical solutions that have been propo-sed thus far. Il underlines the necessity in every case to conceptualise and to represent formally the biologica entities being concerned and their relations. A simple, but complete example illustrated this approach.
Pour citer ce document
Morgat, Anne ; Rechenmann, François ; Modélisation des données biologiques, Med Sci (Paris), 2002, Vol. 18, N° 3; p. 366-374 ; DOI : 10.1051/medsci/2002183366