Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 2002 November; 18(11): 1051–1054.
Published online 2002 November 15. doi: 10.1051/medsci/200218111051.

Mise en évidence de processus de duplications en bloc dans le génome des vertébrés

Anne Miquelis,1 Laurent Abi-Rached,2 André Gilles,3 and Pierre Pontarotti2

1Association pour l’étude de l’évolution biologique, 145, rue Consolat, 13001 Marseille, France
2Équipe de phylogénomique, Université de Provence, 3, place Victor Hugo, 13331 Marseille Cedex 3, France
3EA 2202 Biodiversité, Université de Provence, 3, place Victor Hugo, 13331 Marseille Cedex 3, France
 

L’hypothèse selon laquelle le génome des vertébrés aurait évolué via plusieurs tours de polyploïdisations a déjà plus de trente ans [1]. Le génome des actuels vertébrés à mâchoires aurait dû conserver la trace de ces phénomènes sous la forme d’un réseau de régions paralogues (voir glossaire) au sein desquelles toutes les paires de gènes dupliqués auraient subi cet événement simultanément. L’analyse de la carte du génome humain [2] a permis d’identifier différentes régions de paralogie de ce type parmi lesquelles celle qui contient les gènes codant pour les éléments du complexe majeur d’histocompatibilité (CMH) [3] pour lequel le processus de duplication s’est vraisemblablement produit il y a au moins 420 millions d’années [4]. Des gènes ancres à évolution plus lente ont été mis en évidence à proximité des gènes humains du CMH [4]. Afin de savoir si le génome de notre ancêtre a subi des duplications en bloc, nous avons choisi [5]: (1) d’analyser en détail les gènes dupliqués présents dans la série de paralogie du CMH (analyses phylogénétiques et cartes), (2) de vérifier l’hypothèse selon laquelle la duplication en bloc serait survenue après la radiation des vertébrés et (3) de cloner les gènes équivalents chez l’amphioxus (ou lancelet), choisi comme animal modèle en raison de sa position au sein de l’arbre évolutif des métazoaires (Figure 1) .

Parmi les 18 gènes ancres définis comme tels par une recherche dans les bases de données de nouveaux gènes paralogues et de leurs relations phylogénétiques, onze ont été sélectionnés pour cette étude. Un cosmide (voir glossaire) cloné a ensuite été entièrement séquencé et analysé pour chaque gène ancre afin d’étudier le contenu et les relations phylogénétiques des gènes de l’amphioxus et de leurs correspondants humains (Figure 2). Les gènes avoisinant chaque gène ancre sur les cosmides correspondants ont alors été prédits par analyse bio-informatique. Un total de 41 gènes sont présents sur l’ensemble des cosmides séquencés (incluant les gènes ancres et les gènes avoisinants) (400 kilobases). Ces 41 gènes sont alors utilisés pour rechercher des séquences semblables dans les bases de données. Des similitudes significatives sont observées pour 34 gènes (7 gènes ne montrent pas de similitudes significatives avec les séquences présentes dans les bases de données), parmi lesquels 33 incluent des séquences humaines. L’analyse des jeux de données permet l’attribution du critère d’orthologie à 31 gènes de l’amphioxus parmi lesquels 9 sont des gènes ancres et 22 des gènes qui leur sont adjacents. L’analyse des relations phylogénétiques des gènes ancres de l’amphioxus permet de conclure que les duplications ayant engendré les différentes familles de gènes ancres chez les vertébrés se sont produites entre 766-420 millions d’années (pour la diversification des vertébrés osseux) et probablement entre 766-528 millions d’années (pour la séparation des vertébrés à mâchoires).

L’analyse de la signification statistique de la distribution des gènes humains orthologues des gènes de l’amphioxus a été réalisée dans quatre régions de paralogie du CMH humain, sur les chromosomes 1, 6, 9 et 19 (Figure 2) . Vingt-deux gènes de l’amphioxus situés au voisinage des gènes ancres clonés ont au moins un orthologue humain pour un total de 42 orthologues humains parmi lesquels seize sont localisés dans une région de paralogie du CMH. La distribution des gènes humains orthologues des gènes voisins des gènes ancres de l’amphioxus est statistiquement différente d’une distribution au hasard pour ces quatre régions ce qui indique l’existence d’un lien évolutif entre les régions génomiques de l’amphioxus et les quatre régions génomiques humaines. Le modèle le plus probable permettant d’expliquer le lien entre les régions génomiques de l’amphioxus et les régions de paralogie dans le CMH humain est l’existence d’un ancêtre génomique commun aux quatre régions génomiques humaines ayant subi une duplication en bloc après la séparation céphalochordés-vertébrés. Les régions de paralogie du CMH sont donc des régions parasynténiques (voir glossaire) qui ont été dupliquées en bloc au cours d’une période comprise entre 766 et 528 millions d’années.

L’aspect le plus frappant de l’évolution des régions dupliquées est le nombre de gènes fixés. La région génomique du chromosome 9 contient en effet deux fois le nombre de la plupart des gènes dérivés de la région génomique ancestrale contrairement aux trois autres régions. Ainsi, en termes d’organisation génomique, la région du chromosome 9 est beaucoup plus semblable à la région génomique ancestrale supposée que ne le sont les trois autres régions de paralogie du CMH. Le caractère ancestral de la région du chromosome 9 s’observe également au niveau des gènes. L’analyse du modèle de substitution (calcul du taux de changement des acides aminés le long de la séquence permettant d’estimer la vitesse d’évolution d’une protéine) des familles géniques ayant plus de deux paralogues dans les régions de paralogie du CMH (six familles paralogues) montre que les gènes de la région du chromosome 9 ont toujours un taux de substitution faible comparé aux trois autres régions paralogues (6 gènes sur 6, ce qui est statistiquement significatif) induisant une évolution moins rapide des gènes de cette région. L’essence d’un tel phénomène reste obscure, mais divers processus peuvent être impliqués comme les contraintes fonctionnelles, les contraintes d’expression et de régulation (expression ubiquitaire versus spécifique d’un tissu).

Ce travail suggère que les régions dupliquées ont des destins différents: une région peut être « préservée » (contrainte fonctionnelle) et entretenir une fonction ancestrale alors que d’autres peuvent être plus « libres », conduisant potentiellement à l’émergence de nouveaux gènes et/ou familles géniques ce qui est supposé pour la « véritable » région génomique du CMH sur le chromosome 6 [4]. L’échantillonnage d’autres régions génomiques est nécessaire afin de déterminer à quel point ce phénomène peut être généralisé.

Cette étude valide donc l’hypothèse de la duplication en bloc des régions de paralogie du CMH et constitue la première étape démontrant que des processus de polyploïdisation se sont produits dans notre génome ancestral après la séparation céphalochordés/vertébrés et avant la radiation des gnathostomes, c’est-à-dire entre 766 et 528 millions d’années. En reconstruisant la région ancestrale des quatre régions de paralogie du CMH, nous avons découvert un aspect inattendu de l’évolution des régions dupliquées: une région a conservé un état ancestral à la fois en terme d’organisation et de profil de substitution des gènes. Notre génome comporte donc une grande région apparemment sous sélection négative (processus qui freine l’évolution des séquences; par exemple, une contrainte fonctionnelle) un concept appliqué peu fréquemment aux gènes pris individuellement ou aux segments de gènes. Il est important de déterminer dans quelle mesure cette découverte peut être généralisée à d’autres régions du génome. Ces analyses soulignent l’importance de la phylogénie et de la phylogénomie, non seulement pour révéler l’histoire évolutive de notre génome mais également pour une meilleure compréhension des organisations génomiques actuelles.

 
Acknowledgments

Nous tenons à remercier Etienne Danchin et Alexandre Vienne pour la relecture et les critiques apportées à ce manuscrit.

 
Glossaire
ParalogueDeux gènes sont dits « paralogues » s’ils sont issus d’un événement de duplication au sein du génome d’un même individu.
OrthologueGènes d’espèces différentes dont les séquences sont homologues, dérivent d’un même gène ancestral et ont divergé à la suite d’un événement de spéciation. Ils peuvent ou non avoir la même fonction
CosmidesFragments d’ADN insérés dans des plasmides et ayant des tailles comparables (de 30 à 50 kpb). Ce sont des vecteurs qui sont utilisés pour la construction de banques d’ADN génomique.
Régions parasynténiquesTerme qui fait référence à des régions génomiques dont la divergence est due à des événements de duplication.
CladogrammeArbre traduisant les relations de parenté entre des êtres vivants, établi à partir de la méthode cladistique (basée sur la notion d’homologie). Cet arbre exprime ainsi une hypothèse sur les parentés phylogénétiques entre plusieurs taxons (ensemble des organismes reconnus et définis dans chacune des catégories de la classification biologique hiérarchisée).
References
1.
Ohno S. Evolution by Gene Duplication. Berlin: Springer, 1970.
2.
Lundin LG. Evolution of the vertebrate genome as reflected in paralogous chromosomal regions in man and the house mouse. Genomics 1993; 16 : 1–19.
3.
Kasahara M, Nakaya J, Satta Y, Takahata N. Chromosomal duplication and the emergence of the adaptive immune system. Trends Genet 1997; 13 : 90–2.
4.
Abi-Rached L, McDermott MF, Pontarotti P. The MHC big bang. Immunol Rev 1999; 167 : 33–44.
5.
Abi-Rached L, Gilles A, Shiina T, Pontarotti P, Inoko H. Evidence of en bloc duplication in vertebrate genomes. Nat Genet 2002; 31 : 100–5.