Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 2010 June; 26(6-7): 603–609.
Published online 2010 June 15. doi: 10.1051/medsci/2010266-7603.

La cellule infectée virtuelle
Un rationnel de biologie systémique pour la découverte de nouvelles cibles thérapeutiques antivirales

Vincent Navratil,1,2* Vincent Lotteau,2 and Chantai Rabourdin-Combe2

1ENS Lyon, 5, rue de la Doua, 69100 Villeurbanne, France
2U851 Inserm I-MAP Team, 21, avenue Tony Garnier, F-69007, Lyon, France
Corresponding author.
« Infectomique », vers une encyclopédie moléculaire de l’infection

Les développements de la biologie systémique (Encadré 1) des infections reposent sur l’essor de l’« infectomique », discipline qui regroupe l’ensemble des technologies « -omiques » à haut débit (Encadré 2) appliquées à l’étude systématique du répertoire moléculaire des interactions entre les agents pathogènes et leurs hôtes, l’« infectome » [ 1]. En ce qui concerne les pathogènes viraux, l’infectome peut être défini comme l’ensemble des interactions moléculaires et fonctionnelles (par exemple les régulations génétiques, les interactions protéine-protéine, les réactions métaboliques) entre les composants des virus (génome, capside, enveloppe virale, etc.) et ceux de la cellule hôte (le cytosquelette, le noyau, les membranes, les organites, etc.) ().

() Voir l’Éditorial de Pierre Legrain, p. 559 de ce numéro

Génomique virale, recherche des composantes du système
Une partie des bases moléculaires des maladies induites par les virus est codée au niveau génomique. Un nombre important de projets de séquençage systématique de génomes viraux a été réalisé. À ce jour, sur les 5 972 génomes d’espèces entièrement séquencés et référencés dans la base de données du NCBI Entrez génome, près de 2 292 génomes correspondent à des virus (Figure 1) 1. Même si ces projets ne couvrent pas encore l’incroyable diversité des souches et des quasiespèces pourtant en lien direct avec leur virulence, leur pathogénicité et leur tropisme, ils apportent néanmoins une information unique sur la diversité des modes d’organisation génomique du monde viral, comme en témoigne le nombre important de gènes viraux sans homologues connus (gènes orphelins ou orphan). Par ailleurs, ces génomes viraux sont extrêmement compacts en comparaison des génomes eucaryotes et codent au total pour plus de 75 000 protéines. Si on considère les génomes viraux mis bout à bout, ces protéines sont réparties au total sur plus de 60 mégabases, soit la taille du chromosome 20 humain. Mais le développement de cibles antivirales repose principalement sur la connaissance fine des structures biochimiques et des fonctions biologiques de ces protéines virales [ 2] qui, pour la grande majorité d’entre elles, restent encore peu ou pas caractérisées.inline-graphic medsci2010266-7p603-img1.jpg
Modélisation systémique de la réponse cellulaire aux pathogènes
Au cours de leur coévolution avec les agents pathogènes, les organismes hôtes ont sélectionné des lignes de défense extrêmement sophistiquées. Une partie de ces défenses immunitaires est innée et s’exprime très précocement au sein des cellules de l’organisme en réponse à l’activation de sentinelles moléculaires. C’est le cas des récepteurs membranaires TLR (récepteurs Toll-like) et des senseurs i ntracellulaires RLR (récepteurs Rig-like) qui interagissent avec des composants des pathogènes (les lipopolysaccharides, l’ARN simple brin, l’ARN ou l’ADN double brin, etc.) [ 3]. La réponse cellulaire à ces interactions est alors assurée par un ensemble complexe de voies de signalisation et de voies de régulations génétiques conduisant à la production de molécules à activité antivirale telles que l’interféron. Des travaux ont été entrepris pour reconstruire le réseau moléculaire des voies des récepteurs TLR [ 4] et de celles qui sont associées à la réponse immunitaire innée [ 5]. Citons, pour illustrer les progrès réalisés dans ce domaine, les travaux du Dr Ido Amit et al. sur le profilage systématique utilisant de manière intégrée des approches de transcriptomique et de criblage d’ARN interférents (pour l’extinction de l’expression de gènes) [ 6]. Compte tenu de leur fort taux de mutation et de réplication, les virus, et plus particulièrement ceux dont le génome est formé d’ARN, présentent une capacité d’adaptation extrêmement rapide à la réponse immunitaire innée et aux nouvelles molécules antivirales, dont celles qui modulent la réponse à l’interféron [ 7]. Dans ce contexte, un des défis actuels est le développement de nouvelles stratégies de découverte de molécules antivirales basées sur la connaissance des interactions entre les protéines virales et les protéines cellulaires [ 8], dans le but d’agir directement au niveau des fonctions cellulaires tout en échappant au processus d’adaptation mutationnelle des virus.
Interactome virus-hôte, définition de l’interface moléculaire de l’infection
Les virus, parasites intracellulaires obligatoires, utilisent les ressources métaboliques et la machinerie moléculaire de la cellule hôte pour réaliser leur cycle de réplication. Dans le contexte général d’une infection, les composants viraux (les protéines, l’ARN, l’ADN) n’agissent pas de manière isolée. La recherche des partenaires viraux ou cellulaires des protéines virales offre un cadre idéal pour l’étude de leurs fonctions et de leur rôle éventuel dans le développement des pathologies associées à l’infection. Depuis l’avènement de la biologie moléculaire, ce type d’approche a été très utilisé à l’échelle d’une protéine ou même d’une interaction binaire testée a priori (par exemple par des techniques de GST pull down, co-immunoprécipitation ou double hybride en levure). Cependant, peu d’efforts ont encore été engagés à ce jour dans la caractérisation systématique à large échelle du vaste espace d’interactions des protéines virales. En effet, plusieurs millions d’interactions binaires devraient encore être testées en théorie si l’on considère les dizaines de milliers de protéines virales et cellulaires. Citons néanmoins les études pionnières de cartographie de l’interactome viral par la technologie du double hybride en levure (Y2H : yeast two-hybrid) réalisées à l’échelle de plusieurs virus entiers dont celui de l’hépatite C [ 9], du SARS (severe acute respiratory syndrome) [ 10] et de plusieurs herpèsvirus [ 11, 12]. Des travaux récents ont également été entrepris pour explorer sans a priori l’interactome virus-hôte, dont celui de l’EBV (Epstein Barr virus) [ 13], du virus de l’hépatite C [ 14] et du virus de la vaccine [ 15]. Comme pour les interactomes des organismes modèles, ces avancées ont été rendues possibles par le développement de larges collections d’ORF (open reading frame, cadre ouvert de lecture) ou ORFéome [ 16, 17]. Ainsi, dans le cadre du projet I-MAP (infectious mapping project), le premier ORFéome viral est en cours d’assemblage dans le but de faciliter l’étude systématique des fonctions des protéines virales tout en prenant en compte la diversité génétique liée aux différentes souches existantes et à leur virulence. Cet ORFéome viral est accessible au sein de la base de données publique ViralORFéome2 [ 18]. En complément de l’approche I-MAP, de nombreuses initiatives internationales de criblage d’interactomes virus-hôte sont en train de bouleverser la discipline. Citons les travaux en cours du Center for cancer system biology sur le virus VPH53,, et ceux de l’Institute of toxicology and genetics sur les herpèsvirus4.inline-graphic medsci2010266-7p603-img2.jpg
La cellule infectée virtuelle, une simulation in silico de l’infection

L’accumulation de perturbations moléculaires et cellulaires induites au cours d’une infection aiguë (grippe, rougeole, Chickungunya, etc.) ou chronique (VHC, VHB, VIH, EBV, etc.) joue, en combinaison avec d’autres facteurs de risque dont les prédispositions génétiques, un rôle prépondérant dans le développement de pathologies. Nous avons dans ce contexte introduit un modèle formel d’infection basé sur des données d’interactions moléculaires impliquées au cours d’une infection et une représentation sous forme de graphe (Encadré 3), véritable ossature physique de la cellule infectée virtuelle (Figure 2).

Dans le cadre d’une étude pilote menée au sein du projet I-MAP, le modèle de cellule infectée virtuelle a été appliqué à la simulation de l’infection virale par le VHC (génotype 1b). Une approche de criblage double hybride systématique nous a tout d’abord permis d’établir une première carte dite de « haute confiance » de l’infection par le génotype 1b du VHC. Cette carte comprend 481 interactions directes entre les 11 protéines du VHC et 421 protéines cellulaires humaines. L’analyse des fonctions cellulaires des cibles cellulaires du VHC a montré une attaque préférentielle de plusieurs voies cellulaires dont la voie d’adhésion focale des cellules à leur substrat ; la perturbation de cette voie par les protéines NS3 actives et NS5A du VHC a été validée in vitro. Ces résultats suggèrent que cette voie intervient dans la mise en place du phénotype tumoral lié à la perte d’adhésion des cellules qui est associée à l’infection chronique par le VHC (par exemple dans les hépatocarcinomes).

Une étude sans a priori des cibles protéiques du VHC dans le contexte du réseau cellulaire humain (Encadré 3) a révélé une interaction préférentielle des protéines virales avec des protéines fortement connectées à d’autres protéines cellulaires (ce sont les hubs moléculaires qui agissent comme des nœuds centraux) et des protéines centrales dans le réseau (Figure 2) [ 19]. Nous avons par ailleurs montré une interaction préférentielle et massive des protéines virales du VHC avec des protéines de type « goulot d’étranglement » (ce sont des bottleneck moléculaires) dans le réseau (Figure 2). Ces protéines présentent des caractéristiques topologiques particulières : elles ont un nombre restreint de partenaires protéiques et une centralité importante dans le réseau cellulaire. Elles joueraient un rôle crucial dans la coordination des régulations entre différentes voies fonctionnelles.

Dans une première tentative exploratoire, un interactome panviral a été reconstruit à partir des résultats de plus de trente années de recherche sur les interactions des protéines virales incluant les premiers résultats de cribles systématiques. Plus de 4 000 interactions protéine-protéine ont été compilées (2 700 interactions virus-virus ; 1 600 interactions virus-hôte) [ 20] (Tableau I). Un des résultats marquants est le nombre de fonctions cellulaires ciblées par les virus, avec plus de 5 % (1 600 cibles protéiques) du protéome potentiellement impliqué au cours de l’épisode infectieux. L’ensemble des données est accessible dans la base de connaissances VirHostNet5,. Même si cette première image de l’infection est loin d’être complète, elle propose un point de référence inédit pour des études ultérieures de prédiction in silico d’interaction et de criblage systématique des interactions pathogènes-hôte. D’autres projets internationaux de haute confiance viennent épauler VirHostNet dans l’annotation des interactions virushôte. Citons la base de données spécialisée VirusMint6 [ 21] ou IntAct7, plus généraliste [ 22]. Alors que la couverture offerte par VirHostNet est actuellement nettement plus large8, VirusMint et IntAct s’efforcent d’apporter une documentation plus précise des méthodes expérimentales à l’origine de l’identification des interactions.inline-graphic medsci2010266-7p603-img3.jpg

Conclusion et perspective

L’intégration des données issues des technologies haut débit appliquées aux relations pathogènes-hôte permettra de modéliser une cellule infectée virtuelle. L’architecture actuelle de cette cellule infectée virtuelle est encore à l’état embryonnaire mais elle constitue une base inestimable pour une compréhension synthétique des bases moléculaires des infections et des maladies infectieuses associées. Par ailleurs, elle offre un canevas pour une interprétation et une intégration rationnelles du flot exponentiel de données issues des projets d’infectomique en cours et à venir.

En complément des technologies de cartographie des interactomes (par exemple par Y2H), les technologies de criblage pangénomique par ARN interférents (banques de si ARN ou de shARN) se révèlent d’une valeur inestimable dans l’étude mécanistique des relations virus-hôte. Elles permettent d’identifier, par une approche systématique, les cofacteurs cellulaires indispensables à la réplication du virus mais également ceux potentiellement impliqués dans les processus de division et de prolifération anormales des cellules infectées [ 2326]. À ce jour, plus de 1 500 facteurs cellulaires essentiels pour la réplication virale ont été isolés. La mise en connexion de ces facteurs-clés avec le réseau d’interactions protéine-protéine virus-hôte permettra de proposer une convergence de rationnels systémiques pour l’identification de nouvelles cibles cellulaires antivirales.

Bien qu’indispensable dans la phase de reconstruction « ascendante » (bottom-up) de modèles mécanistiques qualitatifs (reconstruction de voies de signalisation moléculaire et de complexes protéiques), l’aspect quantitatif et prédictif des modèles s’appuyant sur ces données reste encore limité [ 27]. La caractérisation d’empreintes (signature moléculaire globale) et de profils (catalogue de molécules) transcriptomique et métabolomique par une approche de biologie systémique dite « descendante » (top-down) permet néanmoins de pallier ce problème. En effet, l’étude des variations des concentrations d’ARN messagers ou de métabolites mesurées dans des échantillons cellulaires ou tissulaires permet d’élaborer des modèles beaucoup plus prédictifs, par exemple pour la classification des tumeurs, des maladies ou des molécules thérapeutiques.

Ainsi, dans un futur proche, l’intégration multi-échelles des données d’« - omiques » - fusionnant des approches de biologie moléculaire systémique « ascendante » et « descendante » - devrait permettre une modélisation fine des différents modes d’organisation et de réponse fonctionnelle de la cellule au cours de l’infection. Dans ce contexte, le modèle de cellule infectée virtuelle pourra alors être décliné selon différentes pathologies, différents virus, différentes familles de protéines, etc. Finalement, l’étude systématique panpathogène et comparative inter-souches (souches virulentes/non virulentes, résistantes/non résistantes aux traitements, etc.) et des empreintes et profils moléculaires devrait conduire au développement d’outils diagnostiques, notamment pour les maladies dont l’étiologie virale est incertaine (cancers, maladies auto-immunes, etc.) et celles qui sont associées a la chronicité d’une infection (par exemple le syndrome métabolique).

Comme tout modèle, cette description holistique du système infectieux n’est qu’un reflet très partiel de la réalité et de la complexité biologiques. Elle ne pourra en aucun cas se substituer aux modèles réduits classiquement développés en virologie. Ces deux approches, l’une réductionniste (l’étude des propriétés des composants), l’autre holistique (l’étude des propriétés émergentes du système d’interaction des composants) devront être utilisées de manière conjointe pour sans cesse s’enrichir mutuellement. Le développement synergique d’approches interdisciplinaires et transversales est l’une des clés de la réussite, comme l’atteste le nombre croissant d’instituts de recherche couplant les aspects de biologie systémique et de biologie analytique.

Conflit d’intérêts

Les auteurs déclarent n’avoir aucun conflit d’intérêts concernant les données publiées dans cet article.

 
Acknowledgments

Ce travail a été financé par l’Anrs, l’Inserm et le ministère français chargé de l’Industrie. Vincent Navratil a été financé par l’Inra. Tous nos remerciements au Dr Abdel Aouacheria, à Sandy Navratil et aux experts de Médecine/Sciences pour leurs critiques et leurs commentaires sur le manuscrit.

 
Footnotes
References
1.
Huang SH, Triche T, Jong AY. Infectomics: genomics and proteomics of microbial infections. Funct Integr Genomics 2002 ; 1 : 331-44.
2.
Viswanathan K, Fruh K. Viral proteomics: global evaluation of viruses and their interaction with the host. Expert Rev Proteomics 2007 ; 4 : 815-29.
3.
Medzhitov R. Toll-like receptors and innate immunity. Nat Rev Immunol 2001 ; 1 : 135-45.
4.
Oda K, Kitano H. A comprehensive map of the toll-like receptor signaling network. Mol Syst Biol 2006 ; 2 : 2006 0015.
5.
Lynn DJ, Winsor GL, Chan C, et al. InnateDB: facilitating systems-level analyses of the mammalian innate immune response. Mol Syst Biol 2008 ; 4 : 218.
6.
Amit I, Garber M, Chevrier N, et al. Unbiased reconstruction of a mammalian transcriptional network mediating pathogen responses. Science 2009 ; 326 : 257-63.
7.
Gago S, Elena SF, Flores R, Sanjuan R. Extremely high mutation rate of a hammerhead viroid. Science 2009 ; 323 : 1308.
8.
Navratil V, de Chassey B, Meyniel L, et al. Systems-level comparison of protein-protein interactions between viruses and the human type 1 interferon system network. J Proteome Res 2010, May 11 (Epub ahead of print) PMID : 20459142.
9.
Flajolet M, Rotondo G, Daviet L, et al. A genomic approach of the hepatitis C virus generates a protein interaction map. Gene 2000 ; 242 : 369-79.
10.
Von Brunn A, Teepe C, Simpson JC, et al. Analysis of intraviral protein-protein interactions of the SARS coronavirus ORFeome. PLoS One 2007 ; 2 : e459.
11.
Uetz P, Dong YA, Zeretzke C, et al. Herpesviral protein networks and their interaction with the human proteome. Science 2006 ; 311 : 239-42.
12.
Fossum E, Friedel CC, Rajagopala SV, et al. Evolutionarily conserved herpesviral protein interaction networks. PLoS Pathog 2009 ; 5 : e1000570.
13.
Calderwood MA, Venkatesan K, Xing L, et al. Epstein-Barr virus and virus human protein interaction maps. Proc Natl Acad Sci USA 2007 ; 104 : 7606-11.
14.
De Chassey B, Navratil V, Tafforeau L, et al. Hepatitis C virus infection protein network. Mol Syst Biol 2008 ; 4 : 230.
15.
Zhang L, Villa NY, Rahman MM, et al. Analysis of vaccinia virus-host protein-protein interactions: validations of yeast two-hybrid screenings. J Proteome Res 2009 ; 8 : 4311-8.
16.
Lamesch P, Li N, Milstein S, et al. hORFeome v3.1: a resource of human open reading frames representing over 10,000 human genes. Genomics 2007 ; 89 : 307-15.
17.
Uetz P, Rajagopala SV, Dong YA, Haas J. From ORFeomes to protein interaction maps in viruses. Genome Res 2004 ; 14 : 2029-33.
18.
Pellet J, Tafforeau L, Lucas-Hourani M, et al. ViralORFeome: an integrated database to generate a versatile collection of viral ORFs. Nucleic Acids Res 2010 ; 38 : D371-8.
19.
Yamasaki C, Murakami K, Fujii Y, et al. The H-Invitational Database (H-InvDB), a comprehensive annotation resource for human genes and transcripts. Nucleic Acids Res 2008 ; 36 : D793-9.
20.
Navratil V, de Chassey B, Meyniel L, et al. VirHostNet: a knowledge base for the management and the analysis of proteome-wide virus-host interaction networks. Nucleic Acids Res 2009 ; 37 : D661-8.
21.
Chatr-aryamontri A, Ceol A, Peluso D, et al. VirusMINT: a viral protein interaction database. Nucleic Acids Res 2009 ; 37 : D669-73.
22.
Aranda B, Achuthan P, Alam-Faruque Y, et al. The IntAct molecular interaction database in 2010. Nucleic Acids Res 2010 ; 38 : D525-31.
23.
Tai AW, Benita Y, Peng LF, et al. A functional genomic screen identifies cellular cofactors of hepatitis C virus replication. Cell Host Microbe 2009 ; 5 : 298-307.
24.
Krishnan MN, Ng A, Sukumaran B, et al. RNA interference screen for human genes associated with West Nile virus infection. Nature 2008 ; 455 : 242-5.
25.
Hao L, Sakurai A, Watanabe T, et al. Drosophila RNAi screen identifies host genes important for influenza virus replication. Nature 2008 ; 454 : 890-3.
26.
Brass AL, Dykxhoorn DM, Benita Y, et al. Identification of host proteins required for HIV infection through a functional genomic screen. Science 2008 ; 319 : 921-6.
27.
Forst CV. Host-pathogen systems biology. DrugDiscovToday 2006 ; 11 : 220-7.
28.
Carvunis AR, Gomez E, Thierry-Mieg N, et al. Biologie systémique : des concepts d’hier aux découvertes de demain. MedSci (Paris) 2009 ; 25 : 578-84.
29.
Barillot E, Calzone L, Zinovyev A. Biologie des systèmes appliqués aux cancers. Med Sci (Paris) 2009 ; 25 : 601-7.
30.
Thieffry D. Biologie des systèmes : des réseaux d’interactions moléculaires à la médecine personnalisée. Med Sci (Paris) 2009 ; 25 : 547-8.
31.
Lander ES, Linton LM, Birren B, et al. Initial sequencing and analysis of the human genome. Nature 2001 ; 409 : 860-921.
32.
Stumpf MP, Thorne T, de Silva E, et al. Estimating the size of the human interactome. Proc Natl Acad Sci USA 2008 ; 105 : 6959-64.
33.
Barabasi AL, Oltvai ZN. Network biology: understanding the cell’s functional organization. Nat Rev Genet 2004 ; 5 : 101-13.
34.
Lesne A. Biologie des systèmes : l’organisation multiéchelle des systèmes vivants. Med Sci (Paris) 2009 ; 25 : 585-7
35.
Haiech J, Galli T. Biologie systémique, biologie synthétique et nanobiotechnologies : le tryptique du XXIe siècle. Med Sci (Paris) 2009 ; 25 : 576-7.