Le partage des données génétiques : un nouveau capital

Vers un partage des données génétiques : l’exemple des États-Unis

inline-graphic msc170240-img1.jpg

Vignette (Photo © Inserm - Claudine Lemercier).

À l’ère de l’économie numérique, la génétique n’est plus l’exclusivité des généticiens et l’est encore moins du monde académique. Elle intègre aujourd’hui une grande pluralité et diversité d’éléments interagissant de façon dynamique. Ils vont du patient au clinicien, du chercheur à l’industriel, en passant par différentes structures publiques ou privées, académiques ou non, qui permettent d’organiser et de faire fonctionner de façon plus ou moins ordonnée ce nouvel ensemble complexe. En effet, en l’espace de trois décennies, des biotechs principalement nord-américaines (Myriad Genetics, 23andMe, Ancestry DNA, Myheritage, etc.) sont devenues expertes dans la production, le traitement et l’analyse de volumes importants de données génétiques qui dépassent désormais ceux des plateformes académiques habituelles. La majeure partie de leur succès tient aujourd’hui à l’appropriation d’un nouveau modèle économique : celui de « marché biface » [1].

L’idée générale de ce modèle est de produire une quantité importante de données par l’intermédiaire d’un réseau numérique dynamique, interactif et attractif, que ce soit en termes de prix ou de services intégrés, connectant un nombre considérable d’usagers. Les données, sous couvert d’un accord « exprès » des usagers, sont ensuite stockées et valorisées auprès de tiers. Ce contrat, ou accord « exprès », est censé être en adéquation avec la législation et la réglementation des différents pays. Un mot est alors utilisé pour stimuler l’usager dans ce processus de production et de valorisation de données : celui de « partage »¹. Derrière ce mot, l’idée serait que les usagers ne produiraient pas ou ne vendraient pas des données à une entreprise privée. En appliquant les idées du web 2.0 aux systèmes d’information de santé classiques, l’entreprise privée aiderait des usagers à partager des données entre eux ou avec des tiers à travers un réseau numérique riche en informations et en services quasi « gratuit », mais partage qui nécessiterait certaines contreparties.

Cette nouvelle idée du partage suscite alors aux moins deux interrogations quant au sens caché du mot « partage » et de son impact sur la génétique : le partage serait-il devenu synonyme d’échange commercial et la donnée génétique synonyme de capital ?

Vers un partage des données génétiques : l’exemple des États-Unis

De la production au partage de données

En informatique, la « donnée », ou « data » en anglais, signifie le plus généralement une information numérisée et stockée sur des serveurs informatiques. Cette « donnée » peut aussi signifier une information brute (« pauvre en information »), c’est-à-dire une information dont la valeur d’usage n’a pas encore été déterminée [2]. Avec la donnée génétique, on voit bien que celle-ci peut avoir plusieurs valeurs d’usage : clinique, scientifique, économique, etc. [3]. C’est donc le choix d’une valeur d’usage suivant différents processus d’analyse et de traitement qui la transformera en une information avec une finalité précise. Ainsi, la donnée est une information sans valeur d’usage, tandis que l’information est une donnée, ou un ensemble de données, ayant au moins une valeur d’usage. Et comme on va le voir, la donnée et l’information ont toutes les deux une valeur d’échange. Mais revenons sur la question des moyens et des modalités de « production » de la donnée en général.

Les moyens usuels dits de « communication » sont devenus des moyens de « production » de données dont un large panel existe aujourd’hui. Ces moyens vont de la simple feuille de papier à l’ordinateur, en passant par les tablettes numériques et les smartphones. À l’ère du numérique, ces derniers sont en train de devenir les principaux moyens de production. Deux modalités principales de production de données ont été identifiées : la production dite « centralisée » et la production dite « spontanée » [4]. La production centralisée de données signifie que la production est assurée majoritairement par une structure (institut, hôpital, entreprise) contrôlant un réseau « informatique » ou « numérique » comprenant différents usagers. À l’inverse, la production spontanée de données signifie que la production est assurée majoritairement par les usagers du réseau numérique qui deviennent ainsi des producteurs-usagers ou, en anglais, produser [5]. Cette production spontanée, innovante par sa nouveauté et son originalité, caractérise les réseaux dits « socionumériques », qui sont souvent contrôlés par les entreprises [4]. Ces réseaux socionumériques comme Facebook ont associé cette production spontanée de données à l’idée de « partage » [6, 7].

Rappelons alors que le partage signifie le plus communément un « don », ou une « distribution » consciente de biens matériels ou immatériels, sans réciprocité ni obligations mutuelles, directes ou indirectes, nécessairement attendues [8]. Aujourd’hui, ce « partage » de données s’effectue majoritairement sur Internet (périmètre plus ou moins délimité juridiquement) contrôlé par quelques entreprises privées dont les plus connues sont les GAFA (pour Google, Amazon, Facebook, Apple, etc.) aux États-Unis, mais aussi les BATX (pour Baidu, Alibaba, Tencent, Xiaomi, etc.) en Chine. L’objectif premier d’une entreprise privée est de réaliser des bénéfices. Or, pour permettre ce « partage » entre usagers, ces entreprises privées mettent à disposition « gratuitement » aux usagers du réseau différents services (navigateur internet, email, chat, agenda, etc.). Chacun de ces services ont inévitablement eu un coût de création et de développement. Alors comment génèrent-elles des bénéfices ?

Au début des années 2000, un nouveau modèle économique a été identifié et théorisé par les économistes : il s’agit du « marché biface », ou « two-sided market » en anglais [9, 10]. Ici, l’entreprise privée, ou « plateforme biface », offre « gratuitement », sur la première face, différents services numériques aux consommateurs demandeurs, afin d’obtenir et de stocker différents types de données les concernant, qu’elle transforme en information valorisée (à la fois en termes d’échange et d’usage) sur la seconde face, auprès d’autres entreprises ou structures. Les bénéfices réalisés sur la seconde face de la plateforme doivent alors couvrir largement les pertes accusées sur la première. C’est au moins pour cette raison qu’il nous semble difficile de parler de « partage » au sens du « don » défini précédemment. En effet, la donnée correspond davantage à un moyen de paiement bien souvent ignoré par l’usager, plutôt qu’à un partage avec une sorte de « contrepartie » pour l’accès à un réseau numérique riche en informations et l’usage des différents services mis à disposition par l’entreprise.

À ce stade, nous pouvons distinguer au moins deux niveaux de partage. Reprenons l‘exemple de Facebook. Lorsque l’usager du réseau « partage » des données, qui constitueraient le premier niveau de partage, celui-ci les partage avec ses contacts et n’a pas nécessairement pour intention première de partager avec l’entreprise privée en question. Elle apparaît comme un moyen de partage. Mais l’usage secondaire de ces données qu’en fait l’entreprise, qui est souvent ignoré ou méconnu des usagers, constituerait alors un deuxième niveau de partage.

Dès lors, le terme « partage » aurait-il aujourd’hui deux significations ? La première signification, qui est la plus communément admise, serait une distribution, plus ou moins consciente, de biens matériels ou immatériels, sans réciprocité ni obligation mutuelle, directes ou indirectes, nécessairement attendues. La seconde signification, particulière aux nouveaux réseaux numériques privés, serait une distribution, un droit d’accès, ou un paiement, plus ou moins conscient, par l’usager avec ses propres données afin d’obtenir l’accès à un réseau numérique riche en informations et à l’usage des services mis à disposition par l’entreprise. Mais, cette dernière modalité est significativement plus proche de la notion « d’échange » commercial que de « partage ». Elle permet alors l’accumulation, quasi unilatérale, d’un volume important de données et d’informations de grandes valeurs (d’échanges et d’usages) par différents acteurs, essentiellement du secteur privé (GAFA, BATX) permettant la recherche et le développement de nouvelles technologies telles que l’intelligence artificielle.

La donnée est devenue une véritable matière première d’une nouvelle économie libérale qu’on peut alors qualifier de « numérique » et de « mondiale ». Le partage, lui, est probablement l’un de ses premiers fondements, mais sous quelle définition ? C’est dans cette réponse que réside une majeure partie de la complexité et des enjeux de cette économie numérique dite aussi « participative » (sharing economy en anglais) [11]. Et comme nous allons le voir, la génétique s’est aujourd’hui intégrée à ce phénomène global d’économie numérique et participative, en reprenant ses modalités d’organisation et de fonctionnement.

Vers un partage des données génétiques : l’exemple des États-Unis

Vers un partage des données génétiques : l’exemple des États-Unis

Il est important de rappeler que l’émergence du partage des données génétiques est avant tout due à la vague importante d’innovations scientifiques et technologiques qui investit la génétique depuis la moitié des années 2000, au moment même où cette pratique montait en puissance au sein de l’informatique [12]. Une baisse drastique et continue du prix et du temps du séquençage permet aujourd’hui le décryptage des génomes d’un très grand nombre d’individus en un temps réduit. Mais aux prémices de cette révolution, on parlait encore de « publication » et non de « partage » des données génétiques. Le mot « partage » fait son apparition avec le Personal Genome Project (PGP), aux États-Unis, défini par son fondateur le généticien américain Georges Church comme la suite du Projet Génome Humain qui avait permis d’aboutir au premier séquençage complet du génome humain [13].

L’objectif premier du PGP était de recruter une cohorte importante de participants prêts à rendre leur génome public sur internet. Le sens du mot partage, ici, semble donc se rapprocher du plus commun : celui d’une distribution consciente de données relatives aux participants par les participants, en particulier leur ADN, mais avec une réciprocité et obligation mutuelle, au moins indirecte, attendues. En effet, les objectifs de ce projet étaient multiples, mais les principaux étaient, selon leurs mots, le « progrès scientifiques » et le « bien du plus grand nombre » [14], soit un « bien commun » où le participant s’intègre également.

Ainsi, dans le cas du PGP, la participation des volontaires fait de celui-ci un exemple de revendication des bienfaits d’un partage quasi « altruiste », qui correspondrait à un « bien commun » qui serait au final recherché. Pourtant, cette idée de la recherche et du partage, peut-être quelque peu idéalisée dans le cas présent, ne saurait être dissociée désormais d’une autre idée, celle d’envisager sa santé comme un véritable capital qu’il faudrait connaître, valoriser et/ou défendre. C’est, en partie [15], en suivant cette seconde idée [16], que des nouvelles entreprises privées, ou biotechs, ont vu le jour entre 2007 et 2008, comme Navigenics et Pathway Genetics. Le plus célèbre reste probablement 23andMe comptabilisant aujourd’hui plusieurs millions de « participants » [17, 20] (→).

(→) Voir la Chronique génomique de B. Jordan, m/s n° 4, avril 2015, page 447

Au départ, l’offre de service de 23andMe ressemblait à celle d’un test génétique relatif à la santé et à l’ancestralité, en vente directement sur internet pour n’importe qui, sans l’intermédiaire d’un médecin et l’obligation d’une prescription médicale. C’est ce qui fut appelé le « direct-to-consumer ». En réalité, il s’agissait d’un « two-sided-market » ou « plateforme biface » [1]. Sur sa première face, l’entreprise a collecté et collecte toujours auprès du consommateur, quel qu’il soit, grâce à Internet, des échantillons biologiques et des données personnelles via l’offre d’un test génétique à un prix particulièrement attractif. Mais, sur sa seconde face, ceci lui a permis de créer une biobanque (lieu de stockage des échantillons biologiques) ainsi qu’une base de données (lieu de stockage des données issues du séquençage, entre autres) considérable pour être valorisée (en termes d’usage et d’échange) auprès de la recherche et de l’industrie.

Aujourd’hui, 23andMe a commercialisé plusieurs millions de tests [17] et baissé significativement son prix depuis sa création en 2006. Le test coûtait environ 1 000 dollars à son arrivée sur le marché, et coûte aujourd’hui moins de 100 dollars. Une vente qui semble, au moins sur les premières années, avoir été quasiment à perte si on tient compte du prix de la puce à ADN utilisée et du prix de l’analyse. Mais cette perte a été soutenue par les quatre premières levées de fond, estimées à plus d’une centaine de millions de dollars, et l'appartenance au consortium Global screening array, dont la seule structure française à en faire partie est le Centre national de recherche en génomique humaine (CNRGH). Cette perte et ces investissements s’expliquent par le fait que les bénéfices espérés ne concernaient évidemment pas la commercialisation d’un test, mais l’usage des données stockées et transformées en informations valorisables auprès de la recherche et de l’industrie [1].

Pour cela, l’entreprise a dû aussi parfaitement intégrer, au moins sur sa première face, et de façon systématique, les outils et les techniques du « social web ». 23andMe est devenu alors une sorte de « Facebook de l’ADN » où les usagers font circuler eux-mêmes leurs données génétiques en y ajoutant différentes données personnelles. Ce n’est d’ailleurs pas un hasard si Google fut l’un de ses principaux et premiers investisseurs [1], et que désormais toute l’industrie du numérique cherche à investir dans la production, l’analyse et le stockage des données de santé [18]. À noter d’ailleurs que les données génétiques produites entre autres par 23andMe intéressent aujourd’hui le PGP en proposant aux usagers de la biotech de partager leurs données génétiques².

Ainsi, avec ces entreprises, le partage semble avoir aussi différentes significations. Tout d’abord, le partage semble malgré tout signifier un échange d’échantillons biologiques associés à différentes données personnelles qui concernent, le plus souvent, l’ancestralité et la généalogie familiale plus que la santé contre l’obtention de différentes informations, l’accès à un réseau et différents services numériques. En même temps, il semble également signifier une mise en commun d’échantillons biologiques et de données personnelles, génétiques et de santé, qui est alors présentée par l’entreprise comme une action essentielle nécessaire à l’accélération du progrès scientifique biomédical. Cette dernière forme de partage ressemble à celle du PGP, sauf que la biobanque et la base de données de 23andMe ne sont pas en accès libre (open access) comme celle du PGP. Celles-ci sont protégées en termes de confidentialité et gérées par l’entreprise selon une logique proche de celle du « propriétaire » (le droit de jouir et de disposer des choses de manière absolue). La seconde signification du mot partage (« échange commercial »), particulière aux nouveaux réseaux numériques privés, semble mieux convenir pour ces entreprises que la première. Il semble s’agir davantage d’une distribution, d’un droit d’accès, ou d’un paiement plus ou moins conscient par l’usager avec ses propres échantillons biologiques et données personnelles. Ceci permet à ce dernier d’obtenir l’accès à un réseau numérique comprenant de nombreuses informations à un prix très bas, notamment celles le concernant (santé, ancestralité).

Soulignons que d’autres plateformes d’origine nord-américaine, plus ou moins privées, existent en reprenant une organisation similaire à celle de 23andMe, mais en proposant d’autres modalités de fonctionnement. La caractéristique la plus remarquable de ces autres plateformes est qu’elles ne sont pas propriétaires de la biobanque et/ou de la base de données. Certaines d’entre elles prônent alors un accès total et bilatéral à la base de données, comme SNPedia ou OpenHumans ; d’autres souhaitent un accès conditionnel mais contrôlé par les usagers eux-mêmes [19]. Mais il semble difficile de parler de tendance, ou du moins, pour l’instant, de tendance réellement efficace.

Vers un partage des données génétiques : l’exemple des États-Unis

Perspectives et enjeux pour l’Europe et la France

L’Europe n’est pas en reste sur cette question du partage des données génétiques. Elle séduit la majorité des pays européens, dont la France, mais davantage au sens d’une mise en commun d’échantillons biologiques et de données personnelles, génétiques et de santé pour favoriser l’accélération du progrès scientifique biomédical. Cette valeur d’échange, ou marchande, que le « nouveau monde » libéral nord-américain semble vouloir désormais conférer à la donnée génétique est, elle, bien loin de faire l’unanimité dans l’« ancien monde » européen, et encore moins en France, que ce soit au niveau de la communauté scientifique ou de la société en général.

Les États européens et l’Union européenne ont du mal à statuer d’une voix unique sur cette question épineuse du partage des données génétiques et surtout sur cette valeur d’échange potentiellement attribuable aux données génétiques. En France, s’il n’existe pas de lois réglant expressément cette question, la combinaison de plusieurs textes forme un cadre réglementaire très strict pour cette activité. L’offre de 23andMe est d’ailleurs interdite en France et pénalement répréhensible. L’accès à ses propres données génétiques est autorisé uniquement dans le cadre du soin et de la recherche, en présence au moins d’un médecin et d’un laboratoire agréé par les instances réglementaires requises selon le cadre (agence de biomédecine, comité de protection de personnes, Commission nationale de l‘informatique et des libertés, etc.). Ceci n’est pas le cas de 23andMe, et d’autres biotechs similaires. Rappelons que 23andMe a pu s’implanter en Europe au Royaume-Uni, mais aussi au Danemark, en Finlande, aux Pays-Bas, en Irlande et en Suède, qui font partie de l’Union Européenne, ce qui montre la difficulté d’une homogénéisation européenne vis-à-vis des données génétiques.

C’est dans ce cadre que le Plan France Médecine Génomique 2025 a été lancé officiellement en juin 2016 par le gouvernement Valls³. Ses objectifs sont multiples. Et si le premier est évidemment d’améliorer l’accès au diagnostic génétique dans le cadre du soin en France via uniquement des structures agréées par les instances réglementaires impliquées, le second est probablement de renforcer la centralisation de la production des données génétiques au niveau de ces structures. Ceci permettrait à l’État de garder, directement ou indirectement, le contrôle de cette production, mais aussi des modalités d’usage des données produites, en particulier vis-à-vis de la recherche et de l’industrie. Le partage semble signifier ici une mise en commun des données génétiques à la fois pour le bénéfice de l’individu (valorisation clinique) et celui de la société (valorisation scientifique et économique).

Dans ce modèle, un danger pourrait venir du participant lui-même. En France, avec ou non l’accord d’un médecin, le participant a le droit d’accéder à la totalité de ses données générées dans le cadre du soin, dont ses données génétiques. Dans ce contexte, il sera tenté de fournir ses données génétiques à ces entreprises privées pour obtenir des informations d’ancestralité, des prédispositions ludiques ou médicales (non validées en France) ou même des bons d’achat Amazon. Ainsi, même si cela est pénalement répréhensible en France, il sera très difficile de l’empêcher de les transmettre, via Internet, à des plateformes bifaces pour transformer ses données génétiques en différentes informations, et donc de permettre leur valorisation scientifique et économique ailleurs qu’en France.

À ce stade de réflexion, il est essentiel d’aborder une autre idée : derrière la question épineuse du partage des données génétiques, se cache celle, tout aussi épineuse, de la propriété des données génétiques. En effet, les modalités de production et d’usage d’un bien ou d’un service, qu’il soit matériel ou non, sont difficilement dissociables du droit de la propriété. La problématique se complexifie encore lorsqu’il s’agit d’une donnée issue du corps humain, ce qui est le cas des données génétiques, lesquelles font l’objet d’une protection particulière en droit. Cette question de la propriété des données génétiques est loin d’être parfaitement traitée par le droit. Pourtant, l’exemple de 23andMe, du moins de sa partie biotech nord-américaine, montre que la génétique tend elle aussi à reprendre les modalités d’organisation et de fonctionnement de cette économie numérique (bien que la production particulière de données génétiques reste pour l’instant centralisée). La donnée génétique tend à devenir un bien échangeable ou partageable et l’une des matières premières d’une nouvelle économie numérique libérale et mondiale.

Il est possible d’ignorer le fait que la donnée génétique possède aujourd’hui une valeur d’échange non négligeable, que le droit la considère ou non comme un bien. Pourtant, il nous semble plus difficile d’ignorer le fait que de nombreuses personnes soient aujourd’hui prêtes à payer cher, que ce soit en termes d’argent ou de données, pour obtenir l’accès et l’usage d’un réseau numérique riche en informations relatives à leur santé. Et surtout, il est très difficile d’ignorer le fait que, parallèlement, des structures constituent des stocks de données génétiques considérables nécessaires à une production d’informations de grande valeur, dont les bénéfices vont évidemment directement à ces structures, et indirectement aussi aux états où elles se trouvent.

À l’ère de l’économie numérique, qu’on le veuille ou non, le partage des données est devenu synonyme d’échange commercial, et la donnée génétique synonyme de capital.

Liens d’intérêt

Les auteurs déclarent n’avoir aucun lien d’intérêt concernant les données publiées dans cet article.

Footnotes

¹ En anglais, Sharing. Voir par exemple : https://www.23andme.com/about/individual-data-consent/

² Voir : https://pgp.med.harvard.edu/donate/

³ AVIESAN, Plan France Médecine Génomique 2025, 2016.

Vers un partage des données génétiques : l’exemple des États-Unis