Utilisation de modèles d'apprentissage automatique pour prédire l'impact des incompatibilités de modèles sur les performances des tests de réaction en chaîne par polymérase | Rapports scientifiques
MaisonMaison > Nouvelles > Utilisation de modèles d'apprentissage automatique pour prédire l'impact des incompatibilités de modèles sur les performances des tests de réaction en chaîne par polymérase | Rapports scientifiques

Utilisation de modèles d'apprentissage automatique pour prédire l'impact des incompatibilités de modèles sur les performances des tests de réaction en chaîne par polymérase | Rapports scientifiques

Aug 15, 2025

Scientific Reports volume 15, Numéro d'article : 16184 (2025) Citer cet article

Accès 1995

3 Altmetric

Détails des métriques

Les tests moléculaires sont des outils essentiels au diagnostic des maladies infectieuses. Ils se sont révélés extrêmement précieux pendant la pandémie de COVID-19, guidant la prise en charge des patients et les stratégies de contrôle des infections. La transmission soutenue et la prolifération ininterrompue du virus pendant la pandémie ont entraîné l'apparition de nombreux variants présentant des mutations uniques. Certaines de ces mutations pourraient entraîner une érosion de la signature, les tests développés à partir de la séquence génétique d'une version antérieure du pathogène pouvant produire des résultats faussement négatifs lorsqu'ils sont utilisés pour détecter de nouveaux variants. Dans cette étude, nous avons évalué l'évolution des performances de 15 modèles de tests moléculaires confrontés à diverses mutations appartenant à la région ciblée. À partir des données générées par cette étude, nous avons entraîné et évalué les performances de sept modèles d'apprentissage automatique différents afin de prédire si un ensemble spécifique de mutations entraînera une modification significative des performances d'un test spécifique. Le modèle le plus performant a affiché des performances acceptables, avec une sensibilité de 82 % et une spécificité de 87 % lors d'une validation croisée décuplée. Nos résultats ont mis en évidence le potentiel des modèles d'apprentissage automatique pour prédire l'impact des mutations émergentes sur les performances de tests moléculaires spécifiques.

Les tests de détection moléculaire basés sur la réaction en chaîne par polymérase (PCR) sont largement utilisés pour le diagnostic de nombreuses maladies infectieuses1,2. Ces tests détectent la présence de portions uniques du génome des agents pathogènes grâce à une amplification PCR ciblée. Les résultats de ces tests PCR sont utilisés dans les soins aux patients et l'élaboration des politiques de santé publique. La précision de ces tests dépend en grande partie de la conception de l'amorce et de la sonde, car des incompatibilités entre ces deux types de tests peuvent entraîner des résultats faussement négatifs3,4,5,6. Cela est particulièrement vrai pour les tests moléculaires conçus pour la détection de cibles virales présentant des taux de mutation élevés. Par exemple, des résultats faussement négatifs dus à des incompatibilités entre les régions de l'amorce et de la sonde des tests de détection moléculaire basés sur la PCR ont été rapportés pour le SARS-CoV-27,8,9,10,11 et les tests de diagnostic de la grippe12,13.

Grâce aux progrès rapides de la surveillance génomique des maladies infectieuses14,15,16, les responsables de la santé publique et les fabricants de tests sont désormais en mesure de prédire l'émergence de variants spécifiques et des mutations associées qui se situent dans les régions ciblées par les tests de diagnostic PCR16. Cependant, toutes les incompatibilités dans la région amorce-sonde des tests de diagnostic moléculaire ne donnent pas lieu à des résultats faussement négatifs. Des études antérieures ont montré que l'impact des incompatibilités sur les performances des tests dépend de la conception du test et est influencé par des facteurs tels que la conception du modèle, les conditions de cyclage et la composition du tampon17,18. La capacité à prédire avec précision l'impact des incompatibilités sur les performances des tests PCR est nécessaire pour exploiter efficacement les données de surveillance génomique disponibles afin d'identifier les tests PCR présentant un risque de dégradation des performances en raison de mutations émergentes.

Plusieurs études différentes ont été menées par le passé pour caractériser l'impact de différents types de mésappariements sur les performances de la PCR3,4,5,6,19,20,21 par des approches in silico ou expérimentales. Les précédentes évaluations in silico de l'impact des mésappariements sur les tests de diagnostic moléculaire du SARS-CoV-2 se sont concentrées sur l'évaluation basée sur l'alignement19,20,21. D'autres facteurs tels que les conditions de cyclage, la composition du tampon et les types de mutations peuvent également avoir un impact sur l'efficacité de l'amplification par PCR3,4,5,6. D'autres études expérimentales se sont limitées à l'évaluation de l'impact des mésappariements sur la région d'amorce des tests PCR et sont souvent conçues pour évaluer l'impact des substitutions individuelles sur les performances des tests PCR. Comme observé pendant la pandémie de COVID, les mésappariements aux tests de diagnostic moléculaire ne se limitent pas à des substitutions uniques et peuvent survenir à la fois sur les amorces et/ou la sonde des tests de diagnostic moléculaire. De nombreuses évaluations de l'impact des mésappariements sur les performances des tests du SARS-CoV-2 ont été menées9,22,23. Cependant, comme ces études sont souvent réalisées avec des protocoles de test différents, il est très difficile d'exploiter les résultats d'études antérieures pour former des modèles prédictifs généralisables afin d'évaluer l'impact des mutations émergentes sur les performances des tests. Prédire l'impact des mutations émergentes sur les tests diagnostiques est une tâche complexe en raison de la diversité des inadéquations potentielles qui pourraient apparaître au fil du temps et de l'hétérogénéité des données existantes d'évaluation de l'impact des mutations.

Dans cette étude, nous cherchons à évaluer le potentiel d'apprentissage d'un modèle d'apprentissage automatique pour prédire l'impact de mutations spécifiques sur les performances des tests PCR. Un protocole PCR unique a été utilisé pour générer les données d'apprentissage de notre modèle. Nous avons conçu un panel de mutations composé de 228 modèles PCR du SARS-CoV-2, basés sur les séquences d'amorces et de sondes accessibles au public de 15 tests conçus pour amplifier des régions spécifiques du génome du SARS-CoV-2. Ces 228 modèles ont été conçus pour représenter divers types de mésappariements observés pendant la pandémie de COVID-19. Chaque modèle de panel de mutations et les 15 modèles de type sauvage correspondants (sans mésappariement) ont été amplifiés en triple, avec l'amorce et les sondes correspondantes à quatre concentrations différentes. Les valeurs de seuil de cycles (Ct) obtenues pour les modèles de panel de mutations ont été comparées aux valeurs de Ct observées pour le modèle de type sauvage correspondant afin de quantifier l'impact des mutations spécifiques sur les performances des tests PCR. Ces expériences ont généré un vaste ensemble de données quantitatives qui a servi à entraîner plusieurs modèles d'apprentissage automatique afin de prédire l'impact de mutations spécifiques sur les performances des tests. La validation et l'analyse du modèle le plus performant ont permis d'identifier les caractéristiques des mutations ayant le plus d'impact sur les performances des tests et de mettre en évidence les limites et le potentiel de notre approche d'apprentissage.

Français Nous avons suivi périodiquement les performances de 43 tests qPCR du SARS-CoV-2 tout au long de la pandémie à l'aide d'un outil d'analyse in silico appelé PSET (PCR Signature Erosion Tool) par rapport aux séquences du SARS-CoV-2 de la base de données de l'Initiative mondiale pour le partage de toutes les données sur la grippe (GISAID)19. Cet outil a utilisé le pourcentage d'identité entre la séquence de requête (séquences de signature du test comprenant l'amorce, la sonde et la séquence de l'amplicon) et les séquences du sujet de la GISAID pour identifier les mutations émergentes susceptibles de provoquer des résultats faussement négatifs pour les tests de diagnostic.

Sur les 43 tests suivis par PSET, 15 ont été identifiés comme présentant des incompatibilités de variants chevauchants, susceptibles de diminuer les performances selon l'algorithme PSET. Nous avons utilisé ces tests pour cette étude car leur conception couvrait une variété de cibles génétiques, différait par leurs séquences d'amorces/sondes et prenait en compte les considérations de conception de séquences pour la conception de tests qPCR. Nous avons également sélectionné un total de 228 ensembles de mutations uniques, précédemment observés dans la base de données GISAID, pour ces 15 tests. Ces ensembles de mutations ont été sélectionnés pour représenter divers types et caractéristiques de mutations. Ces mutations uniques ont été évaluées dans notre étude à l'aide de matrices d'ARN ou d'ADN synthétiques. La conception des tests et leurs localisations génomiques sont présentées dans le tableau 1.

Pour cette étude, nous avons quantifié l'impact de 228 ensembles de mutations situés dans la région de liaison de l'amorce et/ou de la sonde des 15 cibles d'analyse (tableau 1) sur les performances de la qPCR à l'aide de matrices d'ADN. L'utilisation d'une matrice d'ADN est appropriée à cette étude, car son objectif est de caractériser spécifiquement l'impact des mésappariements au sein de la matrice cible sur l'amplification de la qPCR, et ces mésappariements sont peu susceptibles d'entraver la transcription inverse. Les mutations introduites ont été sélectionnées parmi les mutations du SARS-CoV-2 observées dans la base de données GISAID et conçues pour couvrir un large éventail de types de mutations observés. Les types de matrices de mutation testées dans l'étude sont décrits dans le tableau 2. La position relative des mésappariements au sein de chaque matrice mutée testée dans cette étude est présentée dans la figure 1. Une description détaillée de chaque cible, avec ses séquences d'amorce, de sonde et de matrice, est disponible dans le fichier supplémentaire 1.

Résumé visuel des modèles mutés testés. Chaque ligne représente un modèle muté. Les modèles sont regroupés par localisation et type de modèle de mutation, comme indiqué dans le tableau 2. Les tuiles vertes représentent un alignement parfait avec la séquence amorce/sonde, les tuiles rouges indiquent une substitution à cette position et les tuiles noires indiquent une délétion.

Des modèles mutés et des modèles de type sauvage (témoins positifs) ont été commandés sous forme d'oligonucléotides d'ADN synthétiques (fragments gBlock) auprès d'IDT et comprenaient 20 paires de bases de séquence flanquante à chaque extrémité du modèle. Les modèles ont été testés à quatre concentrations initiales (50, 500, 5 000 et 50 000 copies par réaction) avec 3 réactions répliquées par niveau, ainsi que des témoins sans matrice (NTC) composés d'eau de qualité moléculaire et de témoins positifs (modèles de type sauvage). Un ensemble universel de réactifs et de paramètres de thermocyclage a été utilisé pour tester tous les tests (tableau 1), notamment le TaqPath 1-Step RT-qPCR Master Mix, CG (Thermo Fisher Cat. No. A15299). Les amorces et les sondes (IDT ; PrimeTime™ 5′ 6-FAM™/ZEN™/3′ IB®FQ) ont été incorporées à la réaction à des concentrations finales respectives de 900 nM et 250 nM. Ces concentrations ont été sélectionnées car elles correspondent aux concentrations les plus élevées recommandées par le fabricant pour ce mélange maître et sont donc probablement les plus tolérantes en cas de mésappariements. Le volume réactionnel final était de 20 µL : 15 µL de mélange maître avec 5 µL de matrice ajoutés. Le protocole de thermocyclage utilisé est présenté dans le tableau 3. Ce protocole correspond au protocole recommandé par le fabricant pour ce mélange maître, avec deux modifications : (1) le nombre de cycles a été augmenté de 40 à 50 pour permettre la génération de valeurs Ct pour les modèles avec une efficacité d'amplification sous-optimale en raison de mésappariements ou de délétions, et (2) la température d'hybridation/extension a été réduite de 60 à 55 °C pour être plus tolérante aux mésappariements et refléter la température d'hybridation/extension recommandée pour de nombreux tests publiés évalués.

La PCR a été réalisée sur un instrument de PCR en temps réel Bio-Rad CFX96, et des analyses post-PCR ont été réalisées à l'aide d'un seuil universel pour évaluer les performances de la matrice mutante par rapport à la matrice sauvage. Outre les résultats qualitatifs (détection ou non), les indicateurs de performance quantitatifs évalués comprennent l'efficacité de l'amplification, le coefficient de régression linéaire (R²), l'ordonnée à l'origine et les valeurs moyennes de Ct à chaque concentration de matrice testée.

Français Des oligos d'ADN synthétiques pour les régions modèles CDC N1 et N2 (modèles de type sauvage et mutants) ont été synthétisés par Genscript USA et ont été testés à l'aide d'ensembles d'amorces/sondes N1 et N2 prémélangés provenant de kits de diagnostic IDT 2019-nCoV EUA (1,5 µl pour 20 µl de réaction). L'amplification PCR des modèles CDC N1 et N2 a été réalisée en triple, avec des modifications mineures du temps de fusion et du cycle PCR total (tableau 3).

Pour notre analyse des données et l'apprentissage du modèle, chaque modèle muté est décrit avec 13 variables caractéristiques présentées dans le tableau 4. Ces variables ont été choisies sur la base d'une revue de la littérature afin d'inclure les caractéristiques bien connues des incompatibilités amorce/sonde susceptibles d'avoir un impact sur les performances de la qPCR3,4,5,6,17,21. De plus, comme cette étude incluait des modèles mutés présentant des incompatibilités sur les deux amorces, nous avons également inclus des caractéristiques supplémentaires pour décrire ces incompatibilités multi-amorces (c'est-à-dire les caractéristiques de la deuxième amorce). La représentation des caractéristiques de chaque modèle et les valeurs Ct associées sont incluses dans le fichier supplémentaire 1.

Pour chaque concentration de modèle, la différence de valeur Ct (valeur ΔCt) d'un modèle muté par rapport au modèle de type sauvage est calculée à l'aide de la formule suivante :

Pour chaque concentration de matrice, si une matrice mutée ne produisait pas de résultat de PCR positif ou présentait un ΔCt supérieur à un seuil choisi (ΔCt > 1/3/5), le résultat de PCR de la matrice mutée à cette concentration initiale était étiqueté comme « Pas significativement modifié », sinon, il était étiqueté comme « Significativement modifié ». Si une matrice mutée présentait plus d'un résultat de qPCR « Significativement modifié » parmi les 4 concentrations initiales, cette matrice était étiquetée comme « Significativement modifié ». Un exemple de la manière dont le résultat de PCR de chaque matrice mutée est étiqueté est présenté dans le tableau 5 ci-dessous.

Nous avons appliqué sept algorithmes machine différents (Fig. 3) pour construire sept modèles différents afin de prédire si un modèle serait classé comme « significativement modifié » ou non, en utilisant les 16 caractéristiques décrites dans le Tableau 4 comme données d'entrée. Les données des 228 modèles de mutation ont été utilisées pour l'entraînement et la validation du modèle. La validation croisée avec un seul échantillon à éliminer (LOOCV), la validation croisée décuplée (10FCV) et la validation croisée avec un seul échantillon à éliminer (LOAOCV) ont été utilisées pour estimer les performances du modèle. LOOCV est une configuration de validation croisée k-fold où « k » est défini comme le nombre d'échantillons dans l'ensemble de données. LOAOCV est une configuration de validation croisée où, lors de chaque validation croisée, les modèles de mutation de l'un des 15 plans d'essai ont été exclus de l'entraînement du modèle et utilisés pour la validation. Les performances du modèle ont été évaluées à l'aide de l'aire sous la courbe caractéristique d'exploitation du récepteur (AUROC), de la sensibilité et de la spécificité. Toutes les analyses statistiques ont été réalisées avec les bibliothèques Scientific Python 3.6 (Scikit-Learn 1.4.036).

Les valeurs ΔCt pour chaque matrice mutée ont été calculées pour chaque concentration de matrice. Une valeur ΔCt positive indique une diminution de la sensibilité analytique d'un test qPCR pour la détection de la matrice mutée par rapport au type sauvage (c'est-à-dire qu'il a fallu plus de cycles d'amplification pour que la matrice mutée atteigne le seuil d'intensité de fluorescence pour la détection par rapport au type sauvage). Nous avons calculé un total de (228 matrices mutées) x (4 concentrations de matrice) = 912 valeurs ΔCt. Parmi celles-ci, 34 matrices n'ont pas produit de résultat de détection pour au moins une concentration et ont représenté au total 60 valeurs ΔCt étiquetées « Non détecté ». Dans cette étude, la majorité (96,9 %) des valeurs ΔCt étaient supérieures à -1. Nous avons observé une valeur ΔCt moyenne de 2,70 dans notre étude avec 285 valeurs ΔCt supérieures à 3. La distribution des valeurs ΔCt observées dans cette étude est présentée dans la Fig. 2.

Histogramme des valeurs ΔCt.

Pour évaluer la corrélation entre les types de modèles mutés et les valeurs ΔCt, nous avons calculé les valeurs ΔCt moyennes pour chacun des types de modèles mutés comme décrit dans le tableau 2. Les résultats sont présentés dans le tableau 6.

Nous avons observé que les modèles non-SNP présentent des valeurs ΔCt significativement plus élevées que les modèles SNP, tant pour les amorces que pour la sonde (p < 10–10). De plus, les mutations SNP et non-SNP sur les amorces présentent des valeurs ΔCt significativement plus élevées que ces mêmes types de mutation sur la sonde (p < 10–6). Cependant, le quantile 10 %–90 % des valeurs ΔCt pour chaque type de mutation est généralement très large, allant souvent de valeurs ΔCt négatives à des valeurs ΔCt supérieures à 5, ce qui indique que le type de mutation de la matrice est probablement un mauvais prédicteur de la valeur ΔCt.

Nous avons également calculé la corrélation de Spearman (rho) entre chacune des 16 caractéristiques représentatives des modèles mutés et leurs valeurs ΔCt associées. Ces résultats sont présentés dans le tableau 7.

Aucune de ces caractéristiques n'a montré de forte corrélation (< 0,5 ou > 0,5) avec les valeurs de ΔCt. Sur la base de ces résultats, nous avons émis l'hypothèse que le type de mutation et les caractéristiques individuelles de chaque mutation offrent un pouvoir prédictif limité pour les valeurs de ΔCt, bien qu'ils y soient associés, comme le démontrent les valeurs de p significatives (tableau 7).

Comme nous l'avons observé lors de l'analyse précédente des valeurs ΔCt, seule une minorité des mutations testées a entraîné une non-détection complète de la cible (34 modèles sur 228, soit environ 15 %). La majorité des mutations testées ont plutôt entraîné une augmentation de la valeur Ct. Une valeur ΔCt positive est susceptible d'entraîner une augmentation de la limite de détection du test, et son impact sur les performances cliniques du test dépendrait à la fois de la distribution de la charge virale dans la population infectée et de l'ampleur du ΔCt. Par conséquent, une valeur ΔCt unique permettant de déterminer une modification significative des performances de la qPCR n'est probablement pas représentative des scénarios de tests réels. Pour comprendre l'impact général du type de mutation sur la modification des performances de la qPCR, nous avons déterminé le nombre de modèles de mutation significativement modifiés en fonction de quatre seuils prédéfinis. Les résultats sont présentés dans le tableau 8.

Chaque modèle de mutation a été étiqueté comme « significativement modifié » ou « non significativement modifié » pour chacun des quatre seuils ΔCt : « ND », « ΔCt > 1 ou ND », « ΔCt > 3 ou ND » et « ΔCt > 5 ou ND ». Ces définitions sont utilisées dans la formation et la validation ultérieures de sept modèles d'apprentissage automatique.

Nous avons utilisé la validation croisée décuplée (10FCV) de l'aire sous la courbe des opérandes du récepteur (AUROC) de chaque modèle afin de comparer les performances des sept modèles d'apprentissage supervisé entraînés pour prédire si des mutations spécifiques entraîneront une modification significative de la valeur Ct lors de l'amplification par qPCR. L'AUROC a été calculée pour chaque modèle et chacun des trois seuils de détermination de la modification significative : « ΔCt > 1 ou ND », « ΔCt > 3 ou ND » et « ΔCt > 5 ou ND ». Le seuil « ND » n'a pas été utilisé lors de l'entraînement du modèle en raison du faible nombre de modèles étiquetés comme « modifiés significativement » sous le seuil ND (18). Les résultats sont présentés dans la figure 3.

10FCV AUROC de différents classificateurs avec différents seuils ΔCt (les résultats numériques utilisés pour la Fig. 3 peuvent être trouvés dans le fichier supplémentaire 2).

Le classificateur le plus performant était le classificateur Random Forest, avec une AUROC moyenne de 0,91 pour les trois seuils. Cinq modèles sur sept présentaient l'AUROC la plus élevée avec le seuil « ΔCt > 3 ou ND ». Sur la base de cette observation, nous avons utilisé les résultats du seuil « ΔCt > 3 ou ND » pour une analyse complémentaire de la robustesse du modèle.

La robustesse de nos modèles entraînés a été évaluée en fonction de leur généralisabilité aux mutations invisibles présentes dans les matrices utilisées pour l'entraînement du modèle et aux matrices invisibles. Les performances du classificateur, estimées par la méthode de validation croisée décuplée et la méthode LOOCV (Leave One Out Cross Validation), évaluent la généralisabilité des modèles aux mutations invisibles lorsque la matrice amorce/sonde de base a été utilisée pour l'entraînement du modèle. Les performances du classificateur, estimées par la méthode LOAOCV (Leave One Assay Out Cross Validation), évaluent la généralisabilité des modèles aux séquences de mutations amorce/sonde jamais utilisées par le modèle (Fig. 4). Les résultats de l'analyse de robustesse pour la classification « ΔCt > 3 ou ND » sont présentés dans la figure suivante :

Sensibilité et spécificité des modèles avec différentes approches de validation croisée utilisant le seuil « ΔCt > 3 ou ND ». (Les résultats numériques utilisés pour la figure 4 se trouvent dans le fichier supplémentaire 2).

Les performances du modèle estimées avec les approches 10FCV et LOOCV sont très similaires pour tous les classificateurs évalués. Le classificateur Random Forest (RF) a affiché l'AUROC 10FCV le plus élevé, soit 0,93, avec une sensibilité 10FCV de 85,5 % et une spécificité de 89,1 %.

Français Comparé aux performances estimées avec 10FCV et LOOCV, LOAOCV a produit des performances significativement moins bonnes pour tous les modèles, entraînant une forte baisse de spécificité pour six des sept modèles. Le seul modèle qui n'a pas eu de baisse significative de spécificité LOAOCV (c'est-à-dire Neural Net) a également affiché une forte baisse de sensibilité LOAOCV (~ 60 %). RF a montré une sensibilité LOAOCV de 73,3 % par rapport à la sensibilité 10FCV de 85,5 %. RF a également une spécificité LOAOCV de 72,4 %, ce qui est significativement pire que la spécificité 10FCV de 89,1 %.

Afin d'évaluer si la variation du nombre de modèles disponibles pour chacun des 15 tests inclus dans cette étude pouvait avoir un impact sur les performances spécifiques des modèles entraînés, nous avons calculé la sensibilité et la spécificité spécifiques du modèle de forêt aléatoire entraîné en utilisant le seuil « ΔCt > 3 ou ND ». Les résultats sont présentés dans le tableau 9.

Nous n'avons pas observé de corrélation significative entre le nombre total de modèles pour chaque test et leur sensibilité et spécificité LOOCV/LOAOCV (corrélation de Spearman, p > 0,05). Le test CDC-N2 a montré la plus grande différence de performance du modèle spécifique au test lors de la comparaison des résultats LOOCV et LOAOCV.

Afin de mieux comprendre comment le modèle de forêt aléatoire interprétait les caractéristiques pour faire des prédictions, une analyse de l'importance des caractéristiques a été réalisée pour le modèle de forêt aléatoire entraîné avec le seuil « ΔCt > 3 ou ND ». La valeur de l'importance des caractéristiques a été calculée avec la fonction « feature_importances_ » du package Python « Scikit-Learn »36. L'importance des caractéristiques mesure la contribution de chaque caractéristique identifiée (c'est-à-dire caractéristique) au bon fonctionnement du classificateur. Les résultats sont présentés dans la figure 5.

Importance des caractéristiques du modèle RF pour le seuil « ΔCt > 3 ou ND ».

La majorité des caractéristiques P2 se révèlent peu importantes pour le modèle de forêt aléatoire entraîné avec le seuil « ΔCt > 3 ou ND ». Étant donné que les caractéristiques P2 sont spécifiques aux mésappariements affectant à la fois les amorces directes et inverses et qu'elles sont peu représentées dans nos données d'entraînement (11,4 %, 26/228), nous ne pensons pas que la faible importance des caractéristiques indiquée ici soit révélatrice de l'impact réel des mésappariements P2 sur les performances de la qPCR.

Plusieurs études ont montré que les mésappariements près de l'extrémité 3' des amorces et les mésappariements qui provoqueraient des changements importants de température d'hybridation pourraient être extrêmement préjudiciables à la détection par PCR3,4. Notre étude actuelle a non seulement confirmé ces résultats antérieurs, mais a également amélioré l'évaluation de l'impact des mésappariements sur les performances de la PCR grâce à l'utilisation de modèles d'apprentissage automatique. Notre étude a démontré que des aspects individuels des mésappariements, tels que le nombre de mésappariements près de l'extrémité 3' de l'amorce et le changement estimé de température d'hybridation dû aux mésappariements, sont significativement corrélés à ΔCt. Cependant, la corrélation n'est pas suffisamment forte pour prédire avec précision ΔCt avec des caractéristiques individuelles. Les performances 10FCV de notre modèle entraîné ont démontré le potentiel de prédire avec précision l'impact d'un mésappariement en utilisant plusieurs caractéristiques du mésappariement. Le modèle le plus performant a démontré une sensibilité 10FCV de 85,5 % et une spécificité de 89,1 % pour prédire si un ensemble de mésappariements entraînerait un ΔCt > 3 ou un échec d'amplification.

Dans cette étude, nous avons pu construire plusieurs modèles d'apprentissage automatique pour prédire l'impact de mutations invisibles sur les conceptions d'amorces/sondes utilisées dans le cadre des données d'apprentissage. Les modèles les plus performants ont estimé une sensibilité et une spécificité AUROC > 0,9 et 10FCV supérieures à 85 % pour prédire si un ensemble de mésappariements entraînerait un ΔCt > 3 ou un échec d'amplification. L'analyse de l'importance des caractéristiques du modèle de forêt aléatoire montre que la distance des mésappariements à l'extrémité 3' des amorces et les variations de température d'hybridation dues aux mésappariements dans les amorces et la sonde sont les trois caractéristiques les plus importantes du modèle. Ce résultat concorde avec des recherches antérieures3,4,5,6 et conforte l'hypothèse selon laquelle le modèle fonctionne conformément aux connaissances actuelles sur les mécanismes des réactions de qPCR.

Français Cependant, comme le montre l'étude LOAOCV, les performances des modèles ont diminué de manière significative lors de la validation croisée avec des mésappariements qui se produisent sur des conceptions amorces/sondes non utilisées pour l'apprentissage des modèles. Les modèles les plus performants présentent une sensibilité LOAOCV de 73,3 % et une spécificité de 72,4 %, une diminution importante par rapport à la sensibilité 10FCV de 83,3 % et à la spécificité de 89,1 % pour prédire si un ensemble de mésappariements entraînerait un ΔCt > 3 ou un échec d'amplification. Bien que le nombre de modèles pour chaque test utilisé pour entraîner les modèles soit très variable, nous n'avons pas observé de corrélations significatives entre les données d'apprentissage disponibles pour chaque test et les performances spécifiques du test (Tableau 9). Par conséquent, nous pensons que la différence significative de performance du modèle entre les deux méthodes de validation croisée démontre que la méthodologie d'apprentissage du modèle et la représentation des caractéristiques utilisées dans cette étude sont peu susceptibles d'être généralisables aux conceptions amorces/sondes non observées dans les données d'apprentissage. Nous émettons l'hypothèse que cela est probablement dû au fait que l'impact des mésappariements sur la liaison des amorces et/ou des sondes est à la fois spécifique du nucléotide et de la séquence locale. Autrement dit, les mésappariements aux séquences amorces/sondes ne sont pas pris en compte par les caractéristiques utilisées pour représenter les mésappariements dans la présente étude. Par exemple, dans notre étude, nous avons observé que la mutation C29197G dans la sonde CDC N2 entraînerait un décalage significatif de la valeur Ct (ΔCt > 3), mais pas la mutation C29197T11 qui se produit à la même position (ΔCt < 1). D'autres caractéristiques prenant en compte ces aspects des mésappariements pourraient accroître la généralisabilité de notre méthode prédictive.

Dans cette étude, nous avons également testé deux mutations qui ont été signalées comme étant à l'origine d'échecs de détection dans les tests diagnostiques. Les mutations C29200T et C29197T observées dans la sonde CDC N211 et la mutation G29234A observée dans la sonde japonaise CDC N210. Dans notre étude, aucune de ces mutations n'a entraîné d'échec de détection et ont montré un ΔCt < 2 pour tous les échantillons testés. Nous émettons l'hypothèse que cette différence est probablement due aux différences entre les paramètres de PCR (par exemple, le protocole de cyclage, les composants du mélange maître et les concentrations d'amorces/sondes) utilisés dans notre étude et ceux ayant signalé un échec de détection. Pour la mutation C29200T, l'échec de détection n'a été signalé que pour l'instrument Cepheid Xpert Xpress, et l'échec japonais N a été signalé dans un test utilisant des instruments et des réactifs différents de ceux de notre étude. Cette divergence suggère que l'impact des mésappariements sur l'amplification et la détection de la qPCR est probablement spécifique à l'instrument et au protocole de PCR. Les modèles formés à l’aide de données provenant d’un protocole PCR spécifique peuvent ne pas être généralisables à d’autres instruments ou protocoles PCR.

Sur la base des résultats de notre étude, nous concluons que la représentation des caractéristiques et l'algorithme d'apprentissage du modèle testés dans cette étude sont probablement adaptés à l'apprentissage des modèles pour prédire l'impact de nouvelles incompatibilités sur les conceptions d'amorces et de sondes incluses dans l'apprentissage du modèle. Une approche similaire serait probablement applicable à tous les tests de diagnostic PCR, quel que soit l'organisme ciblé ou le type d'échantillon. Cependant, comme le démontre la forte baisse des performances du modèle lors de l'utilisation du LOAOCV, une nouvelle représentation des caractéristiques des incompatibilités, représentatives de différences nucléotidiques spécifiques et de paramètres PCR, serait probablement nécessaire pour entraîner un modèle généralisable afin de prédire l'impact de nouvelles incompatibilités sur la conception d'amorces et de sondes non utilisées dans l'apprentissage du modèle. Malgré les limites de notre approche de modélisation, elle pourrait néanmoins présenter un avantage en matière de santé publique en prédisant les mutations émergentes les plus susceptibles de provoquer une érosion de la signature dans les tests largement utilisés, en particulier pour les virus à taux de mutation élevé tels que la grippe ou le SARS-CoV-2.

Toutes les données générées ou analysées au cours de cette étude sont incluses dans cet article publié.

Yang, S. et Rothman, RE Diagnostics basés sur la PCR pour les maladies infectieuses : utilisations, limites et applications futures en soins intensifs. Lancet Infect. Dis 4(6), 337–348 (2004).

Article CAS PubMed PubMed Central Google Scholar

Zhu, H. et al. PCR passée, présente et future. Biotechniques 69(4), 317–325 (2020).

Article CAS PubMed Google Scholar

Boyle, B., Dallaire, N. & MacKay, J. Évaluation de l'impact des polymorphismes d'un seul nucléotide et des mésappariements d'amorces sur la PCR quantitative. BMC Biotechnol. 9(1), 1–15 (2009).

Article Google Scholar

Bru, D., Martin-Laurent, F. & Philippot, L. Quantification de l'effet néfaste d'une incompatibilité amorce-matrice unique par PCR en temps réel en utilisant le gène de l'ARNr 16S comme exemple. Appl. Environ. Microbiol. 74(5), 1660–1663 (2008).

Article ADS CAS PubMed PubMed Central Google Scholar

Lefever, S. et al. Les polymorphismes mononucléotidiques et autres mésappariements réduisent les performances des tests PCR quantitatifs. Clin. Chem. 59(10), 1470–1480 (2013).

Article CAS PubMed Google Scholar

Stadhouders, R. et al. L'effet des incompatibilités amorce-matrice sur la détection et la quantification des acides nucléiques à l'aide du test de nucléase 5'. J. Mol. Diagn. 12(1), 109–117 (2010).

Article CAS PubMed PubMed Central Google Scholar

Artesi, M. et al. L'échec du test du gène E cobas® SARS-CoV-2 (Roche) est associé à une transition C vers T à la position 26340 du génome du SARS-CoV-2. MedRxiv (2020).

Rajib, SA et al. Un variant delta du SARS-CoV-2 contenant une mutation dans la région de liaison de la sonde utilisée pour le test RT-qPCR au Japon a présenté une amplification PCR atypique et pourrait induire un résultat faussement négatif. J. Infect. Chemother. 28(5), 669–677 (2022).

Article CAS PubMed PubMed Central Google Scholar

Wollschläger, P. et al. Perte du gène N du SARS-CoV-2 et décalage de la valeur Ct du gène N comme indicateur de la présence de la lignée B.1.1.7. dans un test PCR multiplex commercial. Clin. Microbiol. Infect. 27(9), 1353 (2021).

Article PubMed Central Google Scholar

Ziegler, K. et al. Les échantillons de SARS-CoV-2 peuvent échapper à la détection en raison d'une mutation ponctuelle unique dans le gène N. Eurosurveillance 25(39), 2001650 (2020).

Article PubMed PubMed Central Google Scholar

Miller, S. et al. Des mutations ponctuelles dans le gène N du SARS-CoV-2 ont un impact négatif sur la détection par un test de diagnostic commercial à double cible. Microbiol. Spectr. 9(3), e01494-e1521 (2021).

Article CAS PubMed PubMed Central Google Scholar

Stellrecht, KA La dérive des tests moléculaires pour la grippe : mutations affectant les performances des tests. J. Clin. Microbiol. https://doi.org/10.1128/jcm.01531-17 (2018).

Article PubMed PubMed Central Google Scholar

Landry, ML & Owen, M. L'échec de détection de la grippe A H1N1 souligne la nécessité de cibles génétiques multiples dans les tests moléculaires de la grippe. J. Clin. Microbiol. https://doi.org/10.1128/jcm.00448-23 (2023).

Article PubMed PubMed Central Google Scholar

Chen, Z. et al. Paysage mondial de la surveillance génomique et du partage des données du SARS-CoV-2. Nat. Genet. 54(4), 499–507 (2022).

Article CAS PubMed PubMed Central Google Scholar

Tosta, S. et al. Surveillance génomique mondiale du SARS-CoV-2 : ce que nous avons appris (jusqu'à présent). Infect. Genet. Evol. 108, 105405 (2023).

Article CAS PubMed PubMed Central Google Scholar

Lambrou, AS et al. Surveillance génomique des variants du SARS-CoV-2 : prédominance des variants Delta (B.1.617.2) et Omicron (B.1.1.529) — États-Unis, juin 2021–janvier 2022. Morb. Mortal. Wkly. Rep. 71(6), 206–211. https://doi.org/10.15585/mmwr.mm7106a4 (2022).

Article CAS Google Scholar

Hayden, R. et al. Facteurs contribuant à la variabilité des résultats de la PCR virale quantitative dans les échantillons de tests de compétence : une analyse multivariée. J. Clin. Microbiol. 50(2), 337–345 (2012).

Article CAS PubMed PubMed Central Google Scholar

Benevides Lima, L. et al. Vrai ou faux : quels sont les facteurs qui influencent le diagnostic de la COVID-19 par RT-qPCR ?. Expert Rev. Mol. Diagn. 22(2), 157–167 (2022).

Article CAS PubMed Google Scholar

Negrón, DA et al. Impact des mutations du SARS-CoV-2 sur l'alignement des séquences des tests PCR. Front. Santé publique 10, 889973 (2022).

Article PubMed PubMed Central Google Scholar

Khan, KA & Cheung, P. Présence d'inadéquations entre les tests PCR diagnostiques et le génome du coronavirus SARS-CoV-2. R. Soc. Open Sci. 7(6), 200636 (2020).

Article ADS CAS PubMed PubMed Central Google Scholar

Miranda, P. & Weber, G. Évaluation thermodynamique de l'impact des mésappariements d'ADN dans les amorces et sondes SARS-CoV-2 de type PCR. Mol. Cell. Probes 56, 101707 (2021).

Article CAS PubMed PubMed Central Google Scholar

Laine, P. et al. Variante du SARS-CoV-2 avec mutations du gène N affectant la détection par les amorces PCR largement utilisées. J. Med. Virol. 94(3), 1227–1231 (2022).

Article CAS PubMed Google Scholar

Bozidis, P. et al. Perte inhabituelle du gène N et décalage de la valeur Ct dans les tests PCR multiplex commerciaux causés par une souche mutée du SARS-CoV-2. Diagnostics 12(4), 973 (2022).

Article CAS PubMed PubMed Central Google Scholar

Chan, JF-W. et al. Diagnostic moléculaire amélioré de la COVID-19 grâce au nouveau test PCR de transcription inverse en temps réel COVID-19-RdRp/Hel, hautement sensible et spécifique, validé in vitro et avec des échantillons cliniques. J. Clin. Microbiol. https://doi.org/10.1128/jcm.00310-20 (2020).

Article PubMed PubMed Central Google Scholar

Niu, P. et al. Trois nouveaux tests RT-PCR en temps réel pour la détection du virus COVID-19, Chine. CDC Wkly. 2(25), 453 (2020).

Google Scholar

Pasteur, I., Protocole : Tests RT-PCR en temps réel pour la détection du SARS-CoV-2. 2020, OMS.

Chu, DK et al. Diagnostic moléculaire d'un nouveau coronavirus (2019-nCoV) provoquant une épidémie de pneumonie. Clin. Chimique. 66(4), 549-555 (2020).

Article PubMed PubMed Central Google Scholar

Young, BE et al. Caractéristiques épidémiologiques et évolution clinique des patients infectés par le SARS-CoV-2 à Singapour. JAMA 323(15), 1488–1494 (2020).

Article CAS PubMed PubMed Central Google Scholar

Corman, VM et al. Détection du nouveau coronavirus 2019 (2019-nCoV) par RT-PCR en temps réel. Eurosurveillance 25(3), 2000045 (2020).

Article PubMed PubMed Central Google Scholar

Holland, M., et al. BioLaboro : Un système bioinformatique pour détecter l'érosion de la signature des analyses moléculaires et concevoir de nouvelles analyses en réponse aux agents pathogènes émergents et réémergents. BioRxiv (2020).

Shirato, K. et al. Développement de méthodes de diagnostic génétique pour la détection du nouveau coronavirus 2019 (nCoV-2019) au Japon. Jpn. J. Infect. Dis. 73(4), 304–307 (2020).

Article CAS PubMed Google Scholar

Stanhope, BJ et al. Développement, test et validation d'un panel multiplex du SARS-CoV-2 pour la détection des cinq principaux variants préoccupants sur une plateforme PCR portable. Front. Santé publique 10, 4676 (2022).

Article Google Scholar

Lu, X. et al. Panel de PCR de transcription inverse en temps réel des CDC américains pour la détection du coronavirus 2 du syndrome respiratoire aigu sévère. Emerg. Infect. Dis. 26(8), 1654 (2020).

Article CAS PubMed PubMed Central Google Scholar

Vogels, CB et al. La qPCR multiplexe permet de distinguer les variants préoccupants pour améliorer la surveillance mondiale du SARS-CoV-2. PLoS Biol. 19(5), e3001236 (2021).

Article CAS PubMed PubMed Central Google Scholar

Cock, PJ et al. Biopython : outils Python disponibles gratuitement pour la biologie moléculaire computationnelle et la bioinformatique. Bioinformatics 25(11), 1422 (2009).

Article CAS PubMed PubMed Central Google Scholar

Pedregosa, F. et al. Scikit-learn : apprentissage automatique en Python. J. Mach. Learn. Re-s. 12, 2825–2830 (2011).

MathSciNet Google Scholar

Télécharger les références

Cette étude a été financée par la loi CARES (Coronavirus Aid, Relief, and Economic Security) et menée par le JPEO-CBRND du DOD, en collaboration avec l'Agence de santé de la Défense et le programme scientifique réglementaire de l'Initiative de contre-mesures médicales de la FDA. Non-approbation : Les références à des entités non fédérales ou à des produits commerciaux ne constituent ni n'impliquent une approbation par le ministère de la Défense ou l'armée américaine d'une entreprise, d'un produit ou d'une organisation.

MRIGlobal, 425 Dr. Martin Luther King Jr. Boulevard, Kansas City, MO, 64110, États-Unis

Brittany Knight, Taylor Otwell, Jennifer Stone et Phillip Davis

Laboratoire des agents pathogènes des muqueuses et d'immunologie cellulaire, Division des produits bactériens, parasitaires et allergènes, Bureau de recherche et d'évaluation des vaccins, Évaluation et recherche des produits biologiques, Food and Drug Administration (FDA) des États-Unis, Silver Spring, MD, 20993, États-Unis

Michael P. Coryell et Paul E. Carlson Jr.

Division de microbiologie, Bureau des diagnostics in vitro, Bureau d'évaluation et de qualité des produits, Centre des dispositifs et de la santé radiologique, Food and Drug Administration (FDA) des États-Unis, Silver Spring, MD, 20993, États-Unis

Alyxandria M. Schubert et Yi H. Yan

Bureau d'assurance des produits biologiques de défense (DBPAO), Bureau exécutif du programme conjoint pour la défense chimique, biologique, radiologique et nucléaire (JPEO-CBRND), Chef de projet conjoint, Enabling Biotechnologies JPL-EB, Frederick, MD, 21702, États-Unis

Bryan Necciai et Shanmuga Sozhamannan

Joint Research and Development, Inc., Stafford, VA 22556, États-Unis

Shanmuga Sozhamannan

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

Rechercher l'auteur sur : PubMed Google Scholar

BK, TO et MC ont réalisé les expériences et collecté les données. JS, PC et SS ont contribué à la conceptualisation et à la conception de l'étude. PD a réalisé l'analyse préliminaire nécessaire à la conception de l'étude. BN était responsable de l'obtention du financement. AS a participé à la rédaction et à la révision du manuscrit. YY a supervisé la conception et a participé à la rédaction et à la révision du manuscrit. Tous les auteurs ont révisé l'article.

Correspondance à Yi H. Yan.

Les auteurs ne déclarent aucun conflit d’intérêts.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès. Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support et sous tout format, à condition de citer l'auteur(e) original(e) et la source, de fournir un lien vers la licence Creative Commons et d'indiquer les éventuelles modifications. Les images et autres éléments tiers contenus dans cet article sont inclus dans la licence Creative Commons de l'article, sauf mention contraire dans une ligne de crédit. Si un élément n'est pas inclus dans la licence Creative Commons de l'article et que l'utilisation que vous envisagez n'est pas autorisée par la réglementation ou dépasse les limites autorisées, vous devrez obtenir l'autorisation directement auprès du détenteur des droits d'auteur. Pour consulter une copie de cette licence, rendez-vous sur http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Knight, B., Otwell, T., Coryell, MP et al. Utilisation de modèles d'apprentissage automatique pour prédire l'impact des incompatibilités de matrices sur les performances des tests de PCR. Sci Rep 15, 16184 (2025). https://doi.org/10.1038/s41598-025-98444-8

Télécharger la citation

Reçu : 30 juillet 2024

Accepté : 11 avril 2025

Publié le 9 mai 2025

DOI : https://doi.org/10.1038/s41598-025-98444-8

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt