• nous

Validation d'un modèle d'exploration de données par rapport aux méthodes traditionnelles d'estimation de l'âge dentaire chez les adolescents et jeunes adultes coréens

Merci d'avoir visité Nature.com.La version du navigateur que vous utilisez a une prise en charge CSS limitée.Pour de meilleurs résultats, nous vous recommandons d'utiliser une version plus récente de votre navigateur (ou de désactiver le mode de compatibilité dans Internet Explorer).En attendant, pour garantir un support continu, nous affichons le site sans style ni JavaScript.
Les dents sont considérées comme l’indicateur le plus précis de l’âge du corps humain et sont souvent utilisées dans l’évaluation médico-légale de l’âge.Notre objectif était de valider les estimations de l'âge dentaire basées sur l'exploration de données en comparant la précision de l'estimation et les performances de classification du seuil de 18 ans avec les méthodes traditionnelles et les estimations d'âge basées sur l'exploration de données.Au total, 2 657 radiographies panoramiques ont été recueillies auprès de citoyens coréens et japonais âgés de 15 à 23 ans.Ils ont été divisés en un ensemble de formation contenant chacun 900 radiographies coréennes et un ensemble de tests internes contenant 857 radiographies japonaises.Nous avons comparé la précision et l'efficacité de la classification des méthodes traditionnelles avec des ensembles de tests de modèles d'exploration de données.La précision de la méthode traditionnelle sur l'ensemble de test interne est légèrement supérieure à celle du modèle d'exploration de données, et la différence est faible (erreur absolue moyenne <0,21 ans, erreur quadratique moyenne <0,24 ans).Les performances de classification pour le seuil de 18 ans sont également similaires entre les méthodes traditionnelles et les modèles d'exploration de données.Ainsi, les méthodes traditionnelles peuvent être remplacées par des modèles d’exploration de données lors de l’évaluation médico-légale de l’âge en utilisant la maturité des deuxième et troisième molaires chez les adolescents et jeunes adultes coréens.
L’estimation de l’âge dentaire est largement utilisée en médecine légale et en dentisterie pédiatrique.En particulier, en raison de la forte corrélation entre l'âge chronologique et le développement dentaire, l'évaluation de l'âge par stades de développement dentaire est un critère important pour évaluer l'âge des enfants et des adolescents1,2,3.Cependant, chez les jeunes, l’estimation de l’âge dentaire en fonction de la maturité dentaire présente ses limites car la croissance dentaire est presque complète, à l’exception des troisièmes molaires.L’objectif juridique de la détermination de l’âge des jeunes et des adolescents est de fournir des estimations précises et des preuves scientifiques indiquant s’ils ont atteint l’âge de la majorité.Dans la pratique médico-légale des adolescents et des jeunes adultes en Corée, l'âge a été estimé à l'aide de la méthode de Lee, et un seuil légal de 18 ans a été prédit sur la base des données rapportées par Oh et al 5 .
L'apprentissage automatique est un type d'intelligence artificielle (IA) qui apprend et classe à plusieurs reprises de grandes quantités de données, résout les problèmes par elle-même et pilote la programmation des données.L’apprentissage automatique peut découvrir des modèles cachés utiles dans de grands volumes de données6.En revanche, les méthodes classiques, qui demandent beaucoup de travail et de temps, peuvent présenter des limites lorsqu'il s'agit de traiter de grands volumes de données complexes et difficiles à traiter manuellement7.Par conséquent, de nombreuses études ont été menées récemment en utilisant les dernières technologies informatiques pour minimiser les erreurs humaines et traiter efficacement les données multidimensionnelles8,9,10,11,12.En particulier, l’apprentissage profond a été largement utilisé dans l’analyse d’images médicales, et il a été rapporté que diverses méthodes d’estimation de l’âge par analyse automatique des radiographies amélioraient la précision et l’efficacité de l’estimation de l’âge13,14,15,16,17,18,19,20. .Par exemple, Halabi et al 13 ont développé un algorithme d'apprentissage automatique basé sur des réseaux de neurones convolutifs (CNN) pour estimer l'âge du squelette à l'aide de radiographies des mains d'enfants.Cette étude propose un modèle qui applique l'apprentissage automatique aux images médicales et montre que ces méthodes peuvent améliorer la précision du diagnostic.Li et al14 ont estimé l'âge à partir d'images radiographiques pelviennes à l'aide d'un CNN d'apprentissage profond et les ont comparés aux résultats de régression en utilisant l'estimation du stade d'ossification.Ils ont constaté que le modèle d’apprentissage profond CNN présentait les mêmes performances d’estimation de l’âge que le modèle de régression traditionnel.L'étude de Guo et al. [15] a évalué les performances de classification de tolérance d'âge de la technologie CNN basée sur des orthophotos dentaires, et les résultats du modèle CNN ont prouvé que les humains surpassaient ses performances de classification d'âge.
La plupart des études sur l’estimation de l’âge à l’aide de l’apprentissage automatique utilisent des méthodes d’apprentissage profond13,14,15,16,17,18,19,20.L’estimation de l’âge basée sur l’apprentissage profond serait plus précise que les méthodes traditionnelles.Cependant, cette approche offre peu de possibilités de présenter le fondement scientifique des estimations de l’âge, comme les indicateurs d’âge utilisés dans les estimations.Il existe également un différend juridique quant à savoir qui mène les inspections.Par conséquent, l’estimation de l’âge basée sur le deep learning est difficilement acceptée par les autorités administratives et judiciaires.L'exploration de données (DM) est une technique qui permet de découvrir non seulement des informations attendues mais également inattendues, en tant que méthode permettant de découvrir des corrélations utiles entre de grandes quantités de données6,21,22.L'apprentissage automatique est souvent utilisé dans l'exploration de données, et l'exploration de données et l'apprentissage automatique utilisent les mêmes algorithmes clés pour découvrir des modèles dans les données.L'estimation de l'âge à l'aide du développement dentaire est basée sur l'évaluation par l'examinateur de la maturité des dents cibles, et cette évaluation est exprimée sous forme d'étape pour chaque dent cible.Le DM peut être utilisé pour analyser la corrélation entre le stade de l’évaluation dentaire et l’âge réel et a le potentiel de remplacer l’analyse statistique traditionnelle.Par conséquent, si nous appliquons les techniques DM à l’estimation de l’âge, nous pouvons mettre en œuvre l’apprentissage automatique dans l’estimation médico-légale de l’âge sans nous soucier de la responsabilité juridique.Plusieurs études comparatives ont été publiées sur les alternatives possibles aux méthodes manuelles traditionnelles utilisées dans la pratique médico-légale et aux méthodes basées sur l'EBM pour déterminer l'âge dentaire.Shen et al23 ont montré que le modèle DM est plus précis que la formule traditionnelle de Camerer.Galibourg et al24 ont appliqué différentes méthodes DM pour prédire l'âge selon le critère Demirdjian25 et les résultats ont montré que la méthode DM surpassait les méthodes Demirdjian et Willems pour estimer l'âge de la population française.
Pour estimer l'âge dentaire des adolescents et jeunes adultes coréens, la méthode 4 de Lee est largement utilisée dans la pratique médico-légale coréenne.Cette méthode utilise l'analyse statistique traditionnelle (telle que la régression multiple) pour examiner la relation entre les sujets coréens et l'âge chronologique.Dans cette étude, les méthodes d’estimation de l’âge obtenues à l’aide de méthodes statistiques traditionnelles sont définies comme des « méthodes traditionnelles ».La méthode de Lee est une méthode traditionnelle et son exactitude a été confirmée par Oh et al.5 ;cependant, l’applicabilité de l’estimation de l’âge basée sur le modèle DM dans la pratique médico-légale coréenne reste discutable.Notre objectif était de valider scientifiquement l’utilité potentielle de l’estimation de l’âge basée sur le modèle DM.Le but de cette étude était (1) de comparer l'exactitude de deux modèles DM dans l'estimation de l'âge dentaire et (2) de comparer les performances de classification de 7 modèles DM à l'âge de 18 ans avec celles obtenues à l'aide de méthodes statistiques traditionnelles. et troisièmes molaires des deux mâchoires.
Les moyennes et les écarts types de l'âge chronologique par stade et type de dent sont indiqués en ligne dans le tableau supplémentaire S1 (ensemble de formation), le tableau supplémentaire S2 (ensemble de tests internes) et le tableau supplémentaire S3 (ensemble de tests externes).Les valeurs kappa pour la fiabilité intra- et inter-observateur obtenues à partir de l'ensemble de formation étaient respectivement de 0,951 et 0,947.Les valeurs P et les intervalles de confiance à 95 % pour les valeurs kappa sont présentés dans le tableau supplémentaire en ligne S4.La valeur kappa a été interprétée comme « presque parfaite », conformément aux critères de Landis et Koch26.
Lors de la comparaison de l'erreur absolue moyenne (MAE), la méthode traditionnelle surpasse légèrement le modèle DM pour tous les sexes et dans l'ensemble de tests externes masculins, à l'exception du perceptron multicouche (MLP).La différence entre le modèle traditionnel et le modèle DM sur l'ensemble de tests internes MAE était de 0,12 à 0,19 ans pour les hommes et de 0,17 à 0,21 ans pour les femmes.Pour la batterie de tests externes, les différences sont plus faibles (0,001 à 0,05 ans pour les hommes et 0,05 à 0,09 ans pour les femmes).De plus, l'erreur quadratique moyenne (RMSE) est légèrement inférieure à celle de la méthode traditionnelle, avec des différences plus faibles (0,17 à 0,24, 0,2 à 0,24 pour l'ensemble de test interne masculin et 0,03 à 0,07, 0,04 à 0,08 pour l'ensemble de test externe).).MLP présente des performances légèrement supérieures à celles du Perceptron monocouche (SLP), sauf dans le cas de l'ensemble de test externe femelle.Pour MAE et RMSE, l’ensemble de tests externes obtient des résultats supérieurs à l’ensemble de tests internes pour tous les sexes et tous les modèles.Tous les MAE et RMSE sont présentés dans le tableau 1 et la figure 1.
MAE et RMSE des modèles de régression traditionnels et d'exploration de données.Erreur absolue moyenne MAE, erreur quadratique moyenne RMSE, perceptron monocouche SLP, perceptron multicouche MLP, méthode CM traditionnelle.
Les performances de classification (avec un seuil de 18 ans) des modèles traditionnels et DM ont été démontrées en termes de sensibilité, de spécificité, de valeur prédictive positive (VPP), de valeur prédictive négative (NPV) et d'aire sous la courbe caractéristique de fonctionnement du récepteur (AUROC). 27 (Tableau 2, Figure 2 et Figure supplémentaire 1 en ligne).En termes de sensibilité de la batterie de tests internes, les méthodes traditionnelles ont donné de meilleurs résultats chez les hommes et moins bien chez les femmes.Cependant, la différence de performance de classification entre les méthodes traditionnelles et SD est de 9,7 % pour les hommes (MLP) et de seulement 2,4 % pour les femmes (XGBoost).Parmi les modèles DM, la régression logistique (LR) a montré une meilleure sensibilité chez les deux sexes.En ce qui concerne la spécificité de l’ensemble de tests internes, il a été observé que les quatre modèles SD ont de bons résultats chez les hommes, tandis que le modèle traditionnel a de meilleurs résultats chez les femmes.Les différences de performance de classification pour les hommes et les femmes sont respectivement de 13,3 % (MLP) et 13,1 % (MLP), ce qui indique que la différence de performance de classification entre les modèles dépasse la sensibilité.Parmi les modèles DM, les modèles de machine à vecteurs de support (SVM), d'arbre de décision (DT) et de forêt aléatoire (RF) ont donné les meilleurs résultats chez les hommes, tandis que le modèle LR a donné les meilleurs résultats chez les femmes.L'AUROC du modèle traditionnel et de tous les modèles SD était supérieur à 0,925 (k-voisin le plus proche (KNN) chez les hommes), démontrant d'excellentes performances de classification dans des échantillons discriminants de 18 ans28.Pour l’ensemble de tests externes, il y a eu une diminution des performances de classification en termes de sensibilité, de spécificité et d’AUROC par rapport à l’ensemble de tests internes.De plus, la différence de sensibilité et de spécificité entre les performances de classification des meilleurs et des pires modèles variait de 10 % à 25 % et était supérieure à la différence dans l'ensemble de tests internes.
Sensibilité et spécificité des modèles de classification de data mining par rapport aux méthodes traditionnelles avec un délai de 18 ans.KNN k voisin le plus proche, machine à vecteurs de support SVM, régression logistique LR, arbre de décision DT, forêt aléatoire RF, XGB XGBoost, perceptron multicouche MLP, méthode CM traditionnelle.
La première étape de cette étude consistait à comparer l’exactitude des estimations de l’âge dentaire obtenues à partir de sept modèles DM avec celles obtenues à l’aide de la régression traditionnelle.MAE et RMSE ont été évalués dans des ensembles de tests internes pour les deux sexes, et la différence entre la méthode traditionnelle et le modèle DM variait de 44 à 77 jours pour MAE et de 62 à 88 jours pour RMSE.Bien que la méthode traditionnelle soit légèrement plus précise dans cette étude, il est difficile de déterminer si une si petite différence a une signification clinique ou pratique.Ces résultats indiquent que la précision de l'estimation de l'âge dentaire à l'aide du modèle DM est presque la même que celle de la méthode traditionnelle.La comparaison directe avec les résultats d'études précédentes est difficile car aucune étude n'a comparé la précision des modèles DM avec les méthodes statistiques traditionnelles utilisant la même technique d'enregistrement des dents dans la même tranche d'âge que dans cette étude.Galibourg et al24 ont comparé MAE et RMSE entre deux méthodes traditionnelles (méthode Demirjian25 et méthode Willems29) et 10 modèles DM dans une population française âgée de 2 à 24 ans.Ils ont rapporté que tous les modèles DM étaient plus précis que les méthodes traditionnelles, avec des différences de 0,20 et 0,38 ans pour le MAE et de 0,25 et 0,47 ans pour le RMSE par rapport aux méthodes Willems et Demirdjian, respectivement.L'écart entre le modèle SD et les méthodes traditionnelles montré dans l'étude Halibourg tient compte de nombreux rapports30,31,32,33 selon lesquels la méthode Demirdjian n'estime pas avec précision l'âge dentaire dans les populations autres que les Canadiens français sur lesquels l'étude était basée.dans cette étude.Tai et al 34 ont utilisé l'algorithme MLP pour prédire l'âge des dents à partir de 1 636 photographies orthodontiques chinoises et ont comparé sa précision avec les résultats de la méthode Demirjian et Willems.Ils ont rapporté que la MLP était plus précise que les méthodes traditionnelles.La différence entre la méthode Demirdjian et la méthode traditionnelle est <0,32 an et la méthode Willems est de 0,28 an, ce qui est similaire aux résultats de la présente étude.Les résultats de ces études antérieures24,34 sont également cohérents avec les résultats de la présente étude, et la précision de l'estimation de l'âge du modèle DM et de la méthode traditionnelle est similaire.Cependant, sur la base des résultats présentés, nous ne pouvons que conclure avec prudence que l'utilisation de modèles DM pour estimer l'âge pourrait remplacer les méthodes existantes en raison du manque d'études comparatives et de référence antérieures.Des études de suivi utilisant des échantillons plus grands sont nécessaires pour confirmer les résultats obtenus dans cette étude.
Parmi les études testant la précision de l’écart-type dans l’estimation de l’âge dentaire, certaines ont montré une précision supérieure à celle de notre étude.Stepanovsky et al 35 ont appliqué 22 modèles SD aux radiographies panoramiques de 976 résidents tchèques âgés de 2,7 à 20,5 ans et ont testé la précision de chaque modèle.Ils ont évalué le développement d'un total de 16 dents permanentes supérieures et inférieures gauches en utilisant les critères de classification proposés par Moorrees et al 36 .Le MAE s'étend de 0,64 à 0,94 ans et le RMSE s'étend de 0,85 à 1,27 ans, qui sont plus précis que les deux modèles DM utilisés dans cette étude.Shen et al23 ont utilisé la méthode Camiere pour estimer l'âge dentaire de sept dents permanentes de la mandibule gauche chez les résidents de l'est de la Chine âgés de 5 à 13 ans et l'ont comparé aux âges estimés par régression linéaire, SVM et RF.Ils ont montré que les trois modèles DM ont une précision supérieure à celle de la formule Camiere traditionnelle.Le MAE et le RMSE dans l'étude de Shen étaient inférieurs à ceux du modèle DM de cette étude.La précision accrue des études de Stepanovsky et al.35 et Shen et coll.23 peut être dû à l’inclusion de sujets plus jeunes dans leurs échantillons d’étude.Étant donné que les estimations d’âge des participants ayant des dents en développement deviennent plus précises à mesure que le nombre de dents augmente au cours du développement dentaire, l’exactitude de la méthode d’estimation de l’âge qui en résulte peut être compromise lorsque les participants à l’étude sont plus jeunes.De plus, l'erreur d'estimation de l'âge du MLP est légèrement inférieure à celle du SLP, ce qui signifie que le MLP est plus précis que le SLP.MLP est considéré comme légèrement meilleur pour l’estimation de l’âge, probablement en raison des couches cachées dans MLP38.Il existe cependant une exception pour l’échantillon externe des femmes (SLP 1,45, MLP 1,49).La conclusion selon laquelle le MLP est plus précis que le SLP pour évaluer l'âge nécessite des études rétrospectives supplémentaires.
Les performances de classification du modèle DM et de la méthode traditionnelle à un seuil de 18 ans ont également été comparées.Tous les modèles SD testés et les méthodes traditionnelles sur l'ensemble de tests internes ont montré des niveaux de discrimination pratiquement acceptables pour l'échantillon de 18 ans.La sensibilité pour les hommes et les femmes était supérieure à 87,7 % et 94,9 %, respectivement, et la spécificité était supérieure à 89,3 % et 84,7 %.L'AUROC de tous les modèles testés dépasse également 0,925.À notre connaissance, aucune étude n’a testé les performances du modèle DM pour une classification sur 18 ans basée sur la maturité dentaire.Nous pouvons comparer les résultats de cette étude avec les performances de classification de modèles de deep learning sur des radiographies panoramiques.Guo et al.15 ont calculé les performances de classification d'un modèle d'apprentissage profond basé sur CNN et d'une méthode manuelle basée sur la méthode de Demirjian pour un certain seuil d'âge.La sensibilité et la spécificité de la méthode manuelle étaient respectivement de 87,7 % et 95,5 %, et la sensibilité et la spécificité du modèle CNN dépassaient respectivement 89,2 % et 86,6 %.Ils ont conclu que les modèles d’apprentissage profond peuvent remplacer ou surpasser l’évaluation manuelle dans la classification des seuils d’âge.Les résultats de cette étude ont montré des performances de classification similaires ;On pense que la classification utilisant des modèles DM peut remplacer les méthodes statistiques traditionnelles d’estimation de l’âge.Parmi les modèles, DM LR était le meilleur modèle en termes de sensibilité pour l’échantillon masculin et de sensibilité et spécificité pour l’échantillon féminin.LR se classe au deuxième rang en termes de spécificité pour les hommes.De plus, le LR est considéré comme l’un des modèles DM35 les plus conviviaux et est moins complexe et difficile à traiter.Sur la base de ces résultats, LR a été considéré comme le meilleur modèle de classification seuil pour les jeunes de 18 ans dans la population coréenne.
Dans l’ensemble, la précision de l’estimation de l’âge ou des performances de classification sur l’ensemble de tests externes était faible ou inférieure par rapport aux résultats sur l’ensemble de tests internes.Certains rapports indiquent que l’exactitude ou l’efficacité de la classification diminue lorsque les estimations d’âge basées sur la population coréenne sont appliquées à la population japonaise5,39, et une tendance similaire a été constatée dans la présente étude.Cette tendance à la détérioration a également été observée dans le modèle DM.Par conséquent, pour estimer avec précision l’âge, même en utilisant la DM dans le processus d’analyse, il convient de préférer les méthodes dérivées des données sur la population autochtone, telles que les méthodes traditionnelles5,39,40,41,42.Puisqu’il n’est pas clair si les modèles d’apprentissage profond peuvent montrer des tendances similaires, des études comparant l’exactitude et l’efficacité de la classification à l’aide de méthodes traditionnelles, de modèles DM et de modèles d’apprentissage profond sur les mêmes échantillons sont nécessaires pour confirmer si l’intelligence artificielle peut surmonter ces disparités raciales dans un âge limité.évaluations.
Nous démontrons que les méthodes traditionnelles peuvent être remplacées par une estimation de l'âge basée sur le modèle DM dans la pratique médico-légale de l'estimation de l'âge en Corée.Nous avons également découvert la possibilité de mettre en œuvre l’apprentissage automatique pour l’évaluation médico-légale de l’âge.Cependant, il existe des limites évidentes, telles que le nombre insuffisant de participants à cette étude pour déterminer définitivement les résultats, et le manque d'études antérieures pour comparer et confirmer les résultats de cette étude.À l’avenir, les études DM devraient être menées avec un plus grand nombre d’échantillons et des populations plus diversifiées afin d’améliorer son applicabilité pratique par rapport aux méthodes traditionnelles.Pour valider la faisabilité de l’utilisation de l’intelligence artificielle pour estimer l’âge dans plusieurs populations, de futures études sont nécessaires pour comparer l’exactitude et l’efficacité de la classification des modèles DM et d’apprentissage profond avec les méthodes traditionnelles dans les mêmes échantillons.
L'étude a utilisé 2 657 photographies orthographiques collectées auprès d'adultes coréens et japonais âgés de 15 à 23 ans.Les radiographies coréennes ont été divisées en 900 séries de formation (19,42 ± 2,65 ans) et 900 séries de tests internes (19,52 ± 2,59 ans).L'ensemble de formation a été collecté dans un établissement (l'hôpital St. Mary de Séoul) et le propre ensemble de tests a été collecté dans deux établissements (l'hôpital dentaire de l'université nationale de Séoul et l'hôpital dentaire de l'université Yonsei).Nous avons également collecté 857 radiographies provenant d'autres données basées sur la population (Université médicale d'Iwate, Japon) à des fins de tests externes.Des radiographies de sujets japonais (19,31 ± 2,60 ans) ont été sélectionnées comme ensemble de tests externes.Les données ont été collectées rétrospectivement pour analyser les stades de développement dentaire sur des radiographies panoramiques prises lors d'un traitement dentaire.Toutes les données collectées étaient anonymes à l'exception du sexe, de la date de naissance et de la date de la radiographie.Les critères d'inclusion et d'exclusion étaient les mêmes que ceux des études publiées précédemment 4, 5.L'âge réel de l'échantillon a été calculé en soustrayant la date de naissance de la date de prise de la radiographie.Le groupe échantillon a été divisé en neuf groupes d’âge.Les répartitions par âge et par sexe sont présentées dans le tableau 3. Cette étude a été menée conformément à la Déclaration d'Helsinki et approuvée par le Comité d'examen institutionnel (IRB) de l'hôpital St. Mary de Séoul de l'Université catholique de Corée (KC22WISI0328).En raison de la conception rétrospective de cette étude, le consentement éclairé n'a pas pu être obtenu de tous les patients subissant un examen radiographique à des fins thérapeutiques.L'hôpital St. Mary's (IRB) de l'Université de Corée de Séoul a renoncé à l'exigence de consentement éclairé.
Les stades de développement des deuxième et troisième molaires bimaxillaires ont été évalués selon les critères de Demircan25.Une seule dent était sélectionnée si le même type de dent était trouvé sur les côtés gauche et droit de chaque mâchoire.Si les dents homologues des deux côtés étaient à des stades de développement différents, la dent ayant le stade de développement le plus bas a été sélectionnée pour tenir compte de l'incertitude quant à l'âge estimé.Cent radiographies sélectionnées au hasard dans l'ensemble de formation ont été notées par deux observateurs expérimentés pour tester la fiabilité inter-observateur après précalibrage afin de déterminer le stade de maturité dentaire.La fiabilité intra-observateur a été évaluée deux fois à trois mois d'intervalle par l'observateur principal.
Le sexe et le stade de développement des deuxième et troisième molaires de chaque mâchoire de l'ensemble d'entraînement ont été estimés par un observateur principal formé avec différents modèles DM, et l'âge réel a été défini comme valeur cible.Les modèles SLP et MLP, largement utilisés en apprentissage automatique, ont été testés par rapport à des algorithmes de régression.Le modèle DM combine des fonctions linéaires utilisant les stades de développement des quatre dents et combine ces données pour estimer l'âge.SLP est le réseau neuronal le plus simple et ne contient pas de couches cachées.SLP fonctionne sur la base d'un seuil de transmission entre les nœuds.Le modèle SLP en régression est mathématiquement similaire à la régression linéaire multiple.Contrairement au modèle SLP, le modèle MLP comporte plusieurs couches cachées avec des fonctions d'activation non linéaires.Nos expériences ont utilisé une couche cachée avec seulement 20 nœuds cachés dotés de fonctions d'activation non linéaires.Utilisez la descente de gradient comme méthode d'optimisation et MAE et RMSE comme fonction de perte pour entraîner notre modèle d'apprentissage automatique.Le modèle de régression le mieux obtenu a été appliqué aux ensembles de tests internes et externes et l'âge des dents a été estimé.
Un algorithme de classification a été développé qui utilise la maturité de quatre dents sur l'ensemble d'entraînement pour prédire si un échantillon a 18 ans ou non.Pour construire le modèle, nous avons dérivé sept algorithmes d'apprentissage automatique de représentation6,43 : (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost et (7) MLP. .LR est l’un des algorithmes de classification les plus utilisés44.Il s'agit d'un algorithme d'apprentissage supervisé qui utilise la régression pour prédire la probabilité que les données appartiennent à une certaine catégorie de 0 à 1 et classe les données comme appartenant à une catégorie plus probable en fonction de cette probabilité ;principalement utilisé pour la classification binaire.KNN est l’un des algorithmes d’apprentissage automatique les plus simples45.Lorsqu'on lui donne de nouvelles données d'entrée, il trouve k données proches de l'ensemble existant, puis les classe dans la classe ayant la fréquence la plus élevée.On fixe à 3 le nombre de voisins considérés (k).SVM est un algorithme qui maximise la distance entre deux classes en utilisant une fonction noyau pour étendre l'espace linéaire en un espace non linéaire appelé champs46.Pour ce modèle, nous utilisons biais = 1, puissance = 1 et gamma = 1 comme hyperparamètres pour le noyau polynomial.Le DT a été appliqué dans divers domaines en tant qu'algorithme permettant de diviser un ensemble de données complet en plusieurs sous-groupes en représentant les règles de décision dans une structure arborescente47.Le modèle est configuré avec un nombre minimum d'enregistrements par nœud de 2 et utilise l'index Gini comme mesure de qualité.RF est une méthode d'ensemble qui combine plusieurs DT pour améliorer les performances à l'aide d'une méthode d'agrégation bootstrap qui génère un classificateur faible pour chaque échantillon en tirant au hasard plusieurs fois des échantillons de même taille à partir de l'ensemble de données d'origine48.Nous avons utilisé 100 arbres, 10 profondeurs d'arbres, 1 taille minimale de nœud et l'indice de mélange Gini comme critères de séparation des nœuds.La classification des nouvelles données est déterminée par un vote majoritaire.XGBoost est un algorithme qui combine des techniques de boosting en utilisant une méthode qui prend comme données d'entraînement l'erreur entre les valeurs réelles et prédites du modèle précédent et augmente l'erreur à l'aide de gradients49.Il s'agit d'un algorithme largement utilisé en raison de ses bonnes performances et de son efficacité en ressources, ainsi que de sa grande fiabilité en tant que fonction de correction de surajustement.Le modèle est équipé de 400 roues de support.MLP est un réseau neuronal dans lequel un ou plusieurs perceptrons forment plusieurs couches avec une ou plusieurs couches cachées entre les couches d'entrée et de sortie38.En utilisant cela, vous pouvez effectuer une classification non linéaire où, lorsque vous ajoutez une couche d'entrée et obtenez une valeur de résultat, la valeur de résultat prédite est comparée à la valeur de résultat réelle et l'erreur est propagée.Nous avons créé une couche cachée avec 20 neurones cachés dans chaque couche.Chaque modèle que nous avons développé a été appliqué à des ensembles internes et externes pour tester les performances de classification en calculant la sensibilité, la spécificité, la PPV, la NPV et l'AUROC.La sensibilité est définie comme le rapport entre un échantillon estimé âgé de 18 ans ou plus et un échantillon estimé âgé de 18 ans ou plus.La spécificité est la proportion d'échantillons âgés de moins de 18 ans et de ceux estimés âgés de moins de 18 ans.
Les étapes dentaires évaluées dans l'ensemble de formation ont été converties en étapes numériques pour une analyse statistique.Une régression linéaire et logistique multivariée a été réalisée pour développer des modèles prédictifs pour chaque sexe et dériver des formules de régression pouvant être utilisées pour estimer l'âge.Nous avons utilisé ces formules pour estimer l’âge des dents pour des ensembles de tests internes et externes.Le tableau 4 présente les modèles de régression et de classification utilisés dans cette étude.
La fiabilité intra- et inter-observateur a été calculée à l'aide de la statistique kappa de Cohen.Pour tester l'exactitude du DM et des modèles de régression traditionnels, nous avons calculé le MAE et le RMSE en utilisant les âges estimés et réels des ensembles de tests internes et externes.Ces erreurs sont couramment utilisées pour évaluer l’exactitude des prédictions des modèles.Plus l’erreur est faible, plus la prévision est précise24.Comparez le MAE et le RMSE des ensembles de tests internes et externes calculés à l'aide de DM et de la régression traditionnelle.Les performances de classification au seuil de 18 ans dans les statistiques traditionnelles ont été évaluées à l'aide d'un tableau de contingence 2 × 2.La sensibilité, la spécificité, la PPV, la NPV et l'AUROC calculées de l'ensemble de tests ont été comparées aux valeurs mesurées du modèle de classification DM.Les données sont exprimées en moyenne ± écart type ou en nombre (%) en fonction des caractéristiques des données.Les valeurs P bilatérales <0,05 ont été considérées comme statistiquement significatives.Toutes les analyses statistiques de routine ont été effectuées à l'aide de SAS version 9.4 (SAS Institute, Cary, NC).Le modèle de régression DM a été implémenté en Python à l'aide du backend Keras50 2.2.4 et Tensorflow51 1.8.0 spécifiquement pour les opérations mathématiques.Le modèle de classification DM a été implémenté dans l'environnement d'analyse des connaissances Waikato et la plateforme d'analyse Konstanz Information Miner (KNIME) 4.6.152.
Les auteurs reconnaissent que les données étayant les conclusions de l'étude peuvent être trouvées dans l'article et dans les documents supplémentaires.Les ensembles de données générés et/ou analysés au cours de l'étude sont disponibles auprès de l'auteur correspondant sur demande raisonnable.
Ritz-Timme, S. et coll.Évaluation de l'âge : état de l'art pour répondre aux exigences spécifiques de la pratique médico-légale.internationalité.J. Médecine légale.113, 129-136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. et Olze, A. État actuel de l'évaluation médico-légale de l'âge de sujets vivants à des fins de poursuites pénales.La médecine légale.médecine.Pathologie.1, 239-246 (2005).
Pan, J. et coll.Une méthode modifiée pour évaluer l'âge dentaire des enfants âgés de 5 à 16 ans dans l'est de la Chine.clinique.Enquête orale.25, 3463-3474 (2021).
Lee, SS etc. Chronologie du développement des deuxième et troisième molaires chez les Coréens et son application pour l'évaluation médico-légale de l'âge.internationalité.J. Médecine légale.124, 659-665 (2010).
Oh, S., Kumagai, A., Kim, SY et Lee, SS Précision de l'estimation de l'âge et estimation du seuil de 18 ans basée sur la maturité des deuxième et troisième molaires chez les Coréens et les Japonais.PLoS ONE 17, e0271247 (2022).
Kim, JY et coll.L'analyse des données préopératoires basée sur l'apprentissage automatique peut prédire les résultats du traitement de chirurgie du sommeil chez les patients atteints d'AOS.la science.Rapport 11, 14911 (2021).
Han, M. et coll.Estimation précise de l’âge grâce à l’apprentissage automatique avec ou sans intervention humaine ?internationalité.J. Médecine légale.136, 821-831 (2022).
Khan, S. et Shaheen, M. De l'exploration de données à l'exploration de données.J.Information.la science.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. et Shaheen, M. WisRule : le premier algorithme cognitif pour l'exploration de règles d'association.J.Information.la science.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. et Abdullah U. Karm : Exploration de données traditionnelle basée sur des règles d'association basées sur le contexte.calculer.Mat.continuer.68, 3305-3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. et Habib M. Détection de similarité sémantique basée sur l'apprentissage profond à l'aide de données textuelles.informer.les technologies.contrôle.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. et Shahin, M. Un système de reconnaissance d'activité dans les vidéos sportives.multimédia.Applications d'outils https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et coll.Défi d'apprentissage automatique RSNA dans l'âge osseux pédiatrique.Radiologie 290, 498-503 (2019).
Li, Y. et coll.Estimation médico-légale de l’âge à partir de radiographies pelviennes à l’aide de l’apprentissage profond.EURO.radiation.29, 2322-2329 (2019).
Guo, YC et coll.Classification précise de l'âge à l'aide de méthodes manuelles et de réseaux neuronaux convolutifs profonds à partir d'images de projection orthographique.internationalité.J. Médecine légale.135, 1589-1597 (2021).
Alabama Dalora et coll.Estimation de l’âge osseux à l’aide de différentes méthodes d’apprentissage automatique : une revue systématique de la littérature et une méta-analyse.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. et Yang, J. Estimation de l'âge spécifique à la population des Afro-Américains et des Chinois basée sur les volumes de la chambre pulpaire des premières molaires à l'aide de la tomodensitométrie à faisceau conique.internationalité.J. Médecine légale.136, 811-819 (2022).
Kim S., Lee YH, Noh YK, Park FK et Oh KS Détermination des groupes d'âge de personnes vivantes à l'aide d'images des premières molaires basées sur l'intelligence artificielle.la science.Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. et Urschler, M. Estimation automatique de l'âge et classification de l'âge de la majorité à partir de données IRM multivariées.IEEE J. Biomed.Alertes de santé.23, 1392-1403 (2019).
Cheng, Q., Ge, Z., Du, H. et Li, G. Estimation de l'âge basée sur la segmentation 3D de la chambre pulpaire des premières molaires à partir de la tomodensitométrie à faisceau conique en intégrant l'apprentissage en profondeur et des ensembles de niveaux.internationalité.J. Médecine légale.135, 365-373 (2021).
Wu, WT et coll.Exploration de données dans le big data clinique : bases de données communes, étapes et modèles de méthodes.Monde.médecine.Ressource.8, 44 (2021).
Yang, J. et coll.Introduction aux bases de données médicales et aux technologies d'exploration de données à l'ère du Big Data.J. Avid.Médecine de base.13, 57-69 (2020).
Shen, S. et coll.Méthode de Camerer pour estimer l'âge des dents à l'aide de l'apprentissage automatique.BMC Santé bucco-dentaire 21, 641 (2021).
Galliburg A. et coll.Comparaison de différentes méthodes d'apprentissage automatique pour prédire l'âge dentaire à l'aide de la méthode de stadification Demirdjian.internationalité.J. Médecine légale.135, 665-675 (2021).
Demirdjian, A., Goldstein, H. et Tanner, JM Un nouveau système d'évaluation de l'âge dentaire.renifler.la biologie.45, 211-227 (1973).
Landis, JR et Koch, GG Mesures de l'accord des observateurs sur les données catégorielles.Biométrie 33, 159-174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK et Choi HK.Analyse texturale, morphologique et statistique de l'imagerie par résonance magnétique bidimensionnelle utilisant des techniques d'intelligence artificielle pour la différenciation des tumeurs cérébrales primitives.Information sur la santé.Ressource.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Heure de publication : 04 janvier 2024