Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Merci d'avoir visité Nature.com. La version du navigateur que vous utilisez a une prise en charge CSS limitée. Pour les meilleurs résultats, nous vous recommandons d'utiliser une version plus récente de votre navigateur (ou de désactiver le mode de compatibilité dans Internet Explorer). En attendant, pour assurer un support continu, nous montrons le site sans style ni javascript.
Les dents sont considérées comme l'indicateur le plus précis de l'âge du corps humain et sont souvent utilisés dans l'évaluation de l'âge médico-légal. Nous avons visé à valider les estimations de l'âge dentaire basées sur les données en comparant la précision d'estimation et les performances de classification du seuil de 18 ans avec des méthodes traditionnelles et des estimations d'âge basées sur l'exploration de données. Au total, 2657 radiographies panoramiques ont été collectées auprès de citoyens coréens et japonais âgés de 15 à 23 ans. Ils ont été divisés en un ensemble de formation, contenant chacun 900 radiographies coréennes et un ensemble de tests internes contenant 857 radiographies japonaises. Nous avons comparé la précision de la classification et l'efficacité des méthodes traditionnelles avec des ensembles de tests de modèles d'exploration de données. La précision de la méthode traditionnelle sur l'ensemble de tests interne est légèrement supérieure à celle du modèle d'exploration de données, et la différence est petite (erreur absolue moyenne <0,21 ans, erreur carrée moyenne racine <0,24 ans). Les performances de classification pour le seuil de 18 ans sont également similaires entre les méthodes traditionnelles et les modèles d'exploration de données. Ainsi, les méthodes traditionnelles peuvent être remplacées par des modèles d'exploration de données lors de l'exécution de l'évaluation de l'âge médico-légal en utilisant la maturité des deuxième et troisième molaires chez les adolescents coréens et les jeunes adultes.
L'estimation de l'âge dentaire est largement utilisée en médecine médico-légale et en dentisterie pédiatrique. En particulier, en raison de la forte corrélation entre l'âge chronologique et le développement dentaire, l'évaluation de l'âge par stades de développement dentaire est un critère important pour évaluer l'âge des enfants et des adolescents1,2,3. Cependant, pour les jeunes, l'estimation de l'âge dentaire basé sur la maturité dentaire a ses limites car la croissance dentaire est presque terminée, à l'exception des troisième molaires. L'objectif juridique de déterminer l'âge des jeunes et des adolescents est de fournir des estimations précises et des preuves scientifiques de savoir s'ils ont atteint l'âge de la majorité. Dans la pratique médico-légale des adolescents et des jeunes adultes en Corée, l'âge a été estimé à l'aide de la méthode de Lee, et un seuil juridique de 18 ans a été prévu sur la base des données rapportées par Oh et al 5.
L'apprentissage automatique est un type d'intelligence artificielle (IA) qui apprend et classe à plusieurs reprises de grandes quantités de données, résout les problèmes en soi et conduit la programmation de données. L'apprentissage automatique peut découvrir des modèles cachés utiles dans de grands volumes de données6. En revanche, les méthodes classiques, qui sont à forte intensité de main-d'œuvre et qui prennent du temps, peuvent avoir des limites lorsqu'ils traitent de grands volumes de données complexes difficiles à traiter manuellement 7. Par conséquent, de nombreuses études ont été menées récemment à l'aide des dernières technologies informatiques pour minimiser les erreurs humaines et traiter efficacement les données multidimensionnelles8,9,10,11,12. En particulier, l'apprentissage en profondeur a été largement utilisé dans l'analyse des images médicales, et diverses méthodes d'estimation de l'âge en analysant automatiquement les radiographies ont été signalées pour améliorer la précision et l'efficacité de l'estimation de l'âge13,14,15,16,17,18,19,20,20 . Par exemple, Halabi et al 13 ont développé un algorithme d'apprentissage automatique basé sur des réseaux de neurones convolutionnels (CNN) pour estimer l'âge squelettique à l'aide de radiographies des mains des enfants. Cette étude propose un modèle qui applique l'apprentissage automatique aux images médicales et montre que ces méthodes peuvent améliorer la précision du diagnostic. Li et al14 ont estimé l'âge des images de rayons X pelviens en utilisant un CNN d'apprentissage en profondeur et les ont comparés avec les résultats de régression en utilisant l'estimation du stade d'ossification. Ils ont constaté que le modèle CNN d'apprentissage en profondeur montrait la même performance d'estimation de l'âge que le modèle de régression traditionnel. L'étude de Guo et al. [15] a évalué les performances de classification de la tolérance à l'âge de la technologie CNN basée sur des orthophotos dentaires, et les résultats du modèle CNN ont prouvé que les humains ont surpassé ses performances de classification de l'âge.
La plupart des études sur l'estimation de l'âge utilisant l'apprentissage automatique utilisent des méthodes d'apprentissage en profondeur 13,14,15,16,17,18,19,20. L'estimation de l'âge basée sur l'apprentissage en profondeur serait plus précise que les méthodes traditionnelles. Cependant, cette approche offre peu de possibilités de présenter la base scientifique pour les estimations de l'âge, telles que les indicateurs d'âge utilisés dans les estimations. Il existe également un différend juridique sur qui mène les inspections. Par conséquent, l'estimation de l'âge basée sur l'apprentissage en profondeur est difficile à accepter par les autorités administratives et judiciaires. L'exploration de données (DM) est une technique qui peut découvrir non seulement des informations attendues mais également inattendues comme méthode pour découvrir des corrélations utiles entre de grandes quantités de données6,21,22. L'apprentissage automatique est souvent utilisé dans l'exploration de données, et l'exploration de données et l'apprentissage automatique utilisent les mêmes algorithmes clés pour découvrir des modèles dans les données. L'estimation de l'âge utilisant le développement dentaire est basée sur l'évaluation par l'examinateur de la maturité des dents cibles, et cette évaluation est exprimée comme un stade pour chaque dent cible. Le DM peut être utilisé pour analyser la corrélation entre le stade d'évaluation dentaire et l'âge réel et a le potentiel de remplacer l'analyse statistique traditionnelle. Par conséquent, si nous appliquons des techniques DM à l'estimation de l'âge, nous pouvons mettre en œuvre l'apprentissage automatique dans l'estimation de l'âge médico-légal sans se soucier de la responsabilité légale. Plusieurs études comparatives ont été publiées sur des alternatives possibles aux méthodes manuelles traditionnelles utilisées dans la pratique médico-légale et les méthodes basées sur l'EBM pour déterminer l'âge dentaire. Shen et al23 ont montré que le modèle DM est plus précis que la formule traditionnelle de Camers. Galibourg et al24 ont appliqué différentes méthodes DM pour prédire l'âge selon le critère DeMirdjian25 et les résultats ont montré que la méthode DM a surpassé les méthodes DeMirdjian et Willems pour estimer l'âge de la population française.
Pour estimer l'âge dentaire des adolescents coréens et des jeunes adultes, la méthode 4 de Lee est largement utilisée dans la pratique médico-légale coréenne. Cette méthode utilise une analyse statistique traditionnelle (comme la régression multiple) pour examiner la relation entre les sujets coréens et l'âge chronologique. Dans cette étude, les méthodes d'estimation de l'âge obtenues en utilisant des méthodes statistiques traditionnelles sont définies comme des «méthodes traditionnelles». La méthode de Lee est une méthode traditionnelle, et sa précision a été confirmée par Oh et al. 5; Cependant, l'applicabilité de l'estimation de l'âge basée sur le modèle DM dans la pratique médico-légale coréenne est toujours discutable. Notre objectif était de valider scientifiquement l'utilité potentielle de l'estimation de l'âge basée sur le modèle DM. Le but de cette étude était (1) de comparer la précision de deux modèles DM dans l'estimation de l'âge dentaire et (2) de comparer les performances de classification de 7 modèles DM à l'âge de 18 ans avec ceux obtenus en utilisant la maturité des méthodes statistiques traditionnelles de la seconde et troisième molaires dans les deux mâchoires.
Les moyennes et les écarts-types de l'âge chronologique par étape et le type dentaire sont indiqués en ligne dans le tableau supplémentaire S1 (ensemble de formation), le tableau supplémentaire S2 (ensemble de tests internes) et le tableau supplémentaire S3 (ensemble de tests externes). Les valeurs de Kappa pour la fiabilité intra et interobservateur obtenue à partir de l'ensemble de formation étaient respectivement de 0,951 et 0,947. Les valeurs P et les intervalles de confiance à 95% pour les valeurs Kappa sont indiqués dans le tableau supplémentaire en ligne S4. La valeur Kappa a été interprétée comme «presque parfaite», conformément aux critères de Landis et Koch26.
En comparant l'erreur absolue moyenne (MAE), la méthode traditionnelle surpasse légèrement le modèle DM pour tous les sexes et dans l'ensemble de tests masculins externe, à l'exception du perceptron multicouche (MLP). La différence entre le modèle traditionnel et le modèle DM sur l'ensemble de tests MAE interne était de 0,12 à 0,19 ans pour les hommes et de 0,17 à 0,21 ans pour les femmes. Pour la batterie de test externe, les différences sont plus petites (0,001–0,05 ans pour les hommes et 0,05–0,09 ans pour les femmes). De plus, l'erreur quadratique moyenne (RMSE) est légèrement inférieure à la méthode traditionnelle, avec des différences plus petites (0,17–0,24, 0,2–0,24 pour l'ensemble de tests internes masculins et 0,03–0,07, 0,04–0,08 pour le jeu de test externe). ). Le MLP montre des performances légèrement meilleures que le perceptron à couche unique (SLP), sauf dans le cas de l'ensemble de tests externes féminins. Pour MAE et RMSE, l'ensemble de tests externes score supérieur à l'ensemble de tests interne pour tous les genres et modèles. Tous les MAE et RMSE sont présentés dans les tableaux 1 et 1.
MAE et RMSE des modèles de régression traditionnelle et d'exploration de données. Erreur absolue moyenne MAE, Root Mean Square Erreur RMSE, Perceptron SLP à couche unique, Perceptron MLP multicouche, méthode CM traditionnelle.
Les performances de classification (avec une coupure de 18 ans) des modèles traditionnelles et DM ont été démontrées en termes de sensibilité, de spécificité, de valeur prédictive positive (PPV), de valeur prédictive négative (VAN) et de zone sous la courbe caractéristique de fonctionnement du récepteur (AUROC) 27 (tableau 2, figure 2 et figure supplémentaire 1 en ligne). En termes de sensibilité de la batterie de test interne, les méthodes traditionnelles fonctionnaient mieux chez les hommes et pire chez les femmes. Cependant, la différence de performance de classification entre les méthodes traditionnelles et SD est de 9,7% pour les hommes (MLP) et seulement 2,4% pour les femmes (XGBOost). Parmi les modèles DM, la régression logistique (LR) a montré une meilleure sensibilité chez les deux sexes. En ce qui concerne la spécificité de l'ensemble de tests internes, il a été observé que les quatre modèles SD fonctionnaient bien chez les hommes, tandis que le modèle traditionnel fonctionnait mieux chez les femmes. Les différences de performance de classification pour les hommes et les femmes sont respectivement de 13,3% (MLP) et de 13,1% (MLP), ce qui indique que la différence de performance de classification entre les modèles dépasse la sensibilité. Parmi les modèles DM, les modèles de machine à vecteur de support (SVM), d'arbre de décision (DT) et de forêt aléatoire (RF) ont fonctionné le mieux chez les hommes, tandis que le modèle LR a obtenu le mieux chez les femmes. L'Auroc du modèle traditionnel et de tous les modèles SD était supérieur à 0,925 (voisin K-Dearest (KNN) chez les hommes), démontrant d'excellentes performances de classification dans la discrimination des échantillons de 18 ans28. Pour l'ensemble de tests externes, il y a eu une diminution des performances de classification en termes de sensibilité, de spécificité et d'AUROC par rapport à l'ensemble de test interne. De plus, la différence de sensibilité et de spécificité entre les performances de classification des meilleurs et pires modèles variait de 10% à 25% et était plus grande que la différence dans l'ensemble de tests interne.
Sensibilité et spécificité des modèles de classification de l'exploration de données par rapport aux méthodes traditionnelles avec un seuil de 18 ans. KNN K VIENTAIR LEST LIVENCE, MACHINE VECTIONNELLE DE SUPPORT SVM, Régression logistique LR, arbre de décision DT, RF Random Forest, XGB XGBOost, MLP Multicouche Perceptron, Méthode CM traditionnelle.
La première étape de cette étude a été de comparer la précision des estimations de l'âge dentaire obtenues à partir de sept modèles DM avec ceux obtenus en utilisant la régression traditionnelle. MAE et RMSE ont été évalués dans des ensembles de tests internes pour les deux sexes, et la différence entre la méthode traditionnelle et le modèle DM variait de 44 à 77 jours pour MAE et de 62 à 88 jours pour le RMSE. Bien que la méthode traditionnelle soit légèrement plus précise dans cette étude, il est difficile de conclure si une si petite différence a une signification clinique ou pratique. Ces résultats indiquent que la précision de l'estimation de l'âge dentaire utilisant le modèle DM est presque la même que celle de la méthode traditionnelle. La comparaison directe avec les résultats des études précédentes est difficile car aucune étude n'a comparé la précision des modèles DM avec des méthodes statistiques traditionnelles en utilisant la même technique d'enregistrement des dents dans la même tranche d'âge que dans cette étude. Galibourg et al24 ont comparé MAE et RMSE entre deux méthodes traditionnelles (Demirjian Method25 et Willems Method29) et 10 modèles DM dans une population française âgée de 2 à 24 ans. Ils ont indiqué que tous les modèles DM étaient plus précis que les méthodes traditionnelles, avec des différences de 0,20 et 0,38 ans dans MAE et 0,25 et 0,47 ans en RMSE par rapport aux méthodes Willems et DeMirdjian, respectivement. L'écart entre le modèle SD et les méthodes traditionnelles montrées dans l'étude de Halibourg prend en compte de nombreux rapports30,31,32,33 selon lesquels la méthode DeMirdjian n'estime pas avec précision l'âge dentaire dans les populations autres que les Canadiens français sur lesquels l'étude était fondée. dans cette étude. Tai et al 34 ont utilisé l'algorithme MLP pour prédire l'âge dentaire à partir de 1636 photographies orthodontiques chinoises et ont comparé sa précision avec les résultats de la méthode Demirjian et Willems. Ils ont indiqué que le MLP a une précision plus élevée que les méthodes traditionnelles. La différence entre la méthode DeMirdjian et la méthode traditionnelle est <0,32 ans, et la méthode Willems est de 0,28 ans, ce qui est similaire aux résultats de la présente étude. Les résultats de ces études précédentes24,34 sont également cohérents avec les résultats de la présente étude, et la précision d'estimation de l'âge du modèle DM et de la méthode traditionnelle est similaire. Cependant, sur la base des résultats présentés, nous ne pouvons que conclure avec prudence que l'utilisation de modèles DM pour estimer l'âge peut remplacer les méthodes existantes en raison du manque d'études précédentes comparatives et de référence. Des études de suivi utilisant des échantillons plus importantes sont nécessaires pour confirmer les résultats obtenus dans cette étude.
Parmi les études testant la précision du SD dans l'estimation de l'âge dentaire, certains ont montré une précision plus élevée que notre étude. Stepanovsky et al 35 ont appliqué 22 modèles SD aux radiographies panoramiques de 976 résidents tchèques âgés de 2,7 à 20,5 ans et ont testé la précision de chaque modèle. Ils ont évalué le développement d'un total de 16 dents permanentes supérieures et inférieures à gauche en utilisant les critères de classification proposés par Moorrees et al 36. Le MAE varie de 0,64 à 0,94 ans et le RMSE varie de 0,85 à 1,27 ans, qui est plus précis que les deux modèles DM utilisés dans cette étude. Shen et al23 ont utilisé la méthode camériere pour estimer l'âge dentaire de sept dents permanentes dans la mandibule gauche chez les résidents chinois orientaux âgés de 5 à 13 ans et l'ont comparé aux âges estimés en utilisant la régression linéaire, SVM et RF. Ils ont montré que les trois modèles DM ont une précision plus élevée par rapport à la formule de camérrie traditionnelle. Le MAE et le RMSE dans l'étude de Shen étaient inférieurs à ceux du modèle DM dans cette étude. La précision accrue des études par Stepanovsky et al. 35 et Shen et al. 23 peut être due à l'inclusion de sujets plus jeunes dans leurs échantillons d'étude. Étant donné que les estimations de l'âge pour les participants avec des dents en développement deviennent plus précises à mesure que le nombre de dents augmente pendant le développement dentaire, la précision de la méthode d'estimation de l'âge résultante peut être compromise lorsque les participants à l'étude sont plus jeunes. De plus, l'erreur de MLP dans l'estimation de l'âge est légèrement plus petite que celle de SLP, ce qui signifie que le MLP est plus précis que SLP. Le MLP est considéré comme légèrement meilleur pour l'estimation de l'âge, peut-être en raison des couches cachées de MLP38. Cependant, il existe une exception pour l'échantillon extérieur de femmes (SLP 1.45, MLP 1.49). La constatation que le MLP est plus précis que le SLP dans l'évaluation de l'âge nécessite des études rétrospectives supplémentaires.
Les performances de classification du modèle DM et la méthode traditionnelle à un seuil de 18 ans ont également été comparées. Tous les modèles SD testés et les méthodes traditionnels de l'ensemble de tests internes ont montré des niveaux de discrimination pratiquement acceptables pour l'échantillon de 18 ans. La sensibilité pour les hommes et les femmes était supérieure à 87,7% et 94,9%, respectivement, et la spécificité était supérieure à 89,3% et 84,7%. L'Auroc de tous les modèles testés dépasse également 0,925. À notre connaissance, aucune étude n'a testé les performances du modèle DM pour la classification de 18 ans basée sur la maturité dentaire. Nous pouvons comparer les résultats de cette étude avec les performances de classification des modèles d'apprentissage en profondeur sur les radiographies panoramiques. Guo et al.15 ont calculé les performances de classification d'un modèle d'apprentissage en profondeur basé sur CNN et une méthode manuelle basée sur la méthode de Demirjian pour un certain seuil d'âge. La sensibilité et la spécificité de la méthode manuelle étaient respectivement de 87,7% et 95,5%, et la sensibilité et la spécificité du modèle CNN ont dépassé 89,2% et 86,6%, respectivement. Ils ont conclu que les modèles d'apprentissage en profondeur peuvent remplacer ou surpasser l'évaluation manuelle dans la classification des seuils d'âge. Les résultats de cette étude ont montré des performances de classification similaires; On pense que la classification à l'aide de modèles DM peut remplacer les méthodes statistiques traditionnelles pour l'estimation de l'âge. Parmi les modèles, DM LR était le meilleur modèle en termes de sensibilité pour l'échantillon masculin, la sensibilité et la spécificité de l'échantillon féminin. LR se classe deuxième en spécificité pour les hommes. De plus, LR est considéré comme l'un des modèles DM35 les plus conviviaux et est moins complexe et difficile à traiter. Sur la base de ces résultats, LR était considéré comme le meilleur modèle de classification de coupure pour les jeunes de 18 ans dans la population coréenne.
Dans l'ensemble, la précision d'estimation de l'âge ou les performances de classification de l'ensemble de tests externes était médiocre ou inférieure par rapport aux résultats de l'ensemble de test interne. Certains rapports indiquent que la précision de la classification ou l'efficacité diminue lorsque des estimations d'âge basées sur la population coréenne sont appliquées à la population japonaise de 5,39, et un schéma similaire a été trouvé dans la présente étude. Cette tendance de détérioration a également été observée dans le modèle DM. Par conséquent, pour estimer avec précision l'âge, même lors de l'utilisation de DM dans le processus d'analyse, les méthodes dérivées des données de population indigène, telles que les méthodes traditionnelles, doivent être préférées 5,39,40,41,42. Étant donné qu'il n'est pas clair si les modèles d'apprentissage en profondeur peuvent montrer des tendances similaires, des études comparant la précision et l'efficacité de la classification en utilisant des méthodes traditionnelles, des modèles DM et des modèles d'apprentissage en profondeur sur les mêmes échantillons pour confirmer si l'intelligence artificielle peut surmonter ces disparités raciales à l'âge limité. Évaluations.
Nous démontrons que les méthodes traditionnelles peuvent être remplacées par l'estimation de l'âge basée sur le modèle DM dans la pratique d'estimation de l'âge médico-légale en Corée. Nous avons également découvert la possibilité de mettre en œuvre l'apprentissage automatique pour l'évaluation de l'âge médico-légal. Cependant, il existe des limites claires, telles que le nombre insuffisant de participants à cette étude pour déterminer définitivement les résultats, et le manque d'études précédentes pour comparer et confirmer les résultats de cette étude. À l'avenir, des études DM devraient être menées avec un plus grand nombre d'échantillons et des populations plus diverses pour améliorer son applicabilité pratique par rapport aux méthodes traditionnelles. Pour valider la faisabilité de l'utilisation de l'intelligence artificielle pour estimer l'âge dans plusieurs populations, de futures études sont nécessaires pour comparer la précision de la classification et l'efficacité des modèles DM et d'apprentissage en profondeur avec des méthodes traditionnelles dans les mêmes échantillons.
L'étude a utilisé 2 657 photographies orthographiques recueillies auprès d'adultes coréens et japonais âgés de 15 à 23 ans. Les radiographies coréennes ont été divisées en 900 ensembles de formation (19,42 ± 2,65 ans) et 900 ensembles de tests internes (19,52 ± 2,59 ans). L'ensemble de formation a été collecté dans une institution (Séoul St. Mary's Hospital), et le propre ensemble de tests a été collecté dans deux établissements (Séoul National University Dental Hospital et Yonsei University Dental Hospital). Nous avons également collecté 857 radiographies à partir d'une autre population de données (Iwate Medical University, Japon) pour des tests externes. Les radiographies des sujets japonais (19,31 ± 2,60 ans) ont été sélectionnées comme ensemble de tests externes. Les données ont été collectées rétrospectivement pour analyser les étapes du développement dentaire sur les radiographies panoramiques prises pendant le traitement dentaire. Toutes les données recueillies étaient anonymes, à l'exception du sexe, de la date de naissance et de la date de radiographie. Les critères d'inclusion et d'exclusion étaient les mêmes que les études publiées précédemment 4, 5. L'âge réel de l'échantillon a été calculé en soustrayant la date de naissance à partir de la date de prise de la radiographie. Le groupe d'échantillons a été divisé en neuf groupes d'âge. Les distributions d'âge et de sexe sont présentées dans le tableau 3 Cette étude a été menée conformément à la déclaration d'Helsinki et approuvée par le Conseil d'examen institutionnel (IRB) de l'hôpital de Séoul St. Mary de l'Université catholique de Corée (KC22WISI0328). En raison de la conception rétrospective de cette étude, le consentement éclairé n'a pas pu être obtenu de tous les patients subissant un examen radiographique à des fins thérapeutiques. L'Hôpital de St. Mary de l'Université de Séoul Korea (IRB) a renoncé à l'exigence d'un consentement éclairé.
Les stades de développement des deuxième et troisième molaires bimaxillaires ont été évalués selon les critères DeMircan25. Une seule dent a été sélectionnée si le même type de dent était trouvé sur les côtés gauche et droit de chaque mâchoire. Si les dents homologues des deux côtés étaient à différents stades de développement, la dent avec le stade de développement inférieur a été sélectionnée pour tenir compte de l'incertitude à l'âge estimé. Une centaine de radiographies sélectionnées au hasard de l'ensemble de formation ont été notées par deux observateurs expérimentés pour tester la fiabilité interobservateur après précalibration pour déterminer le stade de la maturité dentaire. La fiabilité intraobservateur a été évaluée deux fois à des intervalles de trois mois par l'observateur principal.
Le sexe et le stade de développement des deuxième et troisième molaires de chaque mâchoire dans l'ensemble d'entraînement ont été estimés par un observateur principal formé avec différents modèles DM, et l'âge réel a été défini comme valeur cible. Les modèles SLP et MLP, qui sont largement utilisés dans l'apprentissage automatique, ont été testés par rapport aux algorithmes de régression. Le modèle DM combine les fonctions linéaires en utilisant les étapes de développement des quatre dents et combine ces données pour estimer l'âge. Le SLP est le réseau neuronal le plus simple et ne contient pas de couches cachées. SLP fonctionne basé sur la transmission de seuil entre les nœuds. Le modèle SLP en régression est mathématiquement similaire à la régression linéaire multiple. Contrairement au modèle SLP, le modèle MLP a plusieurs couches cachées avec des fonctions d'activation non linéaires. Nos expériences ont utilisé une couche cachée avec seulement 20 nœuds cachés avec des fonctions d'activation non linéaire. Utilisez la descente de gradient comme méthode d'optimisation et MAE et RMSE comme fonction de perte pour former notre modèle d'apprentissage automatique. Le modèle de régression le mieux obtenu a été appliqué aux ensembles de tests internes et externes et l'âge des dents a été estimé.
Un algorithme de classification a été développé qui utilise la maturité de quatre dents sur l'ensemble d'entraînement pour prédire si un échantillon a 18 ans ou non. Pour construire le modèle, nous avons dérivé sept algorithmes d'apprentissage automatique de représentation 6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) Xgboost et (7) MLP . LR est l'un des algorithmes de classification les plus utilisés 44. Il s'agit d'un algorithme d'apprentissage supervisé qui utilise la régression pour prédire la probabilité de données appartenant à une certaine catégorie de 0 à 1 et classe les données comme appartenant à une catégorie plus probable basée sur cette probabilité; principalement utilisé pour la classification binaire. KNN est l'un des algorithmes d'apprentissage automatique les plus simples45. Lorsqu'on lui donne de nouvelles données d'entrée, il trouve K données près de l'ensemble existant, puis les classe dans la classe avec la fréquence la plus élevée. Nous avons fixé 3 pour le nombre de voisins considérés (k). SVM est un algorithme qui maximise la distance entre deux classes en utilisant une fonction de noyau pour étendre l'espace linéaire dans un espace non linéaire appelé champs46. Pour ce modèle, nous utilisons Biais = 1, Power = 1 et Gamma = 1 comme hyperparamètres pour le noyau polynomial. DT a été appliqué dans divers domaines en tant qu'algorithme pour diviser un ensemble de données entier en plusieurs sous-groupes en représentant des règles de décision dans une structure d'arbre47. Le modèle est configuré avec un nombre minimum d'enregistrements par nœud de 2 et utilise l'indice Gini comme mesure de la qualité. RF est une méthode d'ensemble qui combine plusieurs DT pour améliorer les performances à l'aide d'une méthode d'agrégation bootstrap qui génère un classificateur faible pour chaque échantillon en dessinant au hasard des échantillons de la même taille plusieurs fois à partir du jeu de données d'origine48. Nous avons utilisé 100 arbres, 10 profondeurs d'arbres, 1 taille minimale de nœud et l'indice de mélange Gini comme critères de séparation des nœuds. La classification des nouvelles données est déterminée par un vote majoritaire. XGBOost est un algorithme qui combine des techniques de renforcement en utilisant une méthode qui prend comme données de formation l'erreur entre les valeurs réelles et prédites du modèle précédent et augmente l'erreur en utilisant les gradients49. Il s'agit d'un algorithme largement utilisé en raison de ses bonnes performances et de ses bonnes efficacité des ressources, ainsi que d'une fiabilité élevée en tant que fonction de correction de sur-ajustement. Le modèle est équipé de 400 roues de support. MLP est un réseau neuronal dans lequel un ou plusieurs perceptrons forment plusieurs couches avec une ou plusieurs couches cachées entre les couches d'entrée et de sortie38. En utilisant cela, vous pouvez effectuer une classification non linéaire où lorsque vous ajoutez une couche d'entrée et obtenez une valeur de résultat, la valeur de résultat prévue est comparée à la valeur de résultat réelle et l'erreur est propagée. Nous avons créé une couche cachée avec 20 neurones cachés dans chaque couche. Chaque modèle que nous avons développé a été appliqué aux ensembles internes et externes pour tester les performances de classification en calculant la sensibilité, la spécificité, le PPV, la VAN et le AUROC. La sensibilité est définie comme le rapport d'un échantillon estimé à 18 ans ou plus à un échantillon estimé à 18 ans ou plus. La spécificité est la proportion d'échantillons de moins de 18 ans et ceux estimés à moins de 18 ans.
Les étapes dentaires évaluées dans l'ensemble de formation ont été converties en stades numériques pour l'analyse statistique. Une régression linéaire et logistique multivariée a été réalisée pour développer des modèles prédictifs pour chaque sexe et dériver des formules de régression qui peuvent être utilisées pour estimer l'âge. Nous avons utilisé ces formules pour estimer l'âge dentaire pour les ensembles de tests internes et externes. Le tableau 4 montre les modèles de régression et de classification utilisés dans cette étude.
La fiabilité intra et interobservateur a été calculée à l'aide de la statistique Kappa de Cohen. Pour tester la précision des modèles de régression DM et traditionnels, nous avons calculé MAE et RMSE en utilisant les âges estimés et réels des ensembles de test internes et externes. Ces erreurs sont couramment utilisées pour évaluer la précision des prédictions du modèle. Plus l'erreur est petite, plus la précision de la prévision est élevée. Comparez le MAE et le RMSE des ensembles de tests internes et externes calculés à l'aide de DM et de régression traditionnelle. Les performances de classification du seuil de 18 ans dans les statistiques traditionnelles ont été évaluées à l'aide d'un tableau d'urgence 2 × 2. La sensibilité calculée, la spécificité, le PPV, la VAN et l'AUROC de l'ensemble de tests ont été comparées aux valeurs mesurées du modèle de classification DM. Les données sont exprimées en moyenne ± écart-type ou nombre (%) en fonction des caractéristiques des données. Les valeurs de P bilatérales <0,05 ont été considérées comme statistiquement significatives. Toutes les analyses statistiques de routine ont été effectuées à l'aide de SAS version 9.4 (SAS Institute, Cary, NC). Le modèle de régression DM a été implémenté dans Python en utilisant KERAS50 2.2.4 Backend et Tensorflow51 1.8.0 spécifiquement pour les opérations mathématiques. Le modèle de classification DM a été mis en œuvre dans l'environnement d'analyse des connaissances Waikato et la plate-forme d'analyse Konstanz Information Miner (KNIME) 4.6.152.
Les auteurs reconnaissent que les données soutenant les conclusions de l'étude peuvent être trouvées dans l'article et les documents supplémentaires. Les ensembles de données générés et / ou analysés au cours de l'étude sont disponibles auprès de l'auteur correspondant sur une demande raisonnable.
Ritz-Timme, S. et al. Évaluation de l'âge: état de l'art pour répondre aux exigences spécifiques de la pratique médico-légale. internationalité. J. Médecine juridique. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., et Olze, A. Statut actuel de l'évaluation de l'âge médico-légal des sujets vivants à des fins de poursuites pénales. Forensics. médecine. Pathologie. 1, 239–246 (2005).
Pan, J. et al. Une méthode modifiée pour évaluer l'âge dentaire des enfants âgés de 5 à 16 ans dans l'est de la Chine. clinique. Enquête orale. 25, 3463–3474 (2021).
Lee, SS etc. Chronologie du développement des deuxième et troisième molaires en Coréen et de son application pour l'évaluation de l'âge médico-légal. internationalité. J. Médecine juridique. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy et Lee, SS Précision de l'estimation de l'âge et de l'estimation du seuil de 18 ans basé sur la maturité des deuxième et troisième molaires en Coréen et en Japonais. PLOS ONE 17, E0271247 (2022).
Kim, JY, et al. L'analyse des données basée sur l'apprentissage machine préopératoire peut prédire le résultat du traitement de la chirurgie du sommeil chez les patients atteints d'AOS. la science. Rapport 11, 14911 (2021).
Han, M. et al. Estimation précise de l'âge de l'apprentissage automatique avec ou sans intervention humaine? internationalité. J. Médecine juridique. 136, 821–831 (2022).
Khan, S. et Shaheen, M. de l'exploration de données à l'exploration de données. J.Information. la science. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. et Shaheen, M. Wisrule: le premier algorithme cognitif pour l'exploitation des règles d'association. J.Information. la science. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. et Abdullah U. Karm: l'exploration de données traditionnelle basée sur des règles d'association contextuelles. calculer. Mat. continuer. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. et Habib M. Détection de similitude sémantique basée sur l'apprentissage en profondeur à l'aide de données texte. informer. technologies. contrôle. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., et Shahin, M. Un système de reconnaissance de l'activité dans les vidéos sportives. multimédia. Outils Applications https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. Défi d'apprentissage automatique RSNA à l'âge des os pédiatriques. Radiologie 290, 498–503 (2019).
Li, Y. et al. Estimation de l'âge médico-légal des radiographies pelviennes utilisant l'apprentissage en profondeur. EURO. radiation. 29, 2322–2329 (2019).
Guo, YC, et al. Classification précise de l'âge à l'aide de méthodes manuelles et de réseaux de neurones convolutionnels profonds à partir d'images de projection orthographique. internationalité. J. Médecine juridique. 135, 1589–1597 (2021).
L'Alabama Dalora et al. Estimation de l'âge osseux en utilisant différentes méthodes d'apprentissage automatique: une revue systématique de la littérature et une méta-analyse. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., et Yang, J. Estimation de l'âge spécifique à la population des Afro-Américains et des Chinois sur la base des volumes de la chambre de la pulpe de premières molaires en utilisant la tomodensitométrie à faisceau conique. internationalité. J. Médecine juridique. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK et OH KS déterminant les groupes d'âge de personnes vivantes utilisant des images basées sur l'intelligence artificielle de premières molaires. la science. Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., et Urschler, M. Estimation automatique de l'âge et classification de l'âge majoritaire à partir de données IRM multivariées. IEEE J. Biomed. Alertes de santé. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. et Li, G. Estimation de l'âge basée sur la segmentation de la chambre pulpaire 3D des premières molaires à partir de tomodensitométrie par faisceau de cône en intégrant l'apprentissage en profondeur et les ensembles de niveaux. internationalité. J. Médecine juridique. 135, 365–373 (2021).
Wu, WT, et al. Exploration de données dans les mégadonnées cliniques: bases de données, étapes et modèles de méthodes communs. Monde. médecine. ressource. 8, 44 (2021).
Yang, J. et al. Introduction aux bases de données médicales et aux technologies d'exploration de données à l'époque du Big Data. J. Avid. Médecine de base. 13, 57–69 (2020).
Shen, S. et al. Méthode de Camerer pour estimer l'âge des dents en utilisant l'apprentissage automatique. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Comparaison de différentes méthodes d'apprentissage automatique pour prédire l'âge dentaire à l'aide de la méthode de stadification DeMirdjian. internationalité. J. Médecine juridique. 135, 665–675 (2021).
DeMirdjian, A., Goldstein, H. et Tanner, JM Un nouveau système pour évaluer l'âge dentaire. renifler. biologie. 45, 211–227 (1973).
Mesures de Landis, Jr et Koch, GG de l'accord d'observateur sur les données catégorielles. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK et Choi HK. Analyse texturale, morphologique et statistique de l'imagerie par résonance magnétique bidimensionnelle à l'aide de techniques d'intelligence artificielle pour la différenciation des tumeurs cérébrales primaires. Informations sur la santé. ressource. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Heure du poste: janvier-04-2024

Validation d'un modèle d'exploration de données contre les méthodes d'estimation de l'âge dentaire traditionnelles chez les adolescents coréens et les jeunes adultes