banner
Maison / Blog / L'apprentissage en profondeur supervisé avec un transformateur de vision prédit le délire à l'aide d'un EEG à plomb limité
Blog

L'apprentissage en profondeur supervisé avec un transformateur de vision prédit le délire à l'aide d'un EEG à plomb limité

Aug 28, 2023Aug 28, 2023

Rapports scientifiques volume 13, Numéro d'article : 7890 (2023) Citer cet article

2420 accès

4 Altmétrique

Détails des métriques

Jusqu'à 80 % des patients gravement malades développent un délire, ce qui augmente le besoin d'institutionnalisation et une morbidité et une mortalité plus élevées. Les cliniciens détectent moins de 40 % des délires lorsqu'ils utilisent un outil de dépistage validé. L'EEG est le critère standard mais nécessite beaucoup de ressources et n'est donc pas réalisable pour une surveillance généralisée du délire. Cette étude a évalué l'utilisation de l'EEG à réponse rapide à dérivation limitée et des méthodes d'apprentissage en profondeur supervisées avec transformateur de vision pour prédire le délire. Cette étude de preuve de concept a utilisé une conception prospective pour évaluer l'utilisation de l'apprentissage en profondeur supervisé avec un transformateur de vision et un dispositif EEG à réponse rapide pour prédire le délire chez les personnes âgées gravement malades ventilées mécaniquement. Quinze modèles différents ont été analysés. En utilisant toutes les données disponibles, les modèles de transformateur de vision ont fourni une formation de plus de 99,9 % et une précision de test de 97 % sur tous les modèles. Le transformateur de vision avec EEG à réponse rapide est capable de prédire le délire. Une telle surveillance est réalisable chez les personnes âgées gravement malades. Par conséquent, cette méthode a un fort potentiel pour améliorer la précision de la détection du délire, offrant une plus grande possibilité d'interventions individualisées. Une telle approche peut raccourcir la durée du séjour à l'hôpital, augmenter le retour à domicile, diminuer la mortalité et réduire le fardeau financier associé au délire.

Le délire est un syndrome aigu qui se manifeste par une modification de la fonction cognitive globale qui comprend soit une pensée désorganisée, soit un niveau de conscience altéré1. Le délire survient chez jusqu'à 80 % des personnes âgées gravement malades et est associé à de moins bons résultats cognitifs à long terme2,3. Depuis plus de 20 ans, au moins 10 organisations nationales et internationales de professionnels de la santé ont inclus le dépistage systématique du délire dans les lignes directrices de pratique clinique4,5,6. Malgré ces recommandations et la disponibilité de plus de 40 outils de dépistage validés, moins de 10 % des cliniciens signalent un dépistage systématique du délire4,7. Dans l'environnement des soins intensifs, de nombreux patients sont incapables de participer au dépistage du délire, comme ceux dans un état comateux ou sous sédation profonde, et ne peuvent donc pas être testés. Même lorsque ces outils sont utilisés, le délire reste difficile à reconnaître et donc souvent sous-diagnostiqué et sous-traité. À mesure que la durée et la gravité du délire augmentent, il devient de plus en plus difficile à traiter. Par conséquent, le délire est associé à une augmentation sur un an du fardeau économique de plus de 44 000 $/patient, ce qui en fait une crise de santé publique mondiale8.

L'électroencéphalogramme (EEG) est un signal représentatif contenant des informations décrivant l'état du cerveau. La forme, l'amplitude et la vitesse d'oscillation des formes d'onde EEG aident à décrire l'état et aident au diagnostic, comme illustré à la Fig. 1. L'utilisation de l'EEG pour la détection du délire a été identifiée pour la première fois dans les années 1940. Romano et Engel ont identifié un ralentissement de l'EEG avec une augmentation du sommeil et une diminution des ondes éveillées en présence de délire9,10. Ainsi, le délire a été identifié de manière fiable en examinant les modifications de l'activité neuronale à l'aide de l'EEG. Malheureusement, le coût important associé à la configuration technologique et la nécessité d'une analyse experte ont empêché l'utilisation de l'EEG pour la détection du délire dans l'environnement clinique11,12.

Notre pipeline de travail.

Étape 1 Extraire des sous-ensembles des données, chaque sous-ensemble a un enregistrement t sec. Divisez ces sous-ensembles en ensemble de formation/test.

Étape 2 Transformez les sous-ensembles en 'images' (*).

Étape 3 Utilisez ces « images » pour alimenter le modèle ViT.

Plus récemment, des appareils EEG portables conviviaux avec une précision d'enregistrement équivalente à l'EEG traditionnel qui sont programmés avec des méthodes analytiques à réponse rapide telles que l'apprentissage automatique sont devenus disponibles13. Ces appareils offrent une configuration rapide par toute personne ayant une formation limitée, fournissant ainsi des données EEG rapides (donc EEG à réponse rapide) en quelques minutes, contrairement à l'EEG traditionnel qui peut prendre jusqu'à une heure à configurer et nécessite un personnel spécialement formé. Pour évaluer les formes d'onde EEG, les paramètres du signal sont extraits et analysés à l'aide d'algorithmes statistiques informatisés. Par exemple, l'analyse de séries chronologiques non linéaires offre un aperçu de la nature dynamique et de la variabilité des signaux cérébraux14. Avec le développement d'un algorithme capable d'une détection prédictive précise, les nouveaux appareils EEG peuvent fournir une méthode physiologique réalisable pour aider les cliniciens à détecter le délire.

La technique d'apprentissage automatique la plus largement utilisée dans la recherche et la pratique actuelles est appelée apprentissage automatique supervisé, où la vérité terrain est connue des chercheurs et est étiquetée dans l'ensemble de données de formation. Des réseaux de neurones profonds sophistiqués sont souvent adoptés et optimisés pour répondre aux besoins de tâches d'apprentissage spécifiques dans des scénarios du monde réel. Bien que l'approche basée sur l'apprentissage en profondeur surpasse souvent les algorithmes d'apprentissage automatique statistique traditionnels en termes de précision de prédiction, sa nature de boîte noire rend souvent le modèle peu pratique à utiliser dans le domaine médical. Des modules supplémentaires sont souvent nécessaires pour aider à expliquer pourquoi ou comment la décision a été prise par les algorithmes d'apprentissage en profondeur.

Le modèle d'apprentissage profond supervisé utilisé dans cette étude était Vision Transformer (ViT)15,16,17. Le modèle ViT a tiré parti de l'architecture de pointe Transformer qui a révolutionné le domaine du traitement du langage naturel (TAL). Il convient de noter que les données EEG sont généralement de nature séquentielle. Par conséquent, les modèles séquentiels, tels que BERT18 et Fractional Dynamics Foster Deep Learning ont souvent été appliqués dans la littérature. Cependant, les données EEG sous forme de tableau comprennent une combinaison d'ondes avec des fréquences variables, ce qui rend les approches séquentielles classiques moins efficaces19. Les données EEG au format d'image d'onde contiennent à la fois des données temporelles et des modèles visuels. En raison de ses performances exceptionnelles dans les problèmes liés à la vision par ordinateur, ViT a été appliqué dans des tâches récentes de classification d'images et des améliorations de performances ont été constatées par rapport aux cadres traditionnels basés sur CNN20. Dans ce travail, nous étudions comment ViT peut être utilisé pour obtenir des renseignements à partir de données EEG. Nous montrons que l'application de ViT au format d'image d'onde dans le domaine temporel est bien meilleure que l'application de ViT dans le domaine fréquentiel.

Pour que le modèle de transformation fonctionne pour les tâches de classification d'images, l'idée principale est de découper une image en une matrice de \(n \fois n\) sous-images. Ces sous-images sont ensuite traitées comme des données séquentielles afin que le mécanisme d'auto-attention puisse être appliqué pour mesurer la relation entre des paires de sous-images. L'avantage de ViT est la capacité de maintenir des informations spatiales ainsi que des informations temporelles. Les données EEG sont séquentielles et ont une relation spatiale, faisant du ViT un modèle idéal pour cette analyse. Cet article décrit comment l'apprentissage automatique utilisant Vision Transformer peut servir de moyen électronique de détection du délire, à un risque minimal et à faible coût.

Il s'agit de la première étude pilote prospective de preuve de concept utilisant un dispositif EEG à réponse rapide fournissant des données de tous les lobes cérébraux, et une méthode d'apprentissage profond supervisé (Vision Transformer) pour évaluer l'EEG pour la présence de délire chez les patients gravement malades.

L'étude (UMCIRB 17-001900 MIND) a été examinée et approuvée par l'East Carolina and Vidant Medical Center Institutional Review Board (UMCIRB) le 13 mars 2018. Un consentement éclairé écrit a été obtenu du représentant légalement autorisé du participant avant toute activité de recherche. Toutes les procédures de recherche ont été menées conformément aux normes éthiques établies par l'UMCIRB IRB et la Déclaration d'Helsinki de 1975.

Le protocole de cette étude a déjà été publié dans RINAH21. En bref, les patients répondant aux critères d'inclusion et d'exclusion ont été recrutés dans trois unités de soins intensifs (unités de soins intensifs cardiaques, médicales et chirurgicales) d'un grand centre médical universitaire rural de Caroline du Nord entre mars 2019 et mars 2020. Tous les participants avaient au moins 50 ans et avaient besoin d'une ventilation mécanique pendant plus de 12 h, anglophones, pour lesquels un consentement éclairé écrit du représentant légal a été obtenu. Les critères d'exclusion comprenaient une lésion cérébrale aiguë, des convulsions ou un état empêchant la participation au dépistage du délire. Le consentement a été obtenu avant l'inscription du représentant légalement autorisé car les participants n'étaient pas en mesure de donner leur propre consentement.

Chaque jour, le patient a été évalué pour sa capacité à participer à un dépistage du délire déterminé à l'aide de l'échelle de sédation d'agitation de Richmond (RASS)22,23. Le RASS est une échelle à 10 niveaux (+ 4 « combatif » à − 5 « inébranlable ») avec une excellente fiabilité inter-évaluateurs (r = 0,956, limite de confiance inférieure à 90 % = 0,948 ; κ = 0,73, intervalle de confiance à 95 % = 0,71, 0,75)22,23. Un score RASS de − 2 ou plus (capable d'ouvrir les yeux pendant > 10 s pour exprimer) répondait à l'éligibilité.

Les caractéristiques démographiques et cliniques ont été obtenues à partir du dossier médical électronique (DME).

La méthode d'évaluation de la confusion pour l'unité de soins intensifs (CAM-ICU) est une version modifiée de la CAM qui a été développée pour évaluer les patients ventilés mécaniquement et non verbaux dans l'USI24,25. Le CAM-ICU est basé sur l'étalon-or pour l'identification du délire, le Manuel diagnostique et statistique du trouble mental IV (DSM-IV) et l'un des deux outils de dépistage du délire recommandés par la Society of Critical Care Medicine (SCCM)1,4,26. Le CAM-ICU nécessite la participation du patient pour identifier quatre caractéristiques clés du délire, notamment (a) un début aigu ou une fluctuation de l'état mental au cours des 24 heures précédentes, (b) l'inattention, (c) une altération du niveau de conscience [Richmond Agitation Sedation Scale (RASS) ≠ 0] et (d) une pensée désorganisée24,25. Lorsqu'il est utilisé dans la recherche, le CAM-ICU a une sensibilité et une spécificité élevées, 93 et ​​98 % respectivement, et une fiabilité inter-évaluateurs élevée à k.0.79.

Des bandeaux EEG à réponse rapide qui circonscrivent la tête ont été appliqués quotidiennement à chaque participant. La précision du placement est basée sur l'emplacement de la fixation du bandeau au centre du front, les électrodes sont numérotées de 1 à 10, le bandeau se connecte à l'enregistreur à la racine des cheveux à l'arrière de la tête, les formes d'onde EEG sont immédiatement visualisées sur l'enregistreur EEG et l'enregistreur identifie la qualité de la connexion (par exemple, l'impédance) à l'aide d'un diagramme à code couleur (vert = faible impédance/rouge = haute impédance) du bandeau. La surveillance EEG a eu lieu pendant 2 h chaque soir entre 17 h et 21 h (17 h à 21 h) pendant quatre jours ou la sortie de l'USI. Après une heure de surveillance EEG, le participant a été évalué pour le délire par l'équipe de recherche à l'aide de la méthode d'évaluation de la confusion pour l'USI (CAM-ICU). Pour être considéré comme un délire positif à l'aide du CAM-ICU, le participant doit présenter au moins trois des principaux composants du délire, y compris un changement aigu de l'état mental de base, faire preuve d'inattention et avoir soit un niveau de conscience altéré, soit une pensée désorganisée.

Avant l'analyse, les données EEG ont été traitées pour éliminer les artefacts tels que les mouvements musculaires du visage et les interférences des appareils à proximité tels que les ventilateurs et les moniteurs cardiaques. Pour ce faire, les hautes et basses fréquences sont supprimées à l'aide de filtres. Les données sont ensuite référencées pour estimer le bruit physiologique et divisées en plusieurs périodes de temps discrètes appelées époques. Après le prétraitement, les données EEG sont ensuite "nettoyées" à l'aide de l'analyse des composants individuels (IDA) pour supprimer les bruits et générer les fonctionnalités nécessaires aux algorithmes d'apprentissage automatique. L'analyse des composants est une méthode largement acceptée pour nettoyer les données en séparant les artefacts des données dérivées des processus corticaux14,27. L'avantage de l'analyse des composants indépendants avec des statistiques d'ordre supérieur est la possibilité de soustraire simplement les artefacts en examinant directement les composants indépendants des données.

Les techniques d'analyse EEG varient d'une étude à l'autre. Par conséquent, des méthodes traditionnelles et trois méthodes d'apprentissage automatique ont été utilisées initialement pour analyser ces données, en particulier la forêt aléatoire (série d'arbres de décision), l'analyse discriminante linéaire pas à pas (supprime les variables qui n'aident pas à classer les données, dans ce cas délire−/délire+) et la machine à vecteurs de support (l'ordinateur construit un modèle pour fournir la plus grande différence entre les catégories, dans ce cas délire−/délire+). En raison des difficultés liées à la sélection des fonctionnalités, une méthode d'apprentissage approfondi supervisé, c'est-à-dire Vision Transformer, a été principalement utilisée dans cette analyse. On observe dans de nombreuses applications d'apprentissage en profondeur que des techniques sophistiquées de traitement de données et d'ingénierie de fonctionnalités ne sont souvent pas nécessaires car les réseaux de neurones profonds peuvent apprendre ces fonctionnalités subtiles directement à partir des données d'entrée. Deux types de données ont donc été étudiés. Le premier type de données d'entrée a été prétraité (mouvement musculaire et suppression des interférences de l'appareil) et IDA nettoyé tandis que le second type d'entrée n'a reçu qu'un prétraitement sans nettoyage IDA. Les données ont été extraites toutes les 4 ms des appareils EEG et chaque échantillon de données contient la lecture de huit capteurs.

Un nombre continu de lignes de données est organisé en une tranche de données, qui est un tableau \(8 \times n\), où \(n\) représente le nombre de lignes. Ces tableaux sont redimensionnés à \ (224 \ fois 224 \) à l'aide de l'interpolation bilinéaire et sont traités comme des images à alimenter dans le modèle ViT, comme illustré à la Fig. 2.

La matrice de confusion pour l'expérience.

Notre objectif principal était d'identifier la gamme de fréquences dans les images d'ondes qui a le plus d'effet sur les résultats de la classification. Notre hypothèse est que si un segment d'image ne contient pas un cycle complet d'ondes à une fréquence particulière, il est peu probable que l'effet de cette fréquence soit significatif dans les résultats de la classification. Le contrôle de la longueur des tranches de données peut contrôler la plage de fréquences que l'image inclura. Par exemple, si \(n = 25\), alors la durée de cette image d'onde est \(0,1s\) et la fréquence correspondante est \(f > 10\,\text{Hz}\). En bref, \(n\) détermine la fréquence la plus basse qu'une image inclurait. Pour étudier l'impact des fréquences partielles à différentes phases et pour augmenter la taille des données, nous avons partitionné les images d'onde avec des segments qui se chevauchent. Un tel traitement peut mieux refléter la relation des ondes avec des fréquences différentes.

Pour comprendre comment les résultats sont liés à la taille des tranches, cinq longueurs différentes ont été choisies : vingt-cinq lignes (0,1 s), 125 lignes (0,5 s), 250 lignes (1 s), 400 lignes (1,6 s) et 1250 lignes (5 s). En raison de la petite taille de la population, les données sont augmentées à l'aide d'un schéma de fenêtres superposées, où la ligne de départ de la tranche de données suivante se trouve quelque part dans la tranche de données actuelle, plutôt qu'après la dernière ligne de la tranche de données actuelle. Un exemple de tranche de données d'une seconde (250 lignes) se chevauchant à 30 % est illustré à la Fig. 3. Les signaux pertinents dans l'étude EEG comprennent les ondes alpha (8–12 Hz), bêta (15–30 Hz), delta (0,5–3 Hz), gamma (> 30 Hz) et thêta (4–7 Hz). Si nous utilisons \(T\) pour représenter la durée de chaque tranche de données, alors la fréquence qu'une image peut détecter est \(f = \frac{1}{T}\). Dans l'étude, la fréquence minimale la plus élevée qu'il peut détecter est \(10\,\,\text{Hz}\) lorsque \(T = 0,1s\), et la fréquence minimale la plus basse qu'il peut détecter est \(0,2\,\,\text{Hz}\), lorsque \(T = 5s\). Les tranches de données sont divisées de manière aléatoire en ensembles de test et de formation tout en évitant de mettre toutes les données d'un sujet dans un seul ensemble (formation + test). Les cas positifs et négatifs dans les ensembles d'apprentissage et les ensembles de test sont relativement équilibrés, avec un rapport proche de un.

Pipeline de travail pour les modèles entraînés dans le domaine fréquentiel dans l'expérience de comparaison.

Les hyper-paramètres par défaut du modèle ont été utilisés dans cette étude : taille du lot = 64, taux d'apprentissage = 0,001, profondeur = 12 et têtes = 8. Des taux de chevauchement de 75 %, 90 % et 95 % ont été étudiés. Étant donné qu'aucune différence majeure n'a été découverte entre ces différents rapports de chevauchement, un rapport de chevauchement de fenêtres de 90 % a été utilisé pour rapporter les résultats. Les données EGG convergent très rapidement lors de l'utilisation du modèle ViT. Dans la plupart des situations, les précisions d'entraînement ont atteint plus de 99 % en aussi peu que trois époques. Pour éviter le surajustement, le modèle formé après 5 époques a été utilisé pour évaluer les ensembles de données de test.

La raison de l'utilisation de ViT, un modèle CV basé sur un transformateur au lieu d'un modèle de langage basé sur un transformateur, est que les données sont un mélange d'ondes de fréquences différentes. Étant donné que les ondes se reproduisent périodiquement, un segment d'image contenant au moins un cycle complet d'une fréquence particulière peut ne pas fournir suffisamment d'informations pour analyser ses données. Cette étude a étudié les segments d'image qui contiennent une collection d'ondes avec différentes fréquences. Étant donné que les données EEG sont mieux présentées au format d'image d'onde, le modèle NLP basé sur Transformer n'est pas le modèle le mieux adapté pour analyser les images d'onde EEG. En tant que tel, nous avons décidé d'utiliser ViT plutôt que Transformer pour analyser les données.

Notez également qu'il est courant de transférer des données de séries chronologiques dans des images spectrales via des techniques de transformation telles que la transformation de Fourier rapide (FFT). Nous soutenons qu'une telle transformation n'est pas bien adaptée au modèle ViT. Dans ce travail, nous avons également étudié l'effet de l'ajout de la FFT au processus. Le flux de travail est illustré à la Fig. 3.

Pour mieux comprendre la valeur du modèle ViT dans les analyses de données EEG, un ensemble de données public28 a également été utilisé pour effectuer une tâche de classification binaire. La tranche de données de 1250 lignes a été adoptée et le taux de chevauchement a été fixé à 90 %. Le modèle a atteint une précision de test de 86,33 %, ce qui est meilleur que les algorithmes de pointe SleepEEGNet avec une précision de 80,03 %. Les résultats pilotes montrent que ViT est un meilleur ajustement pour analyser les données EEG que les algorithmes existants.

Quinze traitements différents (5 tailles de tranches de données \(\times\) 3 taux de chevauchement) ont été utilisés pour évaluer les performances du modèle ViT. Étant donné que les taux de chevauchement n'affectaient pas les résultats de précision, seuls les résultats de \(over\;lapping\; rate = 90\%\) ont été signalés, voir le tableau 1.

Le modèle a atteint la meilleure précision de test de 97,58 % lorsque la tranche de données a une taille de 1250 lignes (5 s). La figure 4 illustre l'impact des tranches de données sur la précision de la prédiction.

La matrice de confusion pour l'expérience de comparaison, avec la partie gauche montrant la matrice du modèle formé dans le domaine fréquentiel et la partie droite représentant la matrice du modèle formé dans le domaine temporel.

Lorsque la tranche de données ne compte que vingt-cinq lignes, elle contient des cycles complets d'ondes supérieures à \(10\;{\text{Hz}}\). La précision de la prédiction n'était que de 51,86 %, ce qui suggère que le ViT n'a rien appris d'utile à partir des données. Les mauvais résultats pourraient suggérer que les ondes avec des fréquences plus élevées sont moins importantes pour prédire le délire. Cela peut également être dû au fait que la taille des diapositives de données était trop petite pour être redimensionnée en images \ (224 \ fois 224 \). Lorsqu'une tranche de données contient au moins un cycle complet d'ondes \(2 \;{\text{Hz}}\) (0,5 s ou 125 lignes), la précision passe à 72,82 %. Lorsqu'une tranche de données contient au moins un cycle complet d'ondes \(1 \;{\text{Hz}}\) (1 s ou 250 lignes), la précision est encore augmentée à environ 95 %. De meilleurs résultats sont associés à des ondes de fréquence plus faible. Une enquête plus approfondie est nécessaire pour bien comprendre si les signaux à ondes longues, tels que les ondes delta, sont vraiment les prédicteurs du délire. Dans la plupart des expériences, les modèles ont convergé en trois époques. Les précisions ne se sont pas améliorées de l'époque six à l'époque dix.

Pour étudier les résultats de l'analyse des données EEG dans le domaine fréquentiel, nous avons comparé sa matrice de confusion aux données dans le domaine temporel. Les paramètres de l'expérience étaient \(t = 5s\), \(chevauchement\; taux = 50\%\) et les époques étaient fixées à 4. La figure 4 présente les résultats de cette étude contrastive. Il démontre que les performances du modèle dans le domaine temporel surpassent ses performances dans le domaine fréquentiel. Ces résultats s'alignent sur notre discussion et soutiennent davantage l'efficacité de notre approche d'extraction de caractéristiques dans le temps, le domaine et la sélection du modèle ViT pour analyser les données EEG au format d'image d'onde.

Étant donné que ViT a bien fonctionné sur les données nettoyées à l'aide d'IDA, la question se pose : ViT fournirait-il de bons résultats de prédiction sur des ensembles de données qui ne sont pas nettoyés par IDA ? Pour répondre à cette question, des données non nettoyées ont également été introduites dans le modèle ViT pour évaluer les résultats. Des tranches de données de 1250 ont été choisies avec un taux de chevauchement de 90 %. À notre grande surprise, la précision de la formation et des tests a atteint plus de 99,99 %. Cela peut suggérer que les techniques d'apprentissage en profondeur comme ViT n'ont probablement pas besoin de techniques d'ingénierie de fonctionnalités supplémentaires pour obtenir des résultats impressionnants. Parce que l'ensemble de données est petit, il est trop tôt pour faire une telle affirmation. Des études complémentaires sont nécessaires pour valider cette hypothèse.

Les ensembles de données collectés par les chercheurs étaient limités à seulement douze sujets et n'ont été utilisés que pour les prédictions de délire. Qu'en est-il des autres ensembles de données EEG ? Nous avons fait une autre expérience pour comprendre si ViT est toujours applicable. Nous avons également appliqué ViT dans un ensemble de données EEG public28 pour effectuer une tâche de classification binaire. Sous une taille de fenêtre de 1250 points, le modèle a atteint une précision de test de 86,33 %.

Il s'agit de la première étude pilote prospective utilisant un appareil EEG à réponse rapide à 10 électrodes fournissant des données de tous les lobes du cerveau, un apprentissage profond supervisé et ViT pour évaluer l'EEG pour la présence de délire. Ce projet pilote a établi qu'une telle surveillance est réalisable chez les personnes âgées gravement malades dans les USI médicales, chirurgicales et cardiaques. La principale découverte est qu'en utilisant l'apprentissage profond supervisé et une plate-forme ViT, les patients ont été classés avec précision comme délire positif ou délire négatif sur la base de caractéristiques identifiables dans l'EEG, prédisant ainsi la présence d'un délire. Ces résultats ont été reproduits à l'aide de trois méthodes d'apprentissage automatique, les méthodes d'apprentissage supervisé comprenaient une analyse discriminante linéaire pas à pas et des machines à vecteurs de support et un apprentissage profond supervisé a été effectué à l'aide de ViT. Par rapport aux études antérieures utilisant diverses méthodes d'apprentissage automatique et de prétraitement, le modèle ViT utilisant les hyperparamètres mentionnés ci-dessus a fourni une plus grande précision. Par exemple, van Sleuwen et Sun29 ont utilisé un dispositif à dérivation limitée à 3 canaux pour mesurer des méthodes basées sur la physiologie à l'aide du score de gravité de la méthode d'évaluation de la confusion. Pour obtenir trois canaux ou formes d'onde, ils ont utilisé des bandes EEG de 6 s obtenues à partir d'un montage frontal à 4 électrodes. En utilisant ce montage sur 252 patients délirants et 121 patients non délirants, ils ont obtenu des précisions de 0,63 à 0,73 sur la courbe ROC, ce qui signifie que le modèle a prédit avec précision 63 à 70 % de vrais positifs pour chaque seuil de décision possible du modèle. De même, Yamanashi et Kajitani30 ont pu obtenir des AUC de 63 à 76 % en utilisant un EEG bispectral à deux canaux. En conséquence, ils ont recommandé que d'autres études puissent bénéficier de modèles d'apprentissage en profondeur tels que celui utilisé dans cette étude pilote.

Le mérite de cet EEG portable à réponse rapide est son objectivité par rapport aux méthodes de dépistage actuellement disponibles au chevet du patient. De plus, cette méthode ne nécessite pas l'utilisation d'une grande machine EEG et de techniciens spécialisés pour le placement des électrodes qui limitent fréquemment le dépistage de masse à grand volume tel que celui nécessaire pour dépister le délire dans les unités de soins intensifs. L'EEG à réponse rapide est facile à utiliser par le personnel hospitalier occupé avec une formation minimale. L'utilisation d'algorithmes préprogrammés, tels que celui décrit ici, limite le besoin d'interprétation qualifiée requise lors de l'utilisation de l'EEG traditionnel. Par conséquent, cette méthode de détection n'est pas limitée par la subjectivité et la rationalisation des résultats associés au dépistage au chevet du patient.

Bien que le modèle ViT utilisé ci-dessus ait des performances satisfaisantes, il existe encore des possibilités d'améliorer la prédiction. Par exemple, l'utilisation d'une fenêtre de 10 à 60 s au lieu des fenêtres de 1 à 5 s généralement utilisées dans ce type d'analyse peut avoir fourni plus de points de données. Au cours de la phase de pré-traitement, notre étude a utilisé l'extraction de séquences, ce qui signifie que les échantillons sont obtenus dans un ordre séquentiel chronologique et de longueur finie. Il est possible qu'une correction ou une interpolation constante (suppression des données obtenues à partir d'une électrode en plomb qui est mauvaise) puisse fournir un ensemble de données plus propre pour l'analyse.

Les limites de cette étude comprennent le petit échantillon de treize participants dont sept ont connu un délire au cours de la période de surveillance, tel que déterminé par le CAM-ICU. Les modifications de l'EEG se produisent avant l'apparition des symptômes et, par conséquent, certains des participants peuvent avoir eu un délire sous-syndromique détecté à l'aide de l'EEG qui n'a pas été détecté à l'aide du dépistage au chevet du patient (CAM-ICU). Les évaluations du délire ont été effectuées par le chercheur plutôt que d'utiliser les évaluations des cliniciens, offrant une plus grande fiabilité de l'état de délire. L'hétérogénéité de l'échantillon avec des étiologies et des expositions aux médicaments variables aurait pu entraîner certaines modifications de l'EEG se reflétant plus que d'autres dans un sous-ensemble de patients, minimisant ainsi la généralisabilité. Bien que cette étude ait des limites, des résultats cohérents ont été obtenus à travers les méthodes d'analyse (rapports de fréquence, apprentissage supervisé et apprentissage en profondeur), ce qui renforce les résultats.

Dans cette analyse, nous avons formé un modèle ViT pour analyser les données EEG sous la contrainte d'un petit échantillon et donc d'une quantité limitée de données. Malgré l'utilisation d'une méthode d'extraction de séquence pour le prétraitement, une précision de 97 % est nettement meilleure que la précision d'environ 40 % des évaluations CAM-ICU dérivées des cliniciens. Par conséquent, cette méthode a un fort potentiel pour améliorer la précision de la détection du délire, offrant une plus grande possibilité de mettre en œuvre et d'évaluer des interventions individualisées. Une fois que la détection précoce du dysfonctionnement cérébral associé à de mauvais résultats tels que le besoin d'institutionnalisation et une mortalité plus élevée sera facilement disponible, il sera possible d'identifier des causes réversibles, suivies d'une intervention précoce et d'une surveillance étroite pour éviter les complications évitables. Le fait de disposer d'une méthode physiologique de détection du délire peut offrir l'occasion de proposer des interventions lorsque le délire se prête mieux au traitement. Une intervention précoce peut raccourcir la durée du séjour à l'hôpital, augmenter les chances d'un patient de rentrer chez lui après sa sortie de l'hôpital, diminuer les taux de mortalité et réduire le fardeau financier associé au délire.

Les ensembles de données générés et/ou analysés au cours de l'étude actuelle ne sont pas accessibles au public, mais sont disponibles auprès de l'auteur correspondant sur demande raisonnable.

Association psychiatrique américaine. Manuel diagnostique et statistique des troubles mentaux : DSM-5 (American Psychiatric Association, 2013).

Réserver Google Scholar

Bashar, FR et al. Morbidité psychologique post-USI chez les patients de très long séjour en USI atteints de SDRA et de délire. J. Crit. Soins 43, 88–94 (2018).

Article PubMed Google Scholar

Mulkey, MA et al. Revue physiopathologique : sept neurotransmetteurs associés au délire. Clin. Infirmière Spéc. 32(4), 195-211 (2018).

Article PubMed Google Scholar

Devlin, JW et al. Lignes directrices de pratique clinique pour la prévention et la prise en charge de la douleur, de l'agitation/sédation, du délire, de l'immobilité et des troubles du sommeil chez les patients adultes en soins intensifs. Crit. Soin Méd. 46(9), e825–e873 (2018).

Article PubMed Google Scholar

National Institute for Health and Care Excellence: Clinical Guidelines, dans Réadaptation pour adultes atteints de psychose complexe. 2020, National Institute for Health and Care Excellence (Royaume-Uni) Copyright ¬© NICE 2020. : Londres.

Société américaine de gériatrie. L'American Geriatrics Society a résumé les directives de pratique clinique pour le délire postopératoire chez les personnes âgées. Confiture. Gériatrie. Soc. 63(1), 142–150 (2015).

Article Google Scholar

Hunter, A. et al. Dépistage du délire dans l'unité de soins intensifs à l'aide de techniques QEEG émergentes : une étude pilote. AIMS Neurosci. 7(1), 1–16 (2020).

Article PubMed PubMed Central Google Scholar

Gou, RY et al. Coûts d'assurance-maladie d'un an associés au délire chez les patients âgés subissant une chirurgie élective majeure. JAMA Surg. 156, 430–442 (2021).

Article PubMed Google Scholar

Engel, GL & Romano, J. Délire : Ii. réversibilité de l'électroencéphalogramme avec des procédures expérimentales. Cambre. Neurol. Psychiatrie 51(4), 378–392 (1944).

Article Google Scholar

Romano, J. & Engel, GL Delirium : I. données électroencéphalographiques. Cambre. Neurol. Psychiatrie 51(4), 356–377 (1944).

Article Google Scholar

van der Kooi, AW et al. Détection du délire à l'aide de l'EEG : quoi et comment mesurer. Coffre 147(1), 94-101 (2015).

Article PubMed Google Scholar

Mulkey, MA et al. L'électroencéphalogramme continu portatif rapide (EEG) a le potentiel de détecter le délire chez les personnes âgées. Dimensions. Crit. Infirmières de soins. 41(1), 29–35 (2022).

Article PubMed PubMed Central Google Scholar

Kamousi, B. et al. Comparaison de la qualité des signaux enregistrés avec un EEG à réponse rapide et des systèmes EEG cliniques conventionnels. Clin. Neurophysiol. Pratique. 4, 69–75 (2019).

Article PubMed PubMed Central Google Scholar

Kannathal, N. et al. Caractérisation de l'EEG - Une étude comparative. Calcul. Méthodes Programmes Biomed. 80(1), 17–23 (2005).

Article CAS PubMed Google Scholar

Dosovitskiy, A., et al., Une image vaut 16 x 16 mots : transformateurs pour la reconnaissance d'image à grande échelle. prétirage arXiv arXiv:2010.11929, 2020.

Vaswani, A., et al. L'attention est tout ce dont vous avez besoin. Dans les progrès des systèmes de traitement de l'information neuronale. 2017.

Kostas, D., Aroca-Ouellette, S. & Rudzicz, F. BENDR : Utilisation de transformateurs et d'une tâche d'apprentissage auto-supervisée contrastive pour apprendre à partir de quantités massives de données EEG. Devant. Hum. Neurosci. 15, 653659 (2021).

Article PubMed PubMed Central Google Scholar

Acheampong, FA, Nunoo-Mensah, H. & Chen, W. Modèles de transformateur pour la détection d'émotions basée sur le texte : examen des approches basées sur le BERT. Artef. Renseignement. Rév. 54(8), 5789–5829 (2021).

Article Google Scholar

Yin, C. et al. La dynamique fractionnaire favorise l'apprentissage en profondeur de la prédiction du stade de la MPOC. Adv. Sci. 10, 2203485 (2023).

Article Google Scholar

Xue, F. et al. Transformateur de vision avec mise en commun attentive pour une reconnaissance robuste des expressions faciales. IEEE Trans. Affecter. Calcul. (2022).

Mulkey, MA et al. Méthodes d'identification du délire : un protocole de recherche. Rés. Infirmières. Santé 42(4), 246–255 (2019).

Article PubMed Google Scholar

Sessler, CN et al. L'échelle d'agitation-sédation de Richmond : validité et fiabilité chez les patients adultes en unité de soins intensifs. Suis. J. Respir. Crit. Soin Méd. 166(10), 1338–1344 (2002).

Article PubMed Google Scholar

Sessler, CN et al. Validité et fiabilité d'une nouvelle échelle d'agitation-sédation dans une population de soins intensifs médicaux. Poitrine 118 (supplément 4), 95S (2000).

Google Scholar

Ely, EW et al. Délire chez les patients ventilés mécaniquement : validité et fiabilité de la méthode d'évaluation de la confusion pour l'unité de soins intensifs (CAM-ICU). JAMA 286(21), 2703–2710 (2001).

Article CAS PubMed Google Scholar

Ely, EW et al. Évaluation du délire chez les patients gravement malades : validation de la méthode d'évaluation de la confusion pour l'unité de soins intensifs (CAM-ICU). Crit. Soin Méd. 29(7), 1370–1379 (2001).

Article CAS PubMed Google Scholar

Association psychiatrique américaine. Manuel diagnostique et statistique des troubles mentaux : DSM-IV, 4e [rév.] éd (American Psychiatric Association, 1998).

Google Scholar

Delorme, A., Sejnowski, T. & Makeig, S. Détection améliorée des artefacts dans les données EEG à l'aide de statistiques d'ordre supérieur et d'une analyse de composants indépendante. Neuroimage 34(4), 1443–1449 (2007).

Article PubMed Google Scholar

Goldberger, AL et al. PhysioBank, PhysioToolkit et PhysioNet : composants d'une nouvelle ressource de recherche pour les signaux physiologiques complexes. Circulation 101(23), e215–e220 (2000).

Article CAS PubMed Google Scholar

van Sleuwen, M. et al. Évaluation physiologique de la sévérité du délire : le score de sévérité de la méthode d'évaluation de la confusion électroencéphalographique (E-CAM-S). Crit. Soin Méd. 50(1), e11–e19 (2022).

Article PubMed PubMed Central Google Scholar

Yamanashi, T. et al. L'analyse des données topologiques (TDA) améliore l'algorithme EEG bispectral (BSEEG) pour la détection du délire. Sci. Rep. 11(1), 304 (2021).

Article CAS PubMed PubMed Central Google Scholar

Télécharger les références

Malissa Mulkey a été financée par un NRSA T32 NR018407 du National Institute of Nursing Research. Cette étude de recherche a été financée par l'American Association of Critical Care Nurses.

Collège des sciences infirmières, Université de Caroline du Sud, Columbia, Caroline du Sud, États-Unis

Malissa A. Mulkey

Département d'informatique et de technologie de l'information, Université Purdue, Lafayette, IN, États-Unis

Huyunting Huang et Baijian Yang

Département d'ingénierie, Université de Caroline de l'Est, Greenville, Caroline du Nord, États-Unis

Thomas Albanese et Sunghan Kim

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

MM était responsable de la conceptualisation de la conception de l'étude, de l'interprétation des résultats des analyses, de la rédaction du manuscrit et de l'accord sur l'exactitude et l'intégrité du travail. TA était responsable de la conception et de la réalisation de l'analyse, de l'interprétation des résultats, de la rédaction de l'article et de l'acceptation de l'exactitude et de l'intégrité. HH était responsable de la conception de l'analyse, de l'interprétation des résultats, de la rédaction de l'article et de l'acceptation de l'exactitude et de l'intégrité. BY était responsable de la conception de l'analyse, de l'interprétation des résultats, de la rédaction de l'article et de l'acceptation de l'exactitude et de l'intégrité. SK était responsable de la conception et de la réalisation de l'analyse, de l'interprétation des résultats, de la rédaction de l'article et de l'acceptation de l'exactitude et de l'intégrité. Tous les auteurs ont révisé et approuvé la version finale.

Correspondance à Malissa A. Mulkey.

Les auteurs ne déclarent aucun intérêt concurrent.

Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Mulkey, MA, Huang, H., Albanese, T. et al. L'apprentissage en profondeur supervisé avec un transformateur de vision prédit le délire en utilisant un EEG à plomb limité. Sci Rep 13, 7890 (2023). https://doi.org/10.1038/s41598-023-35004-y

Télécharger la citation

Reçu : 11 octobre 2022

Accepté : 11 mai 2023

Publié: 16 mai 2023

DOI : https://doi.org/10.1038/s41598-023-35004-y

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.