Linguistic Parameters of Spontaneous Speech for Identifying Mild Cognitive Impairment and Alzheimer Disease

Vincze, Veronika [Vincze, Veronika (Nyelvészet), szerző] MTA-SZTE Mesterséges Intelligencia Kutatócsoport (SZTE / TTIK / INF); Szabó, Martina Katalin [Szabó, Martina Katalin (nyelvészet), szerző] Lendület Recens Kutatócsoport (HUN-REN TK); Szoftverfejlesztés Tanszék (SZTE / TTIK / INF); Hoffmann, Ildikó [Hoffmann, Ildikó (Neurolingvisztika), szerző] Magyar Nyelvészeti Tanszék (SZTE / BTK / MNYII); Általános és Magyar Nyelvészeti Intézet (HRN NYTK); Tóth, László [Tóth, László (Mesterséges intel...), szerző] Számítógépes Algoritmusok és Mesterséges Intell... (SZTE / TTIK / INF); Pákáski, Magdolna [Pákáski, Magdolna (neurológia), szerző] Pszichiátriai Klinika (SZTE / SZAOK); Kálmán, János [Kálmán, János (Pszichiátria), szerző] Pszichiátriai Klinika (SZTE / SZAOK); Gosztolya, Gábor [Gosztolya, Gábor (mesterséges intel...), szerző] MTA-SZTE Mesterséges Intelligencia Kutatócsoport (SZTE / TTIK / INF)

Angol nyelvű Szakcikk (Folyóiratcikk) Tudományos
Megjelent: COMPUTATIONAL LINGUISTICS 0891-2017 1530-9312 48 (1) pp. 43-75 2022
  • Nyelvtudományi Bizottság: INT1
  • SJR Scopus - Linguistics and Language: D1
Azonosítók
Támogatások:
  • Mesterséges Intelligencia Nemzeti Laboratórium / Artificial Intelligence National Laboratory(MILAB) Támogató: NKFIH
  • Enhancement of deep learning based semantic representations with acoustic-prosodic features for a...(FK-124413) Támogató: NKFIH
  • Ministry for Innovation and Technology, Hungary(NKFIH-1279-2/2020)
  • (ÚNKP-21-5-SZTE-583) Támogató: NKFIH
  • Bolyai ösztöndíj((BO/00653/19) Támogató: MTA Bolyai János Kutatási Ösztöndíj) Támogató: MTA Bolyai pályázat
In this article, we seek to automatically identify Hungarian patients suffering from mild cognitive impairment (MCI) or mild Alzheimer disease (mAD) based on their speech transcripts, focusing only on linguistic features. In addition to the features examined in our earlier study, we introduce syntactic, semantic, and pragmatic features of spontaneous speech that might affect the detection of dementia. In order to ascertain the most useful features for distinguishing healthy controls, MCI patients, and mAD patients, we carry out a statistical analysis of the data and investigate the significance level of the extracted features among various speaker group pairs and for various speaking tasks. In the second part of the article, we use this rich feature set as a basis for an effective discrimination among the three speaker groups. In our machine learning experiments, we analyze the efficacy of each feature group separately. Our model that uses all the features achieves competitive scores, either with or without demographic information (3-class accuracy values: 68%–70%, 2-class accuracy values: 77.3%–80%). We also analyze how different data recording scenarios affect linguistic features and how they can be productively used when distinguishing MCI patients from healthy controls.
Hivatkozás stílusok: IEEEACMAPAChicagoHarvardCSLMásolásNyomtatás
2026-01-20 20:50