Innowacyjne połączenie: wzrok, głos i sztuczna inteligencja
Polski zespół badaczy opracował nowatorskie narzędzie diagnostyczne, które może w przyszłości zrewolucjonizować wykrywanie depresji, lęku społecznego, demencji czy choroby Alzheimera. Kluczem okazało się połączenie dwóch elementów: analizy ruchu gałek ocznych oraz głosu z głębokimi sieciami neuronowymi. – Już teraz osiągamy skuteczność sięgającą 62 procent. To dopiero początek, ale wyniki są bardzo obiecujące – komentuje dr Karol Chlasta z Akademii Leona Koźmińskiego.
Jak wyglądało badanie?
W eksperymencie wzięło udział 101 uczestników: pacjenci z depresją, osoby z lękiem społecznym i osoby zdrowe. Badani oglądali przez 10 sekund zdjęcia twarzy wyrażających różne emocje. W tym czasie okulograf rejestrował ruchy ich oczu. Na podstawie tych danych powstały tzw. ścieżki spojrzeń, które następnie analizowały konwolucyjne sieci neuronowe. Te modele, działające warstwowo jak ludzki mózg, uczą się rozpoznawać wzorce istotne dla diagnozy.
Oczy mówią więcej, niż się wydaje
– Ruchy oczu zdradzają wiele o naszej psychice. Osoby z depresją częściej koncentrują wzrok na negatywnych bodźcach. U pacjentów z lękiem społecznym widzimy zjawisko hiperskanowania – długie, chaotyczne ścieżki spojrzenia, będące wyrazem nadwrażliwości na bodźce społeczne – tłumaczy dr Chlasta. Dzięki temu system może rozróżniać rodzaje zaburzeń z dokładnością 60–70 procent, co jest porównywalne z klasycznymi metodami, ale znacznie szybsze i mniej obciążające dla pacjenta.
Nowoczesna diagnostyka w 10 sekund?
Choć obecna dokładność wynosi 62 procent, to przy przesiewowych testach już teraz może mieć praktyczne zastosowanie. Wystarczy 10-sekundowy test, by zebrać istotne dane. W przyszłości – jak przewiduje dr Chlasta – takie rozwiązania mogą zostać wbudowane w urządzenia codziennego użytku, jak laptop z kamerą, okulary VR, a nawet smartfon. – Możemy stworzyć coś na wzór „wykresu dobrostanu psychicznego”, tak jak dziś mamy wykresy tętna czy jakości snu – zaznacza naukowiec.
Sygnały ukryte w głosie
Naukowcy analizują również ludzki głos jako potencjalne źródło wczesnych sygnałów ostrzegawczych. Depresja czy demencja subtelnie wpływają na artykulację i rytm mowy. – To jak z komputerem, który przy przeciążeniu spowalnia. Narządy mowy też działają mniej płynnie pod wpływem obciążeń neurologicznych. Sieci neuronowe potrafią to wychwycić, nawet w kilku zdaniach – tłumaczy dr Chlasta. Wczesne wykrycie takich zmian może skłonić do konsultacji z lekarzem, zanim objawy się nasilą.
Skala problemu i potrzeba szybkich narzędzi
Depresja i lęk społeczny należą do najczęstszych zaburzeń psychicznych. WHO prognozuje, że do 2030 roku depresja będzie najczęściej diagnozowaną chorobą na świecie. W Polsce choruje na nią już 4 miliony osób, ale wiele przypadków pozostaje niezauważonych. Wczesna diagnoza jest kluczowa – a obecne metody są czasochłonne i trudno dostępne. Sztuczna inteligencja może tu odegrać przełomową rolę, o ile uda się wdrożyć ją poza warunkami laboratoryjnymi.
Co hamuje wdrożenie?
Aby rozwinąć i udoskonalić metodę, niezbędne są większe zbiory danych. – Dziś takich danych nikt systemowo nie gromadzi. Placówki medyczne ich nie archiwizują, a pacjenci obawiają się przekazywania informacji o stanie zdrowia. Bez szerszego zaufania i dodatkowych analiz nie zdołamy zbudować w pełni funkcjonalnego systemu diagnostycznego – wyjaśnia dr Chlasta.
Kto stoi za projektem?
W badaniach wzięli udział eksperci z różnych dziedzin: dr hab. Krzysztof Krejtz i dr hab. Izabela Krejtz z Uniwersytetu SWPS, dr Karol Chlasta z Akademii Leona Koźmińskiego oraz dr Katarzyna Wisiecka z Akademii Ekonomiczno-Humanistycznej w Warszawie. Wyniki opublikowano w International Journal of Marketing, Communication and New Media.







