Vajon a korszerű gépi tanulási módszerek mennyire adnak pontos és megbízható képet az egyéni életminőségről? Mennyire pontosan becsülhető az egyén életminősége anélkül, hogy azt megmérnénk? Ezekre a kérdésekre kereste a választ az Óbudai Egyetem Egyetemi Kutató és Innovációs Központjában működő Egészségügyi Közgazdaságtan Kutatóközpont (HECON), az ELTE, a BCE, és külföldi kutatóintézetek munkatársaiból álló kutatócsoport legújabb, rangos nemzetközi folyóiratban közzétett kutatásában.
A kutatócsoport Magyarországon, Lengyelországban és Szlovéniában végzett 30 életminőség kutatásból több mint 26.000 beteg anonim adatát elemezte hagyományos illetve a legkorszerűbb gépi tanulási módszerekkel. Az adatok nagyobb részét az algoritmusok tanítására, kisebb részét az eredmények ellenőrzésére használták fel. Tíz egyénből négy-öt eseteben sikerült olyan pontossággal megbecsülni az életminőséget, mely során az eltérések az egyén szempontjából nem érzékelhetők. Ugyanakkor tízből négy esetben a rendszer azt sem jelezte előre pontosan, hogy az illető teljesen egészségesnek, közepesen, vagy súlyosan betegnek érzi magát. Az egyes módszerek között különbség mutatkozott abban, hogy inkább az egészséges vagy beteg egyéneknél adtak pontosabb becslést, de összességében a hagyományos és a gépi tanulási módszerek hasonlóan teljesítettek.
A kutatás tanulsága, hogy még nem rendelkezünk kellő mennyiségű és minőségű adattal az emberek életminőségéről ahhoz, hogy azt pontos és megbízható gépi tanulási algoritmusok betanítására használhassuk. Az első teendő a jó minőségű életminőség adatok gyűjtése az egészségügyi ellátórendszer minél több pontján, betegregiszterek kialakítása, melyhez a jogi háttér és a biztonságos infrastruktúra megteremtése kulcsfontosságú. Ahhoz, hogy az így gyűjtött adatokból a jövőben minél értékesebb információ legyen kinyerhető, az adattudósoknak, orvosoknak és egészségközgazdászoknak együtt kell működniük.
Az egészségügy digitalizációja és a digitális orvostechnikai eszközök elterjedése egyre nagyobb mennyiségű egészségügyi adatot generál az egész világon. Az így felgyűlő adattömeg mennyisége és komplexitása olyan mértékű, hogy az már csak gépi tanulási és mesterséges intelligencia módszerekkel dolgozható fel. E módszerek közös jellemzője, hogy előzetes feltételezések, tudományos hipotézisek nélkül is képesek pusztán a betáplált adatokra támaszkodva összefüggéseket feltárni, pontos becsléseket tenni.
A hagyományos adatelemzési technikákkal összehasonlítva a gépi tanulási módszerek előnye gyakran egyben hátrányt is jelent. A hagyományos adatelemzési módszerek alkalmazása során a kutatók megfogalmazzák az előzetes feltételezéseiket, és az elemzésekből ezen feltételezések tükrében nyernek választ. Mivel a kérdés ismert, a kapott válasz általában jól értelmezhető. A gépi tanulási módszerek esetén azonban sokszor nem megmagyarázható, hogy hogyan születtek az eredmények. Egyes felhasználási területeken ez nem okoz problémát, például egy fotó minősége szemmel láthatóan javítható a háttérben futó számítások pontos ismerete nélkül is. Azonban az már kérdéseket vet fel, hogy az egészséggel kapcsolatos döntések során mennyire támaszkodhatunk olyan elemzések eredményeire, amelyek mögött a számítások nem, vagy csak korlátozott mértékben értelmezhetők.
Napjainkban egy Röntgen-kép vagy anyajegyről készült fotó alapján az algoritmusok pontosabb diagnózist képesek felállítani, mint az orvosok. Az orvosi döntéseket gyakran az határozza meg, hogy a betegek hogyan érzik magukat, milyen az életminőségük. Az egyének életminőségének pontos ismerete pedig az egészségügy finanszírozásáról szóló döntések során alapvető fontosságú.
Szerzők: Dr. Zrubka Zsombor, Prof. Péntek Márta, Prof. Gulácsi László, Jani Kinga, Óbudai Egyetem, EKIK, 1034 Budapest, Bécsi út 96/B
Elérhetőség: https://hecon.uni-obuda.hu
Az eredeti, angol nyelvű közlemény: Zrubka Zsombor, Csabai István, Hermann Zoltán, Golicki Dominik, Prevolnik-Rupel Valentina, Ogorevc Marko, Gulácsi László, Péntek Márta: Predicting Patient-Level 3-Level Version of EQ-5D Index Scores From a Large International Database Using Machine Learning and Regression Methods VALUE IN HEALTH Paper: in press , 12 p. (2022) ezen a linken érhető el.