2025, випуск 4, c. 37-46
Одержано 27.06.2025; Виправлено 03.07.2025; Прийнято 18.11.2025
Надруковано 08.12.2025; Вперше Online 15.12.2025
https://doi.org/10.34229/2707-451X.25.4.4
Попередня | ПОВНИЙ ТЕКСТ | Наступна
Моделі прогнозування ризику серцево-судинних захворювань
М.О. Празднікова
Інститут кібернетики імені В.М. Глушкова НАН України, Київ
Листування: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.
Вступ. Неінфекційні захворювання, особливо серцево-судинні патології, залишаються провідною причиною смертності у світі, спричиняючи значний тягар для суспільства, економіки та систем охорони здоров’я. Особливу небезпеку становлять інфаркт міокарда та інсульт, які часто виникають раптово і безсимптомно, ускладнюючи своєчасну діагностику та попередження ускладнень. Ефективне виявлення пацієнтів із підвищеним ризиком розвитку цих станів є ключовим елементом у зниженні рівня захворюваності та смертності, оптимізації медичної допомоги, а також у раціоналізації розподілу ресурсів. Останніми роками все більше уваги приділяється використанню штучного інтелекту, машинного навчання і методів обробки великих обсягів даних, зокрема неструктурованих медичних текстів, для підвищення точності медичних прогнозів. Аналіз лікарських висновків, історій хвороби та іншої текстової інформації може розкрити приховані закономірності, які недоступні при традиційному ручному аналізі, та суттєво вплинути на персоналізацію лікування.
Мета роботи – удосконалення моделі прогнозування ризику інфаркту міокарда шляхом впровадження нових методів попередньої обробки тексту лікарських висновків та відбору ознак. Додатково – побудова нової моделі для визначення рівня ризику ураження судин головного мозку. Робота спрямована на практичну інтеграцію таких моделей у сучасні інформаційні системи медичних закладів та їх апробацію на реальних масивах клінічних даних.
Результати. У дослідженні було запропоновано та випробовано підходи до покращення моделі прогнозування ризику інфаркту міокарда, зокрема переклад текстів, лематизацію й автоматизований відбір медичних термінів. На основі розширеного існуючого методу побудовано нову модель для прогнозування уражень судин головного мозку. Для аналізу використано деперсоналізовану базу «Ескулап» із записами понад 22 тисяч пацієнтів. Вдосконалені моделі продемонстрували високу точність: для інфаркту міокарда – 80 % (AUC = 0,898), для ураження мозкових судин – 86 % (AUC = 0,92). Нова модель успішно впроваджена у медичний центр.
Висновки. Запропоновані методи удосконалення аналізу медичних текстів – попередня обробка тексту, автоматизований відбір релевантних ознак, лематизація, адаптація під специфіку мови – дозволили суттєво підвищити якість прогнозування ризику серцево-судинних і цереброваскулярних захворювань. Побудова нової моделі для прогнозування уражень мозкових судин підтвердила ефективність підходу, а результати впровадження свідчать про доцільність інтеграції таких рішень у клінічну, страхову й наукову практику. Модель забезпечує персоналізований підхід до профілактики й лікування, дозволяє своєчасно виявляти групи ризику, оптимізувати розподіл ресурсів, підвищити якість прийняття клінічних рішень і навіть може бути використана для розрахунку страхових тарифів або адресного фінансування державними та муніципальними структурами. У навчальних центрах система може інтегруватися у курси підвищення кваліфікації медичних працівників, а для наукових установ – слугувати інструментом для аналізу зв’язків між факторами ризику й розробки доказових протоколів. Модель має потенціал для подальшого розвитку, зокрема, за рахунок залучення нових джерел даних (лабораторні показники, результати інструментальних обстежень, медичні зображення), впровадження складніших ансамблевих алгоритмів і глибшої інтеграції експертних оцінок. Поєднання статистичних і фахових методів відбору ознак дає змогу досягти максимальної точності й релевантності прогнозів. Отримані результати підтверджують, що машинне навчання є перспективним інструментом для аналізу неструктурованих медичних текстів, підтримки клінічних рішень і підвищення ефективності системи охорони здоров’я загалом.
Ключові слова: неінфекційні захворювання, інфаркт міокарда, інсульт, машинне навчання, прогнозування ризику, Multinomial Naive Bayes, медичні тексти, аналіз даних.
Цитувати так: Празднікова М.О. Моделі прогнозування ризику серцево-судинних захворювань. Cybernetics and Computer Technologies. 2025. 4. С. 37–46. https://doi.org/10.34229/2707-451X.25.4.4
Список літератури
1. Інсульт – не завжди крововилив: які є різновиди небезпечного захворювання. 2023. https://phc.org.ua/news/insult-ne-zavzhdi-krovoviliv-yaki-e-riznovidi-nebezpechnogo-zakhvoryuvannya (звернення 15.05.2025)
2. Празднікова М.О. Прогнозування і оцінка ризику інфаркту міокарду за сукупністю текстів лікарських висновків. Кібернетика та комп`ютерні технології. 2024. 3. С. 71–80. https://doi.org/10.34229/2707-451X
3. Making a difference - using 'big data' to shape patient care. https://www.uclhospitals.brc.nihr.ac.uk/making-difference-using-big-data-shape-patient-care (звернення 15.05.2025)
4. Singh M., Kumar A, etc. Artificial intelligence for cardiovascular disease risk assessment in personalised framework: a scoping review. 2024. 73 (3). https://doi.org/10.1016/j.eclinm.2024.102660
5. Shishehbori F., Awan Z. Enhancing Cardiovascular Disease Risk Prediction with Machine Learning Models. arXivLabs. 2024. https://doi.org/10.48550/arXiv.2401.17328
6. Rehman M.U., Naseem S., Butt A. et al. Predicting coronary heart disease with advanced machine learning classifiers for improved cardiovascular risk assessment. Sci Rep, 15, 13361. 2025. https://doi.org/10.1038/s41598-025-96437-1
7. Liu M., Liu Y., Liu J. Machine Learning for Infectious Disease Risk Prediction: A Survey. ACM Computing Surveys. 2024. 57 (8). P. 1–39. https://doi.org/10.1145/3719663
8. Bayes N. https://scikit-learn.org/stable/modules/naive_bayes.html (звернення 15.05.2025)
9. Navarro G. A guided tour to approximate string matching. ACM Computing Surveys (CSUR). 2001. 33 (1). P 31–88. https://doi.org/10.1145/375360.375365
10. spaCy: Промисловий рівень NLP для реальних застосувань. https://products.documentprocessing.com/uk/parser/ python/spacy/#google_vignette (звернення 15.05.2025)
11. Becht E., Dutertre C.-A., Kwok I.W.H., Ng L.G., Ginhoux F., Newell E.W. Evaluation of UMAP as an alternative to t-SNE for single-cell data. The preprint server of biology. April 10, 2018. https://doi.org/10.1101/298430
ISSN 2707-451X (Online)
ISSN 2707-4501 (Print)
Попередня | ПОВНИЙ ТЕКСТ | Наступна