Модель прогнозирования пандемии COVID-19 на основе машинного обучения в отдельных регионах Российской Федерации
https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.108
Аннотация
Актуальность. Прогнозирование распространения новой коронавирусной инфекции (COVID-19) имеет важное значение для принятия своевременных системных профилактических и противоэпидемических мер как на региональном, так и на федеральном уровне с целью снижения заболеваемости и смертности.
Цель: разработать модель краткосрочного прогнозирования зараженных и умерших от COVID-19 в Российской Федерации.
Материал и методы. Данные для обучения модели собраны c портала Стопкоронавирус.рф и ресурса Университета Джонcа Хопкинса. Она включает 13 признаков для оценки динамики заражения и летальности, а также скорости их прироста в разных странах и отдельных регионах Российской Федерации. Модель обучена методом градиентного бустинга CatBoost и ежедневно переобучается на обновленных данных.
Результаты. Создана модель краткосрочного предсказания числа зараженных и умерших от COVID-19 на период до 14 дней. Оценка точности модели с учетом ошибки предсказания в процентах (англ. mean absolute percentage error, MAPE) составляет от 2,3% до 24% для 85 регионов России. Показано преимущество метода машинного обучения CatBoost перед линейной регрессией на примере величины среднеквадратичной ошибки (англ. root mean square error, RMSE). Модель показывает меньшую ошибку для регионов с большой численностью населения, чем для менее населенных областей.
Заключение. Модель может быть использована не только для прогнозирования пандемии новой коронавирусной инфекции, но и для контроля и оценки распространения заболеваний из группы новых инфекций на этапах их возникновения, пика заболеваемости и периода стабилизации.
Ключевые слова
Об авторах
Д. В. ГавриловРоссия
Гаврилов Денис Владимирович – руководитель медицинского направления
РИНЦ SPIN-код: 2860-6040
наб. Варкауса, д. 17, помещ. 62, Республика Карелия, Петрозаводск 185031, Россия
Р. В. Абрамов
Россия
Абрамов Роман Владимирович – аналитик данных
наб. Варкауса, д. 17, помещ. 62, Республика Карелия, Петрозаводск 185031, Россия
А. В. Кирилкина
Россия
Кирилкина Анна Валерьевна – заместитель главного врача по медицинской части
ул. Кирова, д. 42, Петрозаводск 185035, Россия
А. А. Ившин
Россия
Ившин Александр Анатольевич – к.м.н., заведующий кафедрой акушерства и гинекологии, дерматовенерологии
Scopus Author ID: 57222275843; РИНЦ SPIN-код: 8196-6605
пр-т Ленина, д. 33, Республика Карелия, Петрозаводск 185910, Россия
Р. Э. Новицкий
Россия
Новицкий Роман Эдвардович – генеральный директор
РИНЦ SPIN-код: 8309-1740
наб. Варкауса, д. 17, помещ. 62, Республика Карелия, Петрозаводск 185031, Россия
Список литературы
1. WHO Coronavirus (COVID-19) Dashboard. URL: https://covid19.who.int/ (дата обращения 17.06.2020).
2. Временные методические рекомендации «Профилактика, диагностика и лечение новой коронавирусной инфекции (COVID 19). Версия 11» (утв. Министерством здравоохранения РФ 7 мая 2021 г.). URL: https://base.garant.ru/400738625/ (дата обращения 17.06.2021).
3. Huang C., Wang Y., Li X., et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Lancet. 2020; 395 (10223): 497–506. https://doi.org/10.1016/S0140-6736(20)30183-5.
4. Onder G., Rezza G., Brusaferro S. Case-fatality rate and characteristics of patients dying in relation to COVID-19 in Italy. JAMA. 2020; 323 (18): 1775–6. https://doi.org/10.1001/jama.2020.4683.
5. Mehta P., McAuley D.F., Brown M., et al. COVID-19: consider cytokine storm syndromes and immunosuppression. Lancet. 2020; 395 (10229): 1033–4. https://doi.org/10.1016/S0140-6736(20)30628-0.
6. Hollander J.E., Carr B.G. Virtually perfect? Telemedicine for COVID-19. N Engl J Med. 2020; 382 (18): 1679–81. https://doi.org/10.1056/NEJMp2003539.
7. Стенограмма совещания о санитарно-эпидемиологической обстановке в России (13.04.2020 г.). URL: http://prezident.org/tekst/stenogramma-soveschanija-o-sanitarno-epidemiologicheskoi-obstanovke-v-rossii-13-04-2020.html (дата обращения 17.06.2021).
8. Гусев А.В., Добриднюк С.Л. Искусственный интеллект в медицине и здравоохранении. Информационное общество. 2017; 4-5: 78–93.
9. Гусев А.В., Плисс М.А. Основные рекомендации к созданию и развитию информационных систем в здравоохранении на базе искусственного интеллекта. Врач и информационные технологии. 2018; 3: 45–60.
10. Гусев А.В., Кузнецова Т.Ю., Корсаков И.Н. Искусственный интеллект в оценке рисков развития сердечно-сосудистых заболеваний. Журнал телемедицины и электронного здравоохранения. 2018; 3 (8): 85–90.
11. Гусев А.В., Гаврилов Д.В., Корсаков И.Н. и др. Перспективы использования методов машинного обучения для предсказания сердечно-сосудистых заболеваний. Врач и информационные технологии. 2019; 3: 41–7.
12. Тамм М.В. Коронавирусная инфекция в Москве: прогнозы и сценарии. ФАРМАКОЭКОНОМИКА. Современная фармако экономика и фармакоэпидемиология. 2020; 13 (1): 43–51. https://doi.org/10.17749/2070-4909.2020.13.1.43-51.
13. Fanelli D., Piazzab F. Analysis and forecast of COVID-19 spreading in China, Italy and France. Chaos Solitons Fractals. 2020; 134: 109761. https://doi.org/10.1016/j.chaos.2020.109761.
14. Petropoulos F., Makridakis S. Forecasting the novel coronavirus COVID-19. PLoS One. 2020; 15 (3): e0231236. https://doi.org/10.1371/journal.pone.0231236.
15. Ceylan Z. Estimation of COVID-19 prevalence in Italy, Spain, and France. Sci The Total Environ. 2020; 729: 138817. https://doi.org/10.1016/j.scitotenv.2020.138817.
16. Roda W.C., Varughese M.B., Han D., Li M.Y. Why is it difficult to accurately predict the COVID-19 epidemic? Infect Dis Model. 2020; 5: 271–81. https://doi.org/10.1016/j.idm.2020.03.001.
17. Pandey G., Chaudhary P., Gupta R., Pal S. SEIR and Regression Model based COVID-19 outbreak predictions in India. arXiv:2004.00958. https://doi.org/10.1101/2020.04.01.20049825.
18. Алешукина А.В., Денисенко В.В., Алешукин Г.С., Голошва Е.В. Применение математической модели для прогнозирования эпидемиологической ситуации по COVID-19 в Ростовской области. COVID19-Preprints.Microbe.ru; 2020. https://doi.org/10.21055/preprints-3111736.
19. Yang Z., Zeng Z., Wang K., et al. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. J Thorac Dis. 2020; 12 (3): 165–74. https://doi.org/10.21037/jtd.2020.02.64.
20. Petropoulos F., Makridakis S. Forecasting the novel coronavirus COVID-19. PLoS One. 2020; 15 (3): e0231236. https://doi.org/10.1371/journal.pone.0231236.
21. Мелик-Гусейнов Д.В., Карякин Н.Н., Благонравова А.С. и др. Регрессионные модели прогнозирования количества летальных исходов при новой коронавирусной инфекции. Современные технологии в медицине. 2020; 12 (2): 6–13. https://doi.org/http://doi.org/10.17691/stm2020.12.2.01.
22. Forecast the global spread of COVID-19. URL: https://ods.ai/competitions/sberbank-covid19-forecast (дата обращения 17.06.2021).
23. Prokhorenkova L., Gusev G., Vorobev A., et al. CatBoost: unbiased boosting with categorical features. 32nd Conference on Neural Information Processing Systems. NeurIPS; 2018.
24. Стопкоронавирус.РФ. URL: https://стопкоронавирус.рф (дата обращения 17.06.2021).
25. COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/COVID-19 (дата обращения 17.06.2021).
26. Pavlyshenko B.M. Linear, machine learning and probabilistic approaches for time series analysis. The 1st IEEE International Conference on Data Stream Mining & Processing, 23–27 August 2016, Lviv, Ukraine.
27. Ji C., Zoua X., Hu Y., et al. XG-SF: an XGBoost classifier based on shapelet features for time series classification. Procedia Comput Sci. 2019; 147: 24–8. https://doi.org/10.1016/j.procs.2019.01.179.
28. Botchkarev A. Performance metrics (error measures) in machine learning regression, forecasting and prognostics: properties and typology. arXiv:1809.03006. https://doi.org/10.28945/4184.
Рецензия
Для цитирования:
Гаврилов Д.В., Абрамов Р.В., Кирилкина А.В., Ившин А.А., Новицкий Р.Э. Модель прогнозирования пандемии COVID-19 на основе машинного обучения в отдельных регионах Российской Федерации. ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология. 2021;14(3):342-356. https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.108
For citation:
Gavrilov D.V., Abramov R.V., Kirilkina А.V., Ivshin А.А., Novitskiy R.E. COVID-19 pandemic prediction model based on machine learning in selected regions of the Russian Federation. FARMAKOEKONOMIKA. Modern Pharmacoeconomics and Pharmacoepidemiology. 2021;14(3):342-356. (In Russ.) https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.108

Контент доступен под лицензией Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.