Preview

ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология

Расширенный поиск

Модель прогнозирования пандемии COVID-19 на основе машинного обучения в отдельных регионах Российской Федерации

https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.108

Аннотация

Актуальность. Прогнозирование распространения новой коронавирусной инфекции (COVID-19) имеет важное значение для принятия своевременных системных профилактических и противоэпидемических мер как на региональном, так и на федеральном уровне с целью снижения заболеваемости и смертности.

Цель: разработать модель краткосрочного прогнозирования зараженных и умерших от COVID-19 в Российской Федерации.

Материал и методы. Данные для обучения модели собраны c портала Стопкоронавирус.рф и ресурса Университета Джонcа Хопкинса. Она включает 13 признаков для оценки динамики заражения и летальности, а также скорости их прироста в разных странах и отдельных регионах Российской Федерации. Модель обучена методом градиентного бустинга CatBoost и ежедневно переобучается на обновленных данных.

Результаты. Создана модель краткосрочного предсказания числа зараженных и умерших от COVID-19 на период до 14 дней. Оценка точности модели с учетом ошибки предсказания в процентах (англ. mean absolute percentage error, MAPE) составляет от 2,3% до 24% для 85 регионов России. Показано преимущество метода машинного обучения CatBoost перед линейной регрессией на примере величины среднеквадратичной ошибки (англ. root mean square error, RMSE). Модель показывает меньшую ошибку для регионов с большой численностью населения, чем для менее населенных областей.

Заключение. Модель может быть использована не только для прогнозирования пандемии новой коронавирусной инфекции, но и для контроля и оценки распространения заболеваний из группы новых инфекций на этапах их возникновения, пика заболеваемости и периода стабилизации.

Об авторах

Д. В. Гаврилов
Общество с ограниченной ответственностью «К-Скай»
Россия

Гаврилов Денис Владимирович – руководитель медицинского направления

РИНЦ SPIN-код: 2860-6040

наб. Варкауса, д. 17, помещ. 62, Республика Карелия, Петрозаводск 185031, Россия



Р. В. Абрамов
Общество с ограниченной ответственностью «К-Скай»
Россия

Абрамов Роман Владимирович – аналитик данных

наб. Варкауса, д. 17, помещ. 62, Республика Карелия, Петрозаводск 185031, Россия



А. В. Кирилкина
Государственное бюджетное учреждение здравоохранения «Республиканская инфекционная больница»
Россия

Кирилкина Анна Валерьевна – заместитель главного врача по медицинской части

ул. Кирова, д. 42, Петрозаводск 185035, Россия



А. А. Ившин
Федеральное государственное бюджетное образовательное учреждение высшего образования «Петрозаводский государственный университет»
Россия

Ившин Александр Анатольевич – к.м.н., заведующий кафедрой акушерства и гинекологии, дерматовенерологии 

Scopus Author ID: 57222275843; РИНЦ SPIN-код: 8196-6605 

пр-т Ленина, д. 33, Республика Карелия, Петрозаводск 185910, Россия



Р. Э. Новицкий
Общество с ограниченной ответственностью «К-Скай»
Россия

Новицкий Роман Эдвардович – генеральный директор

РИНЦ SPIN-код: 8309-1740

наб. Варкауса, д. 17, помещ. 62, Республика Карелия, Петрозаводск 185031, Россия



Список литературы

1. WHO Coronavirus (COVID-19) Dashboard. URL: https://covid19.who.int/ (дата обращения 17.06.2020).

2. Временные методические рекомендации «Профилактика, диагностика и лечение новой коронавирусной инфекции (COVID 19). Версия 11» (утв. Министерством здравоохранения РФ 7 мая 2021 г.). URL: https://base.garant.ru/400738625/ (дата обращения 17.06.2021).

3. Huang C., Wang Y., Li X., et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Lancet. 2020; 395 (10223): 497–506. https://doi.org/10.1016/S0140-6736(20)30183-5.

4. Onder G., Rezza G., Brusaferro S. Case-fatality rate and characteristics of patients dying in relation to COVID-19 in Italy. JAMA. 2020; 323 (18): 1775–6. https://doi.org/10.1001/jama.2020.4683.

5. Mehta P., McAuley D.F., Brown M., et al. COVID-19: consider cytokine storm syndromes and immunosuppression. Lancet. 2020; 395 (10229): 1033–4. https://doi.org/10.1016/S0140-6736(20)30628-0.

6. Hollander J.E., Carr B.G. Virtually perfect? Telemedicine for COVID-19. N Engl J Med. 2020; 382 (18): 1679–81. https://doi.org/10.1056/NEJMp2003539.

7. Стенограмма совещания о санитарно-эпидемиологической обстановке в России (13.04.2020 г.). URL: http://prezident.org/tekst/stenogramma-soveschanija-o-sanitarno-epidemiologicheskoi-obstanovke-v-rossii-13-04-2020.html (дата обращения 17.06.2021).

8. Гусев А.В., Добриднюк С.Л. Искусственный интеллект в медицине и здравоохранении. Информационное общество. 2017; 4-5: 78–93.

9. Гусев А.В., Плисс М.А. Основные рекомендации к созданию и развитию информационных систем в здравоохранении на базе искусственного интеллекта. Врач и информационные технологии. 2018; 3: 45–60.

10. Гусев А.В., Кузнецова Т.Ю., Корсаков И.Н. Искусственный интеллект в оценке рисков развития сердечно-сосудистых заболеваний. Журнал телемедицины и электронного здравоохранения. 2018; 3 (8): 85–90.

11. Гусев А.В., Гаврилов Д.В., Корсаков И.Н. и др. Перспективы использования методов машинного обучения для предсказания сердечно-сосудистых заболеваний. Врач и информационные технологии. 2019; 3: 41–7.

12. Тамм М.В. Коронавирусная инфекция в Москве: прогнозы и сценарии. ФАРМАКОЭКОНОМИКА. Современная фармако экономика и фармакоэпидемиология. 2020; 13 (1): 43–51. https://doi.org/10.17749/2070-4909.2020.13.1.43-51.

13. Fanelli D., Piazzab F. Analysis and forecast of COVID-19 spreading in China, Italy and France. Chaos Solitons Fractals. 2020; 134: 109761. https://doi.org/10.1016/j.chaos.2020.109761.

14. Petropoulos F., Makridakis S. Forecasting the novel coronavirus COVID-19. PLoS One. 2020; 15 (3): e0231236. https://doi.org/10.1371/journal.pone.0231236.

15. Ceylan Z. Estimation of COVID-19 prevalence in Italy, Spain, and France. Sci The Total Environ. 2020; 729: 138817. https://doi.org/10.1016/j.scitotenv.2020.138817.

16. Roda W.C., Varughese M.B., Han D., Li M.Y. Why is it difficult to accurately predict the COVID-19 epidemic? Infect Dis Model. 2020; 5: 271–81. https://doi.org/10.1016/j.idm.2020.03.001.

17. Pandey G., Chaudhary P., Gupta R., Pal S. SEIR and Regression Model based COVID-19 outbreak predictions in India. arXiv:2004.00958. https://doi.org/10.1101/2020.04.01.20049825.

18. Алешукина А.В., Денисенко В.В., Алешукин Г.С., Голошва Е.В. Применение математической модели для прогнозирования эпидемиологической ситуации по COVID-19 в Ростовской области. COVID19-Preprints.Microbe.ru; 2020. https://doi.org/10.21055/preprints-3111736.

19. Yang Z., Zeng Z., Wang K., et al. Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions. J Thorac Dis. 2020; 12 (3): 165–74. https://doi.org/10.21037/jtd.2020.02.64.

20. Petropoulos F., Makridakis S. Forecasting the novel coronavirus COVID-19. PLoS One. 2020; 15 (3): e0231236. https://doi.org/10.1371/journal.pone.0231236.

21. Мелик-Гусейнов Д.В., Карякин Н.Н., Благонравова А.С. и др. Регрессионные модели прогнозирования количества летальных исходов при новой коронавирусной инфекции. Современные технологии в медицине. 2020; 12 (2): 6–13. https://doi.org/http://doi.org/10.17691/stm2020.12.2.01.

22. Forecast the global spread of COVID-19. URL: https://ods.ai/competitions/sberbank-covid19-forecast (дата обращения 17.06.2021).

23. Prokhorenkova L., Gusev G., Vorobev A., et al. CatBoost: unbiased boosting with categorical features. 32nd Conference on Neural Information Processing Systems. NeurIPS; 2018.

24. Стопкоронавирус.РФ. URL: https://стопкоронавирус.рф (дата обращения 17.06.2021).

25. COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/COVID-19 (дата обращения 17.06.2021).

26. Pavlyshenko B.M. Linear, machine learning and probabilistic approaches for time series analysis. The 1st IEEE International Conference on Data Stream Mining & Processing, 23–27 August 2016, Lviv, Ukraine.

27. Ji C., Zoua X., Hu Y., et al. XG-SF: an XGBoost classifier based on shapelet features for time series classification. Procedia Comput Sci. 2019; 147: 24–8. https://doi.org/10.1016/j.procs.2019.01.179.

28. Botchkarev A. Performance metrics (error measures) in machine learning regression, forecasting and prognostics: properties and typology. arXiv:1809.03006. https://doi.org/10.28945/4184.


Рецензия

Для цитирования:


Гаврилов Д.В., Абрамов Р.В., Кирилкина А.В., Ившин А.А., Новицкий Р.Э. Модель прогнозирования пандемии COVID-19 на основе машинного обучения в отдельных регионах Российской Федерации. ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология. 2021;14(3):342-356. https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.108

For citation:


Gavrilov D.V., Abramov R.V., Kirilkina А.V., Ivshin А.А., Novitskiy R.E. COVID-19 pandemic prediction model based on machine learning in selected regions of the Russian Federation. FARMAKOEKONOMIKA. Modern Pharmacoeconomics and Pharmacoepidemiology. 2021;14(3):342-356. (In Russ.) https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.108

Просмотров: 3264


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.


ISSN 2070-4909 (Print)
ISSN 2070-4933 (Online)