В России третий год действует проект, по которому федеральный исследовательский центр онкологии помогает наладить лечение онкобольных в регионах. Чтобы узнать, сколько препаратов закупить региону, на каком этапе буксует лечение пациента и получает ли он терапию в нужном объеме, надо анализировать большой массив данных.
«Такие дела» поговорили с онкологом Юрием Комаровым, заведующим отделом по организационно-методической работе с регионами НМИЦ имени Петрова, о том, зачем врачу нужны big data и как с их помощью наладить систему онкологической помощи.
— Почему вы, врач, решили заняться анализом больших данных?
заведующий отделом по организационно-методической работе с регионами Национального медицинского исследовательского центра онкологии имени Н. Н. Петрова
— В НМИЦ около 80% врачей имеют ученую степень и занимаются наукой, что автоматически подразумевает проведение анализа данных, но в основном это небольшие датасеты, не превышающие 1000 человек. Я тоже проводил анализ эффективности лечения пациентов, но обычно все сводилось к каким-то простым методам, для чего подходил Excel или стандартные функции статистических программ.
В 2018 году нашему центру поручили оказывать организационно-методическую помощь субъектам СЗФО, а я возглавил отдел, который занимается такой работой. Возникла необходимость анализировать значительно больше информации, чем о 1000 пациентов. И на этом этапе я понял, что моих данных по анализу недостаточно и необходимо знания повышать, чтобы я мог дать нормальное техническое задание программисту или аналитику.
Большие данные могут позволить, во-первых, повысить качество оказания медицинской помощи, во-вторых, делать прогнозы.
— Какие данные и зачем вы анализируете?
— Мы курируем Северо-Западный федеральный округ. Получается, у нас ежемесячно скапливается информация по одиннадцати субъектам. Мы анализируем, как складывается онкологическая ситуация в регионах, какие нужно провести улучшения.
Пациент по клиническим рекомендациям должен получать лечение по порядку. Например, мы провели хирургическое лечение — пациент должен начать химиотерапию. Мы смотрим, в каких субъектах в среднем она начинается вовремя, в каких сроки оказания медицинской помощи не соблюдаются, в каких она вообще не начинается.
Смотрим маршрутизацию движения пациентов, то есть куда пациент направляется, где он обследуется, соблюдаются или не соблюдаются сроки лечения этого пациента и сроки применения лекарственных препаратов.
Все эти ошибки мы вылавливаем и предлагаем региону рекомендации — как им необходимо выстроить систему оказания медицинской помощи и на что стоит обратить внимание, чтобы они провели более углубленный анализ.
Например, сейчас мы отслеживаем количество проведений химиотерапии в субъектах. Какие схемы пациент получил, в каких медорганизациях, достаточно ли там врачей-онкологов для оказания помощи в срок. Сопоставляя эти данные, можно сказать, во-первых, соблюдают ли они сроки. Во-вторых, правильно ли лечат пациента, потому что каждая схема подходит под конкретный тип злокачественного образования. Если мы видим, что пациента лечат какой-то схемой терапии, которая не является стандартом для его типа рака, то мы эти случаи выявляем и отправляем на дополнительную проверку субъекту.
— А как это влияет на эффективность лечения?
— Клетки делятся с определенной частотой. Лекарственная терапия (включая химиотерапию, таргетную и иммунотерапию) влияет на то, что клетки опухоли начинают погибать. И, так как лечение проводится с определенной периодичностью, нам важно проводить ее в определенный срок — когда клетки хотят начать делиться, подавить этот рост. Если была отсрочка лечения, это значит, что клетки, которые мы «убили» на первом цикле, могут начать вновь активно делиться и рост опухоли увеличится. Получается, что эффект лечения может снизиться из-за того, что клетки приобретают устойчивость, как к антибиотикам, и дальше лечить этим препаратом бессмысленно.
Еще один из примеров — если пациенту назначается одна схема лечения, потом через время — другая. Это приводит к такому дисбалансу, что опухоль начинает привыкать. Чтобы это исключить, мы и проверяем правильность назначения лечения.
Наша задача — сделать максимально доступной медицинскую помощь. Неважно, где находится пациент и куда он пришел, — он везде получит адекватную помощь как по лекарственному лечению, так и по обследованию, диагностике, морфологическому и молекулярно-генетическому исследованию в соответствии с клиническими рекомендациями.
— Над аналитикой каких данных вы работаете сейчас?
— У нас задача рассчитать потребность каждого субъекта в лекарственных препаратах. Сколько примерно лекарств потребуется для лечения пациентов в субъектах с максимальным соблюдением клинических рекомендаций.
В некоторых субъектах используется ретроспективный метод: покупали в прошлом году столько препаратов, их не хватило, в следующем году покупаем, например, на 10% больше. В большинстве субъектов этот расчет проводится без учета структуры заболеваемости.
Мы решаем первую задачу — оптимизацию затрат, потому что если в регионе купили партию препарата, у него срок годности вышел и он не был использован, то это материальные потери региона, и кто-то из пациентов из-за неверного планирования не получил необходимый препарат. Мы анализируем заболеваемость, распределение по стадиям, то есть максимально основываемся на цифрах.
На основе этих данных и клинических рекомендаций составляем условный калькулятор расчета потребности в лекарственных препаратах. В прошлом году мы провели первый расчет. Но, опять же, этот процесс не делается за один год, поэтому наша формула расчета пока не оптимальна и могут быть какие-то корректировки. Мы будем ее совершенствовать: [смотреть] правильно или неправильно посчитали, какие были упущения, вводить поправочные коэффициенты по миграции населения, по доле пациентов, которые лечатся вне субъекта. Это позволит сэкономить бюджет и сформировать покупку лекарственных препаратов.
— В регионе есть специалисты, которые могут анализировать эти данные?
— Мы все врачи. Никто из нас такому анализу не обучался. Да, в рамках обучения в вузах есть небольшой курс статистики, который затрагивает в основном те показатели, которые необходимы для формирования отчетных форм — и именно по медицинским организациям.
Специалисты региональных медицинских организаций, отвечающие за статистику, в основном используют стандартные формулы расчета: возьму таблицу 1, из нее 10-ю ячейку, сложу с ячейкой 5, получится такой-то результат. Если он больше такого-то показателя, значит это плохо, если меньше — хорошо. Такой статистике обучают. И, конечно, этого мало, если вы хотите анализировать данные.
Врачи не заточены на то, чтобы такой большой объем данных анализировать. И так как этому не обучают, то некоторым сложно даже сформулировать техническое задание для специалистов — аналитиков, статистиков, математиков, которые могли бы им помочь.
И я считаю, что тем специалистам, которые занимаются организацией здравоохранения в регионах, — это не обязательно главный внештатный онколог, это могут быть специалисты местного департамента здравоохранения либо в диспансерах, в которых осуществляется сбор статистики и аналитика, — нужно изучать анализ больших данных.
— То есть вы учились самостоятельно?
— Для решения моих задач я не нашел специализированного модуля именно по медицинской статистике, которая позволила бы мне решать поставленные задачи. Я пошел учиться на «Яндекс.Практикум». Очень долго сомневался, практически год смотрел и проходил пробные занятия, но в итоге, когда начали поступать слишком большие данные, которые нужно анализировать, я понял, что нужно самому хотя бы вникнуть в эту проблему и получить дополнительные знания.
Есть стартапы, которые разрабатывают и машинное обучение, и нейронные сети для анализа медицинских данных. Но там работают в основном не врачи, а IT-специалисты и программисты. Надеюсь, что, может быть, благодаря и вашей статье мы будем дальше развивать анализ больших данных для практикующих врачей, организаторов здравоохранения, медицинских статистиков.