Коммерческие решения на основе искусственного интеллекта (ИИ) почти 20 лет как вошли в клиническую практику и помогают врачам в диагностике заболеваний, ведении документации и наблюдении за пациентами. Причем тенденция усиливается: с 2015 по 2019 год количество ИИ-продуктов, ежегодно допускаемых для использования в клинике, выросло в 7,5 раза в Европе и в 8,5 раза в США. С 2018 года мировой объем рынка ИИ для медицинской диагностики вырос более чем в три раза, и аналитические фирмы прогнозируют 48-процентный среднегодовой рост до 2029 года. Тренд можно наблюдать и в России: первый диагностический алгоритм применили в московской клинике в 2020 году, в 2022-м еще 11 регионов страны внедрили ИИ в работу медучреждений.
При этом точность сегодняшних диагностических алгоритмов варьируется от 75 до 99 процентов, в то время как в персонализированной онкологии стандартный порог качества генетического тестирования — это чувствительность от 98 до 100 процентов при обнаружении соматических мутаций. Поэтому у одной части людей внедрение высоких технологий вызывает оптимизм, у другой — скепсис и сомнения. Разберемся, можно ли полностью доверять ИИ-системам, как оценивают их эффективность и можно ли ее повысить.
Этот текст написан в партнерстве с OpenBio. 25 февраля 2025 года на площадке стартует второй поток курса, в котором эксперты из области биоинформатики и машинного обучения, работающие в международных IT-компаниях, расскажут о базовых и продвинутых подходах к разработке моделей, в том числе в области анализа изображений и мультиомиксных данных для биомедицины. Приходите, чтобы узнать больше о тонкостях работы в этой сфере и научиться создавать эффективные и полезные модели машинного обучения для ваших задач. Промокод PLUS даст вам скидку 15 процентов на тариф для физических лиц.
Реклама: АНО «ИЦК», ИНН 5433141963, erid: LjN8K8hEJ
Недостаточно точно?
Уровень точности современных медицинских систем на основе ИИ легче всего оценить на примере систем компьютерного зрения, которые уже применяются медучреждениями в России. Как правило, метрики их качества публикуются в рецензируемых статьях или в виде технической документации на сайте продукта.
Так, инструмент Chest-IRA компании IRA Labs для анализа радиологических изображений грудной полости диагностирует рак легких с коэффициентом качества около 90 процентов. Платформа «Третье мнение» предлагает похожее решение для маммографии с точностью 89 процентов, установленной на
Во внутреннем тестировании анализ проводят на данных, полученных из близких к разработчикам источников. Например из партнерской клиники, участвующей в создании алгоритма. Внешнее тестирование предполагает использование независимых данных, которых алгоритм точно никогда «не видел». Внешнее исследование добавило бы веса, но в данном случае внутреннее тестирование довольно авторитетно, поскольку проводилось на большом числе разных пациентов.
. ИИ-инструмент для обработки данных флюорографии от «Цельса» в сравнительном исследовании со схожими решениями показал чувствительность в 87,5 процента.
В мировой практике результаты аналогичны: например, инструмент для диагностики диабетической ретинопатии IDx-DR от Healthvisors получил одобрение для применения в клинике на основании валидационного исследования, которое показало чувствительность 87 процентов и специфичность 90 процентов.
Пока такие значения не могут соревноваться с высокой точностью генетического тестирования для онкологии (это уже упомянутые 98–100 процентов), которую демонстрируют в технических описаниях продуктов такие гиганты индустрии, как Foundation Medicine и Tempus. Задача этих тестов — обнаружить генетические события, которые помогут уточнить диагноз или назначить эффективное таргетное лечение, а так как противоопухолевые препараты — дорогое удовольствие, необходимо быть на 100 процентов уверенным, что подходящая мишень действительно есть в опухоли. Этого, в частности, требуют страховые компании, которые оплачивают лечение. Отсюда и высокие требования к метрикам.
На фоне высоких стандартов в генетическом тестировании показатели качества диагностических ИИ-систем выглядят удручающе. Например, для рака легких 90-процентная чувствительность означает, что у одного из десяти действительно больных пациентов опухоль пропустят при обследовании, а такая же специфичность говорит о том, что одному из десяти здоровых людей ошибочно диагностируют рак. Это же кошмар! Или нет?..
Машинное обучение в сегодняшней медицине
В Европе и США почти каждый второй врач использует ИИ в своей практике. Не без проблем, но новые технологии уже преображают многие медицинские сферы.
Так, алгоритмы для диагностики по изображениям, включая анализ гистологических срезов, рентгеновских снимков, КТ и МРТ, европейские врачи считают самым полезным применением ИИ в медицине. В частности, обученные модели помогают сэкономить время обследования, по разным оценкам, на 10–40 процентов по сравнению с традиционными методами.