Как машинное обучение НЕ помогло в борьбе с Covid-19

#ai_inside #ai_med



Когда в 2020 году вспышка Covid-19 переросла в пандемию, все бросились разрабатывать ИИ для борьбы с болезнью. Вот уж где ИИ точно доказал бы свою пользу для мира! Создавались нейросети для раннего выявления болезни, предсказания выздоровления и появления осложнений, а также просто тонна моделей для предсказания роста заболеваемости в разных странах.



Недавно ученые-эпидемиологи провели два больших исследования моделей для борьбы с covid-19. Результаты опубликованы в научных журналах: the British Medical Journal и Nature Machine Intelligence.

Выводы поразили даже самих авторов: ни одна из более чем 600 моделей на основе ИИ не помогает в борьбе с covid-19 и не может быть использована в клинических условиях. А в некоторых случаях технологии могут скорее навредить, чем помочь: предсказать вкорне неверное течение болезни и помешать лечению.



Получается, наш всесильный ИИ оказался тут бессилен ¯\_(ツ)_/¯

Разбираемся, почему так вышло:



Главная проблема здесь даже не в самом ИИ, а в данных, которые использовались для обучения ИИ. Когда начался бум "ИИ для борьбы с covid", все бросились создавать датасеты, чтобы быстрее натренировать модели. Только на одном каггле датасетов с пометкой "covid-19" — 35 тысяч! Из-за спешки базы данных часто создавались "на коленке". Вот какие проблемы это породило:



дубликаты. Из-за того, что медицинские данные — деликатная информация и может быть использована только в обезличенном виде, в базах данных часто попадаются дубликаты. В датасет может попасть два фото одного и того же скана КТ легких. Затем при делении выборки на трейн и тест одно из этих фото попадет в трейн, а другое — в тест. В таком случае результаты работы алгоритма будут искажены.



смещенность выборок. Пример: в одном датасете сканов КТ легких все фото, на которых было поражение, были получены от взрослых людей. А в качестве примеров легких без поражений использовали сканы легких детей. В итоге ИИ вместо выявления легких с поражениями научился отделять легкие взрослого человека от детских.

Это суперчастая проблема в датасетах covid-19. Отчасти она возникла потому, что медицинские данные непросто достать. И чтобы получить достаточно данных для обучения нейросетей, исследователи миксуют данные из разных источников.



артефакты. Некоторые нейросети, которых учили распознавать легкие с поражением, обращали внимание не на сами легкие, а на маркировку больницы, которая присутствует на снимке КТ. В результате предсказание течения вашей болезни основывается не на ваших симптомах, а на том, в какой больнице вы лежите)



ручная разметка. Медицинские данные для обучения ИИ размечаются реальными докторами. Часто от взгляда и опыта конкретного доктора зависит, будет конкретный снимок легких размечен как "содержащий признаки болезни" или нет. Это вносит в данные много шума.



Другие проблемы ИИ для covid-19, не связанные с данными:



непрозрачность решений. Для большинства ИИ моделей неизвестно, как они работают и на каких данных обучались. Все дело опять же в деликатности медицинских данных. Часто ИИ разработчики подписывают соглашение о конфеденциальности с госпиталями и просто не имеют права рассказывать о своих разработках.

А кто тогда знает, насколько нормально эти ИИ модели работают?



желание выделиться. Вместо того, чтобы скооперироваться и вместе создать адекватный ИИ для борьбы с covid, исследователи хотели как можно быстрее выпустить свою новую личную классненькую нейросеть (ну и прославиться). В результате у нас есть тонна плохих решений, сделанных кое-как. ( а вообще — это далеко не новая проблема в индустрии ИИ 🙃)



Такие дела. Создается ощущение, что провал ИИ в борьбе с covid вызван исключительно человеческими факторами: жадностью, поспешностью и невнимательностью. Стоит понимать, что все это происходит не только в ИИ для covid-19, но и во всей индустрии ИИ в целом. Но медицина — слишком деликатная сфера, связанная с человеческими жизнями, чтобы закрывать на такие проблемы глаза.



В следующем посте расскажем, как борются с этими проблемами.