ИССЛЕДОВАНИЕ ВЛИЯНИЯ МЕТОДОВ РАСШИРЕНИЯ ДАННЫХ И ШУМОВ НА ТОЧНОСТЬ СЕГМЕНТАЦИИ ЯДЕР В ГИСТОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЯХ С ИСПОЛЬЗОВАНИЕМ ГЛУБОКОЙ НЕЙРОННОЙ СЕТИ

Авторы: Койшиева Д.Е., Сыдыбаева М.А., Бельгинова С.А., Жаксыбаев А.М., Ерсаинова Ж.Е.
МРНТИ 50.05, 50.41

Аннотация. Сегментация медицинских изображений является одной из ключевых задач биомедицинской информатики, особенно в контексте диагностики онкологических заболеваний. Особенно актуальной является задача точной сегментации ядер клеток, что необходимо для идентификации морфологических изменений в тканях. Однако, основным вызовом и проблематикой в данной области остаются изменчивость качества изображений, ограниченные объемы доступных данных и необходимость обеспечения высокой точности и устойчивости моделей глубокого обучения. В данном исследовании был проведен анализ влияния десяти техник аугментации данных, включая добавление случайного шума различной интенсивности, на производительность модели сегментации ядер клеток. Также в эксперименте особое внимание уделено техникам, использующим искусственное добавление шума, моделирующее реальные условия, такие как вариации освещения, артефакты и дефекты при подготовке образцов. Для добавления шума использовались два вида: аддитивный гауссов шум и равномерный случайный шум с интенсивностью от минус 0.05 до 0.05 продемонстрировали значительное влияние на обобщающую способность модели, улучшая её устойчивость к гетерогенным данным. Используемая архитектура была основана на модифицированной модели UNet с внедрением модуля CBAM, который акцентирует внимание модели на значимых областях изображения. Модуль был добавлен в декодирующую часть архитектуры модели. Для экспериментов были объединены два эталонных набора данных CryoNuSeg и MoNuSeg с предварительной обработкой, включающей разбиение на патчи и преобразование формата изображений. Примененные техники аугментации включали горизонтальное и вертикальное отражение, случайное вращение, изменение контрастности, эластичную деформацию и добавление шума. Кроме того, в ходе экспериментов были исследованы комбинации аугментации. Результаты исследования показали, что техники аугментации горизонтального и вертикального отражения и случайного вращения достигли минимальных потерь, при этом точность моделей превышала девяносто процентов. Техника изменения контрастности продемонстрировала наиболее сбалансированную производительность, обеспечив средний коэффициент пересечения над объединением 0.928 и точность 92.2 процента. Данные по результатам исследования подчеркивают важность использования искусственного добавления шума как метода повышения устойчивости модели к артефактам и вариативности данных и также использование комбинированных техник аугментации. В перспективе комбинированные техники аугментации могут стать основой для разработки адаптивных алгоритмов, способных эффективно работать с гетерогенными биомедицинскими изображениями.

Ключевые слова. Гистологические изображения, рак, сегментация ядер, сверточные нейронные сети, модуль внимания, расширение данных.