Авторы исследования отмечают, что нейросети в последнее десятилетие научились генерировать изображения, которые практически невозможно отличить от настоящих. Этот принцип взяли за основу эстонские ученые.

Интересно Инженеры нашли способ, как увеличить мощность никель-металлогидридных батарей в 10 раз

В своей работе мы применяем аналогичную концепцию к генетическим данным, анализируя их структуру и на ее основе создавая высококачественные реалистичные геномы,
– рассказали авторы исследования.

Как работает нейросеть и что она делает

Нейросеть создает фрагменты человеческих геномов, которые не принадлежат реальным людям, но соответствуют характеристикам настоящей ДНК. Это позволяет исследователям не беспокоиться об этической стороне вопроса.

Ученые отмечают, что существующие геномные базы данных являются бесценным ресурсом для медицинских исследований, но они либо недоступны для общественности, либо защищены долгими и изнурительными процедурами подачи заявок через этические соображения.

Это создает барьер для исследователей. Геномы, сгенерированные машиной, или, как мы их называем, искусственные геномы, могут помочь нам преодолеть ограничения в рамках этических норм,
– объяснил Бурак Эльм, первый автор исследования и сотрудник Тартуского университета.

Согласно действующей исследовательской парадигме, ученые должны гарантировать конфиденциальность людей, которым принадлежит используемая в исследованиях ДНК. Учреждения не имеют права обмениваться базами данных ДНК, из-за чего материала для исследований часто не хватает. Синтетические геномы должны помочь в решении этих проблем.

Команда Тартуского университета провела несколько анализов, чтобы оценить качество сгенерированных геномов по сравнению с реальными.

Ученые также проанализировали близость искусственных геномов к реальным геномам, чтобы проверить, сохраняется ли конфиденциальность исходных образцов. Авторы статьи отмечают, что искусственные реалистичные геномы смогут в будущем заменить реальные, что позволит значительно ускорить исследование ДНК, особенно для недостаточно представленных популяций.