Добавь сайт в закладки! Инструкция по ссылке.
Basecamp Research планирует увеличить известное генетическое разнообразие Земли в 100 раз и за два года собрать данные, на обработку которых ранее потребовалось бы более 20 лет
Британская компания Basecamp Research анонсировала запуск проекта Trillion Gene Atlas — одной из самых амбициозных инициатив в истории биологии. Цель этого проекта — собрать и проанализировать генетические данные более чем от 100 миллионов ранее не исследованных видов живых организмов, что увеличит объем известного генетического разнообразия Земли примерно в 100 раз.
Проект реализуется в сотрудничестве с компанией Anthropic, разработчиком технологий секвенирования Ultima Genomics, компанией PacBio и при поддержке вычислительной инфраструктуры Nvidia. Участники инициативы уверены, что сочетание современных методов секвенирования и искусственного интеллекта позволит выполнить объем работ, который еще недавно потребовал бы более двух десятилетий, менее чем за два года.
Основная задача проекта — создать принципиально новый массив данных для обучения биологических ИИ-моделей. В настоящее время большинство подобных систем обучаются на одних и тех же публичных базах данных, содержащих относительно ограниченный набор генетических последовательностей. В Basecamp Research считают, что именно нехватка разнообразных данных является главным ограничением для дальнейшего прогресса в области биологического ИИ.
Компания уже представила ряд моделей EDEN, обученных на собственной базе данных BaseData. В неё входит более 10 миллиардов ранее неизвестных науке генов, обнаруженных у примерно миллиона новых видов. По данным компании, работа с таким объемом информации позволила выявить новые закономерности масштабирования: по мере увеличения разнообразия биологических данных возможности ИИ растут быстрее, чем ожидалось.
Разработчики утверждают, что EDEN стала первой системой, способной проектировать потенциальные терапевтические молекулы непосредственно на основе описания заболевания. В лабораторных испытаниях модель продемонстрировала активность в человеческих Т-клетках без предварительного обучения на клинических данных. Также сообщается о создании новых антимикробных пептидов с показателем успешного попадания в целевые патогены до 97% и о развитии технологии программируемой вставки генов AI-Programmable Gene Insertion (aiPGI).

Новый проект должен значительно увеличить объем доступной для обучения информации. За последние 6 лет Basecamp Research сформировала сеть научных партнеров в 31 стране и организовала сбор генетических данных в регионах, где ранее такие исследования практически не проводились. В то же время компания объявила о новых партнерствах в Чили, Аргентине и о расширении работ в Антарктиде.
Технологической основой проекта станут системы сверхмассового секвенирования нового поколения. Ultima Genomics обеспечит высокопроизводительное чтение геномов, а PacBio предоставит технологию длинных высокоточных последовательностей, позволяющую сохранять полный генетический контекст образцов. Для обработки данных будут использоваться специализированные библиотеки для биоинформатики.
Anthropic планирует применять результаты Trillion Gene Atlas для расширения научных возможностей своего ИИ-ассистента Claude. Ожидается, что в будущем Claude сможет работать с крупными массивами биологических данных, помогая исследователям интерпретировать результаты экспериментов и ускорять разработку новых методов лечения.
По масштабу авторы сравнивают Trillion Gene Atlas с проектом «Геном человека». Однако если в начале XXI века ученые расшифровывали геном одного вида, то теперь речь идет о попытке создать крупнейшую в истории карту генетического разнообразия жизни на Земле. Разработчики надеются, что такой объем данных позволит перейти от поиска лекарств методом длительных экспериментов к более систематическому проектированию новых препаратов с помощью искусственного интеллекта.
ИсточникПоделись видео:
