Искусственный интеллект воссоздал 500 миллионов лет биологической эволюции
Исследователи совершили значительный прорыв в области искусственного интеллекта и биологической эволюции, разработав инновационную модель ESM3, которая способна имитировать процессы эволюции, охватывающие период в 500 миллионов лет. Благодаря этой технологии удалось создать совершенно новый флуоресцентный белок, сообщает научный журнал Nature Biotechnology.
Научная группа под руководством Томаса Хейса успешно применила мультимодальную генеративную языковую модель ESM3 для разработки и синтеза уникального яркого флуоресцентного белка. Особенность этого белка заключается в том, что его генетическая последовательность кардинально отличается от всех известных науке флуоресцентных белков.
Новый метод открывает беспрецедентные возможности для исследования огромного разнообразия потенциальных белков. Это позволяет не только углубить понимание естественно эволюционировавших белков, но и создавать новые белковые структуры для применения в медицине, экологической очистке и множестве других областей.
Уникальность модели ESM3 заключается в ее способности анализировать последовательность, структуру и функции белков, представляя их через алфавиты дискретных токенов, которые могут комбинироваться в генеративной языковой модели. Этот подход существенно отличается от предыдущих языковых моделей, которые были ограничены только анализом белковых последовательностей.
Для обучения ESM3 использовался масштабный набор данных, включающий 771 миллиард уникальных токенов, созданных на основе 3,15 миллиарда белковых последовательностей, 236 миллионов белковых структур и 539 миллионов белков с функциональными аннотациями. Модель способна обрабатывать до 98 миллиардов параметров.
В настоящее время ESM3 доступна в публичной бета-версии через API, что позволяет ученым программно проектировать белки или использовать интерактивные браузерные приложения. Исследователи могут получить доступ к API EvolutionaryScale Forge через бесплатный академический уровень или использовать код и веса открытой модели.