Среда, 21 февраля, 2024
ДомойТехнологии«FrameDiff» Массачусетского технологического института — генеративный ИИ представляет новые белковые структуры, которые...

«FrameDiff» Массачусетского технологического института — генеративный ИИ представляет новые белковые структуры, которые могут изменить медицину

- Advertisement -

Система FrameDiff была протестирована на задаче создания отдельных белков, и исследователи обнаружили, что она может создавать большие белки, содержащие до 500 частей. В отличие от предыдущих методов, ему не нужно полагаться на уже существующую карту структуры белка. Предоставлено: Алекс Шиппс/MIT CSAIL через Midjourney.

Массачусетский технологический институт исследователи разрабатывают «FrameDiff», вычислительный инструмент, который использует генеративный ИИ для создания новых белковых структур с целью ускорения разработки лекарств и улучшения генной терапии.

Исследователи CSAIL Массачусетского технологического института разработали вычислительный инструмент FrameDiff, который использует генеративный ИИ для создания новых белковых структур. Оно использует машинное обучение моделировать белковые «каркасы» и корректировать их в 3D, создавая белки, выходящие за рамки известных конструкций. Этот прорыв может ускорить разработку лекарств и улучшить генную терапию за счет создания белков, которые связываются более эффективно, с потенциальными применениями в биотехнологии, адресной доставке лекарств и многом другом.

Биология — это удивительный, но тонкий гобелен. В основе лежит ДНК, главный ткач, который кодирует белки, отвечающие за организацию многих биологических функций, поддерживающих жизнь в человеческом теле. Однако наше тело подобно тонко настроенному инструменту, подверженному потере гармонии. В конце концов, мы сталкиваемся с постоянно меняющимся и безжалостным миром природы: патогенами, вирусами, болезнями и раком.

Представьте, если бы мы могли ускорить процесс создания вакцин или лекарств от недавно появившихся патогенов. Что, если бы у нас была технология редактирования генов, способная автоматически производить белки для исправления ошибок ДНК, вызывающих рак? Стремление идентифицировать белки, которые могут прочно связываться с мишенями или ускорять химические реакции, имеет жизненно важное значение для разработки лекарств, диагностики и многочисленных промышленных применений, однако это часто является длительным и дорогостоящим делом.

Чтобы расширить наши возможности в области белковой инженерии, исследователи MIT CSAIL придумали «FrameDiff», вычислительный инструмент для создания новых белковых структур, превосходящих то, что создала природа. Подход машинного обучения генерирует «фреймы», которые соответствуют неотъемлемым свойствам белковых структур, что позволяет создавать новые белки независимо от ранее существовавших конструкций, способствуя созданию беспрецедентных белковых структур.

«В природе белковый дизайн — это медленный процесс, который занимает миллионы лет. Наша методика направлена ​​на решение проблем, созданных человеком, которые развиваются намного быстрее, чем темпы природы», — говорит аспирант MIT CSAIL Джейсон Йим, ведущий автор новой статьи об этой работе. «Цель в отношении этой новой способности создавать синтетические белковые структуры открывает множество расширенных возможностей, таких как лучшие связующие вещества. Это означает создание белков, которые могут более эффективно и избирательно присоединяться к другим молекулам, что имеет широкое значение, связанное с адресной доставкой лекарств и биотехнологиями, где это может привести к разработке более совершенных биосенсоров. Это также может иметь значение для области биомедицины и не только, предлагая такие возможности, как разработка более эффективных фотосинтез белки, создание более эффективных антител и разработка наночастиц для генной терапии».

Обрамление FrameDiff

Белки имеют сложную структуру, состоящую из множества атомов, соединенных химическими связями. Наиболее важные атомы, определяющие трехмерную форму белка, называются «остовом», что-то вроде остова белка. Каждая тройка атомов вдоль основной цепи имеет один и тот же образец связей и атом типы. Исследователи заметили, что этот шаблон можно использовать для построения алгоритмов машинного обучения с использованием идей дифференциальной геометрии и вероятности. Вот тут-то и появляются кадры: математически эти триплеты можно смоделировать как твердые тела, называемые «фреймами» (распространенные в физике), которые имеют положение и вращение в 3D.

Генерация структуры белка FrameDiff

Создание структуры белка с помощью FrameDiff. Предоставлено: Ян Хейдон/Институт белкового дизайна.

Эти кадры снабжают каждую тройку достаточным количеством информации, чтобы знать о своем пространственном окружении. Затем задача алгоритма машинного обучения состоит в том, чтобы научиться перемещать каждый кадр для построения белковой основы. Мы надеемся, что алгоритм, научившись конструировать существующие белки, обобщится и сможет создавать новые белки, никогда ранее не встречавшиеся в природе.

Обучение модели конструированию белков с помощью «диффузии» включает в себя введение шума, который случайным образом перемещает все кадры и размывает то, как выглядел исходный белок. Задача алгоритма состоит в том, чтобы перемещать и вращать каждый кадр, пока он не станет похож на исходный белок. Несмотря на простоту, развитие диффузии на фреймах требует методов стохастического исчисления на римановых многообразиях. С теоретической точки зрения исследователи разработали «диффузию SE (3)» для изучения распределений вероятностей, которая нетривиально связывает компоненты переноса и поворота каждого кадра.

Тонкое искусство распространения

В 2021 году DeepMind представила AlphaFold2, алгоритм глубокого обучения для прогнозирования трехмерных структур белков на основе их последовательностей. При создании синтетических белков есть два основных этапа: генерация и предсказание. Генерация означает создание новых белковых структур и последовательностей, а «предсказание» означает определение трехмерной структуры последовательности. Не случайно AlphaFold2 также использовал каркасы для моделирования белков. Диффузия SE(3) и FrameDiff были вдохновлены тем, чтобы развить идею фреймов дальше, включив фреймы в модели диффузии, метод генеративного ИИ, который стал чрезвычайно популярным в создании изображений, например Midjourney.

Общие рамки и принципы для создания и предсказания структуры белка означали, что лучшие модели с обеих сторон были совместимы. Совместно с Институтом белкового дизайна им. Вашингтонский университетдиффузия SE(3) уже используется для создания и экспериментальной проверки новых белков. В частности, они объединили диффузию SE (3) с RosettaFold2, инструментом предсказания структуры белка, очень похожим на AlphaFold2, что привело к «RF-диффузии». Этот новый инструмент приблизил разработчиков белков к решению важнейших проблем биотехнологии, включая разработку высокоспецифичных белковых связующих для ускоренного конструирования вакцин, создание симметричных белков для доставки генов и надежные каркасы мотивов для точного конструирования ферментов.

Будущие усилия для FrameDiff включают повышение универсальности задач, которые объединяют несколько требований к биологическим препаратам, таким как лекарства. Еще одним расширением является обобщение моделей на все биологические модальности, включая ДНК и малые молекулы. Команда утверждает, что, расширив обучение FrameDiff на более существенных данных и улучшив процесс оптимизации, он может создавать фундаментальные структуры, обладающие возможностями проектирования наравне с RFdiffusion, сохраняя при этом присущую FrameDiff простоту.

«Отказ от предварительно обученной модели прогнозирования структуры [in FrameDiff] открывает возможности для быстрого создания структур большой длины», — говорит биолог-вычислитель Гарвардского университета Сергей Овчинников. Инновационный подход исследователей предлагает многообещающий шаг к преодолению ограничений современных моделей прогнозирования структуры. Хотя это все еще предварительная работа, это обнадеживающий шаг в правильном направлении. Таким образом, концепция дизайна белков, играющая ключевую роль в решении самых насущных проблем человечества, кажется все более достижимой благодаря новаторской работе этой исследовательской группы Массачусетского технологического института».

Йим написал статью вместе с Колумбийский университет постдоктор Брайан Трипп, Французский национальный центр научных исследований в Париже, исследователь Центра науки о данных Валентин Де Бортоли, постдоктор Кембриджского университета Эмиль Матье и профессор статистики Оксфордского университета и старший научный сотрудник DeepMind Арно Дусе. Профессора Массачусетского технологического института Регина Барзилай и Томми Яаккола консультировали исследование.

Работа группы была частично поддержана MIT Abdul Latif Jameel Clinic for Machine Learning in Health, грантами EPSRC и Партнерством по обеспечению процветания между Microsoft Research и Кембриджским университетом, программой стипендий для выпускников Национального научного фонда, грантом NSF Expeditions, консорциумом Machine Learning for Pharmaceutical Discovery and Synthesis, программой DTRA Discovery of Medical Countermeasures Against New and Emerging Threats, ДАРПА Программа Accelerated Molecular Discovery и грант Sanofi Computational Antibody Design. Это исследование будет представлено на Международной конференции по машинному обучению в июле.

Ссылка: «Модель диффузии SE (3) с применением к генерации белкового остова» Джейсона Йима, Брайана Л. Триппа, Валентина Де Бортоли, Эмиля Матье, Арно Дусе, Регины Барзилай и Томми Яакколы, 22 мая 2023 г., Информатика > Машинное обучение.
архив: 2302.02277

Исходная ссылка

- Advertisement -

Популярное по теме