Форум

Пожалуйста или Регистрация для создания записей и тем.

проект Folding@home

НазадСтраница 3 из 3

Количественная оценка точности моделей моделирования белков

4 сентября 2025 г.

Как мы можем быть уверены в точности наших молекулярных симуляционных моделей?  Это очень важный аспект всей нашей работы в Folding@home . Если мы хотим использовать симуляции для моделирования динамики и функций белков, нам необходимо, чтобы они были надёжными и точными.

Модели силовых полей белков существуют уже давно (1). По мере того, как компьютеры становились быстрее, а методы сэмплирования – умнее, временные масштабы, к которым мы могли получить доступ, продолжали расширяться (2). Эти модели параметризовались преимущественно с использованием микроскопической информации, сравнивая молекулярно-механические (ММ) энергии с квантово-механическими (КМ). Поэтому по мере расширения временных масштабов, доступных для моделирования, было очень интересно проверить, насколько хорошо эти модели могут предсказывать макроскопические величины, такие как скорость сворачивания (3) и стабильность (равновесие между свёрнутым и развёрнутым состояниями).

Вопрос о том, как именно интегрировать макроскопические экспериментальные измерения в процесс обучения силовым полям с их многочисленными микроскопическими параметрами, остаётся предметом активных исследований (4). Подход машинного обучения к этой проблеме заключается в разработке оценки , измеряющей отклонение между экспериментальными измерениями и их значениями, предсказанными с помощью моделирования, и использовании методов оптимизации для корректировки параметров силового поля с целью минимизации этой оценки.

Но что такое хорошая оценка? Предположим, мы проводим моделирование и хотим сравнить результаты с некоторыми измерениями ЯМР, например, химических сдвигов j . Типичная оценка — это метрика «хи-квадрат»,

χ2=1Н(дджддж)2σ2дж,

где j * — химический сдвиг, рассчитанный с помощью моделирования, а σ 2 — ожидаемая дисперсия, которая отражает комбинацию погрешности измерений и неопределенности модели химического сдвига, которую мы использовали для прогнозирования j *.

Хотя для некоторых приложений метрика хи-квадрат работает хорошо, в большинстве случаев мы на самом деле не знаем значений σ j (их трудно измерить!) и вместо этого хотим вывести их из данных.

По этой причине лаборатория Фёльца применяет байесовский вывод , используя алгоритм, который мы называем BICePs (байесовский вывод конформационных популяций). В этом подходе моделирование рассматривается как априорная оценка p ( X ) популяции различных конформаций белка X и функция правдоподобия , которая возвращает вероятность наблюдения экспериментальных данных при заданном X и определённом значении σ. Имея модель априорного распределения p (σ), теорема Байеса позволяет нам получить распределение всех конформаций X и σ:

п Xσ∣ ∝ ∣ Xσ⋅ п Хп σ)
апостериорная вероятность ∝ правдоподобие ⋅ априорная вероятность

Существуют некоторые хитрости для выбора хороших функций правдоподобия и приёмы для эффективной выборки распределения при наличии множества конформаций и экспериментальных измерений, но давайте опустим все эти подробности…  Что мы узнаём из всей этой выборки?   Несколько вещей:

  1. Мы узнаём апостериорное распределение конформаций белка X , полученное на основе экспериментальных измерений. Другими словами, это перевзвешенное распределение, которое (лучше) согласуется с экспериментом .
  2. Мы узнаём апостериорное распределение параметров неопределённости σ j , пик которого приходится на наиболее вероятное значение. Другими словами, мы узнаём неопределённости непосредственно из данных.

И вот что самое интересное: благодаря нашей выборке мы также получаем оценку , которую можно использовать для выбора модели , — оценку BICePs . Не вдаваясь в подробности, мы можем рассчитать для всех выборок стоимость свободной энергии , необходимую для «включения» априорных популяций p ( X ), и экспериментальные ограничения (т.е. функцию правдоподобия). Это показано на рисунке ниже.

Расчёт показателя BICePs.  Чем выше соответствие между априорным значением p ( X ) и вероятностью, тем ниже будет показатель BICePs. Лучшая модель будет иметь самый низкий показатель BICePs.

Мы протестировали этот подход к выбору модели в новой статье нашей группы:

  • Выбор модели с использованием усреднения реплик с байесовским выводом конформационных популяций. Роберт М. Радди, Тим Маршалл и Юньхуэй Ге, а также Винсент А. Фёльц. J. Chem. Theory Comput. 2025, 21, 12, 5880–5889. https://doi.org/10.1021/acs.jctc.5c00044

Мы использовали BICeP для переоценки конформационных ансамблей мини-белка хиньолина , смоделированных на Folding@home (спасибо, папки!!!) в девяти различных силовых полях с водой TIP3P, используя набор из 158 опубликованных экспериментальных измерений ЯМР (139 расстояний NOE, 13 химических сдвигов и 6 вицинальных констант J-связей для HN и Hα).

Ниже мы показываем результат перевеса популяций в марковской модели состояния, построенной с использованием силового поля A99SB-ildn. Несмотря на то, что это силовое поле благоприятствует неправильно свёрнутому состоянию, BICePs способен корректно перевесить ландшафт.

Во всех случаях перевзвешенные популяции отдают предпочтение правильно свёрнутой конформации. Оценка BICePs служит метрикой для оценки каждого силового поля. Для девяти протестированных силовых полей (A14SB, A99SB-ildn, A99, A99SBnmr1-ildn, A99SB, C22star, C27, C36, OPLS-aa) мы получили результаты, согласующиеся с данными Бошам и соавторов (2012) , которые использовали стандартную метрику χ² для выбора модели для малых полипептидов и убиквитина, смоделированных на Folding@home (!). 

Мы работаем над многими способами использования подхода BICePs в ближайшем будущем, включая (1) интеграцию подхода BICePs в автоматизированные конвейеры для систематической проверки моделей конформационных ансамблей и (2) использование оценки BICePs для вариационной оптимизации параметров функций потенциальной энергии и прямых моделей, а также обучения моделей генеративного машинного обучения.

Мы готовим несколько рукописей, в которых будут рассмотрены эти идеи, так что следите за новостями!

Ссылки и сноски

  1. Эти модели (обычно) рассматривают каждый атом как точечную частицу с частичным зарядом, подверженную действию связанных и несвязанных сил. Мы интегрируем уравнения движения, используя законы Ньютона (или их стохастические варианты, такие как динамика Ланжевена ), для анализа ансамбля молекулярных конфигураций и их динамики.
  2. В 1977 году Маккаммон, Гелин и Карплюс смогли смоделировать бычий панкреатический ингибитор трипсина (BPTI) в течение нескольких пикосекунд (1 пс = 10⁻⁶ с ). Сегодня мы можем легко генерировать данные о траектории молекулы небольшого белка, такого как BPTI,   длительностью в миллисекунды (1 мс = 10⁻⁶ с ).
  3. Сноу, Кристофер Д., Эрик Дж. Сорин, Янг Мин Ри и Виджай С. Панде. «Насколько хорошо моделирование может предсказывать кинетику и термодинамику сворачивания белков?» Ежегодный обзор биофизики и биомолекулярной структуры 34, № 1 (2005): 43–69. https://doi.org/10.1146/annurev.biophys.34.040204.144447 .
  4. Хороший обзор см. в статье: Polêto, Marcelo D. и Justin A. Lemkul. «Integration of Experimental Data and Use of Automated Fitting Methods in Developing Protein Force Fields». Communications Chemistry 5, № 1 (2022): 38. https://doi.org/10.1038/s42004-022-00653-z .
hoarfrost отреагировал на эту запись.
hoarfrost

Искусственный интеллект и Folding@home

5 марта 2026 г.

Поскольку искусственный интеллект (ИИ) продолжает стремительно развиваться, интересно регулярно задаваться вопросом, что ИИ означает для Folding@home.

В двух словах, нынешнее состояние ИИ открывает множество возможностей для Folding@home! Ниже приведены несколько примеров.

Предсказание структуры против динамики : С появлением таких инструментов, как AlphaFold, я думаю, справедливо будет сказать, что проблема предсказания структуры в значительной степени решена. Вопросы, связанные с динамикой, например, как сворачиваются белки и какую роль структурная динамика играет в их функционировании, остаются открытыми. Эти вопросы являются основным направлением исследований в рамках проекта Folding@home, поэтому нам еще предстоит много работы. К счастью, улучшенные методы предсказания структуры помогают ускорить нашу работу, например, предоставляя нам отправные точки для моделирования белков, для которых еще нет экспериментальных структур. Наши данные также закладывают основу для усилий по предсказанию динамики белков с помощью ИИ.

Анализ данных : Искусственный интеллект — это действительно мощный инструмент для выявления закономерностей в сложных данных. Мы постоянно используем эту возможность! Например, мы применяем ИИ для сравнения динамики белков, функционирующих должным образом, с белками, участвующими в развитии заболеваний, выявления отличительных особенностей и разработки новых терапевтических средств.

Разработка программного обеспечения : Для бесперебойной работы Folding@home требуется много кода. Как и во многих программных проектах, мы получаем огромную пользу от использования ИИ для генерации и/или отладки кода.

Как вам такая новость?

Разработка РФ в десятки раз ускорит перебор молекул при разработке лекарств

Российские исследователи создали систему искусственного интеллекта, которая в десятки раз быстрее прогнозирует характер взаимодействий между молекулами лекарств и белками, чем "нобелевский" алгоритм AlphaFold и другие "большие" ИИ-системы. Об этом сообщила пресс-служба "Сколтеха" (входит в группу ВЭБ.РФ).

Проведенные учеными проверки показали, что российский подход позволяет просчитать взаимодействия одной короткой молекулы и белка примерно за 13 секунд, тогда как AlphaFold требуется на решение этой задачи около 6,5 минуты, что в 30 раз больше. В перспективе, это позволит существенным образом ускорить виртуальный скрининг лекарств и проводить его на базе вычислительных центров среднего уровня, подытожили исследователи.

 

Новость опубликована 1 апреля этого года, и надеюсь, что это не шутка :-)

Без обид, но заявлять можно много чего. А какие-то результаты, которые могут быть проверены независимыми исследователями есть? А то тут вот другие товарищи выпустили новость "Спецпроцессоры «Байкал» для ИИ на замену Nvidia появятся в продаже в 2030 году". Но с учетом того, что громко анонсированный процессор Эльбрус от того же производителя "как-то не взлетел", слабо верится в другие подобные громкие анонсы в государственных медиа.

Pavel Kirpichenko отреагировал на эту запись.
Pavel Kirpichenko

AenBleidd, а я и не обижаюсь. Я просто опубликовал здесь эту новость, чтобы услышать другое мнение.

А если Вас или кого-то другого заинтересуют результаты независимых проверок, то с этим вопросом всегда можно обратиться напрямую в пресс-службу "Сколтеха". :-)

Цитата: DimOK от 23.05.2026, 12:15

А если Вас или кого-то другого заинтересуют результаты независимых проверок, то с этим вопросом всегда можно обратиться напрямую в пресс-службу "Сколтеха". :-)

Я даже знаю, в каком направлении пешего эротического путешествия меня направят с таким запросом xD

НазадСтраница 3 из 3
BOINC.RU