Skip Navigation Links
Проекты
Биолого-медицинские
Skip Navigation Links
Естественнонаучные
Skip Navigation Links
Математические
Skip Navigation Links
Прочие проекты
Skip Navigation Links
Завершённые
Skip Navigation Links

Информация о проекте подготовлена участником форума - arenda13

«The Lattice Project» организован и базируется в Университете штата Мэрилэнд, США и проект поддерживается Лабораторией молекулярной эволюции.

Это проект, который пытается оказать помощь ученым в решении их вычислительных проблем.

В университете имеются свои кластерные сервера и вычислительные сети, но вычислительных ресурсов всем не хватает. Основной задачей проекта является интеграция воедино вычислительных ресурсов и предоставление их в пользование ученым в достаточном количестве.

Ведущие исследователи и руководители Майкл Каммингс и Адам Базине (Michael Cummings and Adam Bazinet.) так рассказывают о своем проекте:

"Наша вычислительная система основана на оригинальной архитектуре, которая охватывает вычислительные мощности от hi-end кластеров до индивидуальных настольных компьютеров. Своей заслугой мы считаем создание грид-системы, которая незаметно для пользователя соединяет различные вычислительные ресурсы (сети BOINC, Condor, кластеры университета) и предоставляет необходимые вычислительные мощности, а также создание необходимого программного обеспечения (приложений). Мы твердо привержены принципам разработки программного обеспечения с открытым исходным кодом, и мы намерены выпускать все программное обеспечение с открытым исходным кодом, за исключением тех немногих случаев, когда используется коммерческое программное обеспечение.

Мы используем платформу BOINC, чтобы интегрировать вычислительные мощности миллионов персональных компьютеров в нашу грид-систему.

На сегодня из 24 приложений, которые мы запустили в нашей Grid — системе, 18 приложений уже портированы на BOINC платформу. Некоторые приложения в принципе не будут перенесены на BOINC, потому что для их работы требуются, например, постоянные обращения к очень обширной базе данных, а также по некоторым другим причинам."

Ответы организаторов на некоторые вопросы пользователей:

  •  Что такое «The Lattice Project»?

The Lattice Project это попытка ученых Университета Мэрилэнда (США) создать и внедрить комплексную систему распределенных вычислений для использования в научных исследованиях.

  • Когда The Lattice Project будет завершен?

Так как это постоянно развивающийся исследовательский проект, то во многих отношениях он никогда не будет завершен. В настоящий момент проект представляет собой грид-систему, в которой постоянно добавляются, тестируются и совершенствуются новые функции. Кроме того, мы будем продолжать добавлять и обновлять научные инструменты, которые используют нашу систему грид-вычислений. Новости и анонсы мы публикуем на домашней странице проекта.

  • Какая основная цель The Lattice Project?

Научные исследования могут значительно расшириться при доступе к высокопроизводительным вычислительным ресурсам. Вычислительная среда, это то узкое место в ряде областей науки, которое тормозит их развитие. Наша цель создать достаточные вычислительные ресурсы, доступные активному сообществу ученых.

  • Планируется ли участие добровольцев в проекте?

Люди, которые хотят задействовать свои вычислительные ресурсы, должны скачать и установить BOINC клиент, который будет загружать и выполнять расчеты на их компьютерах. Также, как и другие проекты, например, SETI@HOME, мы будем продолжать поддерживать всю инфраструктуру boinc-проекта: образование команд, начисление кредитов за выполненную работу и форум общения.

  • Я запутался в типах заданий, которые будут работать в Lattice Project. Есть ли главная задача, которой посвящен проект?

Ответ прост - нет. The Lattice Project обеспечивает базу для выполнения многих видов научных приложений в качестве грид-сервиса. Это также верно и для заданий, которые будут посланы BOINC-клиентам. The Lattice Project, который работает через BOINC, состоит из нескольких приложений. В основном, эти приложения относятся к решению проблем в области биоинформатики, вычислительной биологии и молекулярной эволюции.

  •  Почему в The Lattice Project используется BOINC?

BOINC (Открытая Инфраструктура для Сетевых Вычислений из Беркли)/, это промежуточное ПО, для интегрирования индивидуальных компьютеров в грид-систему. Признавая потенциал десктопных компьютеров в грид-системах, мы используем BOINC, чтобы значительно увеличить мощность наших вычислительных ресурсов. Задания для грид-системы обрабатываются на компьютерах добровольных участников, таким образом, как будто бы они предназначены для специализированных кластеров.

  •  Зачем вносить вклад в научные исследования?

Вы можете помочь ученым ответить на множество волнующих вопросов! Например, если вы запустите филогенетический анализ, вы помогаете обнаружить эволюционные взаимоотношения различных организмов на земле.

  •  Сравнение The Lattice Project с другими проектами распределенных вычислений.

Использование BOINC в The Lattice Project отличается от других проектов в нескольких моментах. Большинство BOINC-проектов имеют одно или группу приложений, где каждое задание похоже на типовое в рамках того анализа, который проводится. The Lattice Project является полнофункциональной grid-системой, так как он выполняет научные исследования для самых различных проектов. Также отличие состоит в том, что в проекте используются разнообразные вычислительные модели и разные вычислительные ресурсы. Как уже упоминалось, в The Lattice Project пул BOINC-клиентов является одним из многих ресурсов, которым могут быть направлены задания. (Другие ресурсы включают в себя выделенные кластеры и настольные компьютеры, объединенные с помощью ПО Condor и другими системами распределенных вычислений.)

Учитывая эти характеристики Проекта и его использования с BOINC, участники добровольных вычислений должны иметь эти различия в виду. Можно отметить следующие особенности:

  1. Не всегда могут быть доступны задания для расчетов.
  2. Задания будут различаться в таких характеристиках, как тип анализа, время выполнения.
  3. Некоторые задания могут занять очень много времени (напр., несколько дней или более) для завершения.
  4. Оценка времени выполнения (если она дана), скорее всего, будет весьма приблизительной.
  5. Промежуточные точки сохранения отсутствуют для некоторых приложений.
  6. Некоторые задания могут быть удалены из системы по той или иной причине. Мы публикуем список таких заданий.

 Исходя из вышесказанного, наше использование BOINC отличается от SETI@home и других проектов. Следовательно, ожидания, основанные на опыте с BOINC от SETI@home и других проектов, не всегда будут совпадать с тем, что вы обнаружете этом проекте. Это одна из сложных задач, с которой мы столкнулись как научно-исследовательское сообщество ученых и людей, великодушно работающих вместе для увеличения общественного участия в распределенных вычислениях в широком круге проектов.

  • Все ли проекты, которые работают являются некоммерческими?

Да, все исследования, выполняющиеся в рамках The Lattice Project являются частями академических научно-исследовательских проектов. Большинство научно-исследовательские проектов финансируются со стороны государственных органов (напр., в Соединенных Штатах Америки - Национальным научным фондом (NASA, Национальный Институт Здоровья), и научных организаций (напр., Университет штата Мэриленд). Результаты этих исследований, как правило, публикуются.

 Некоторая дополнительная информация, предоставленная организаторами проекта:

 Многие научные исследования во многом выиграют от расширения доступа к высокопроизводительным вычислительным ресурсам. Некоторые свойства современных исследований, из-за которых растет потребность в высокопроизводительных вычислений:

  1.  Тенденция к количественному анализу в экспериментальной биологии. Основа многих природных научных исследований состоит из предположений и проверки гипотез, которые требуют вычисления.
  2.  Быстро растет количество входных данных для расчетов, включая информацию по образцам и экспериментам.
  3. Усложнение аналитических моделей и сопутствующее увеличение возможного количества решений. Расчеты вероятностей, методы Монте-Карло и другие стохастические методы моделирования требуют использования большого количества параметров. В то время как такие модели могут увеличить наше понимание базовых природных процессов, которые мы исследуем, во многих случаях они приводят к экспоненциальному росту числа возможных решений.

 Несмотря на перспективные разработки, которые призваны по отдельности решать частные задачи, вычислительная среда, в которой многие ученые работают, остается по существу недостаточной, что существенно препятствует прогрессу в ряде областей.

Наша цель состоит в том, чтобы сделать достаточные вычислительные и информационные ресурсы для активного сообщества исследователей.

Lattice Project разрабатывает систему распределенных вычислений, основанную на вычислительных мощностях общества, которая интегрирует ПО распределенных вычислений и широко используемые учеными научные приложения.  

Известные проблемы проекта:

  1. Иногда задания вылетают с ошибкой. Чаще всего этому подвержены длинные задания. Вылет может произойти и через 3 часа, и через 120 часов расчетов. За такие задания автоматически очки не начисляются. Необходимо писать в форуме администратору Адаму. Он вручную добавляет очки. Однако компенсация не 100%, а около 20-50% от расчетного времени, если бы задание было бы успешно посчитано. Эти ошибки связаны с внутренними ошибками расчетного модуля и не связаны с железом кранчеров.  По последним данным эта проблема решена: (В результате жалоб и переписываний с Adam (координатор проекта) удалось добиться исправления ошибок, когда задания вылетают. Вроде бы, больше таких заданий не будет. Если и будут, то это задания из старого пула, которые были созданы до 20 января. Но и за них можно получить очки. Просто его нужно проинформировать, какие задания вылетели и сколько времени CPU на них ушло. Не много компенсирует, но все же.)
  2. Даже при наличии заданий, клиент не всегда запрашивает новые задания. Вручную можно запросить, а автоматически долгое время (до суток и более) не запрашивает. Иногда и вручную не выдает задания даже при их наличии. Причину не пишет.
  3. Некоторые задания зависают в процессе. Такие задания необходимо удалять. Но нельзя достоверно определить, задание зависло или считает. Некоторые задания показывают первый рост выполнения задания в баре только через 10-30 часов. При сомнениях, нужно списываться с Адамом по поводу каждого такого задания.

 Особенности проекта.

  1. Общее направление исследований: биоинформатика и вычислительная биология.
  2. Задания иногда не выдаются по несколько суток.
  3. Задания разные по времени расчета и требованиям к ОЗУ. Официально отмечено, что памяти может требоваться более 4Гб на процесс.
  4. Хотя есть модуль для GPU, он не выдает задания. Как минимум, в 2013 не было не одного задания. Есть подозрение, основанное за записях в доске сообщений, что он вообще еще не запущен.
  5. Некоторые задания имеют редкие точки сохранения (промежутки по 5 — 10 часов). Бывают задания, которые полностью лишены точек сохранения.
  6. Проект работает на платформах Windows, Linux, Mac OS.
  7. Очки даются по сложной схеме, которая до конца непрозрачна. Проект не "жирный", с точки зрения количества очков. 

Плюсы проекта.

  1. Администратор Адам старается отвечать на вопросы кранчеров, и по мере его сил, что-то менять в проекте.
  2. Много разных ученых могут проверить свои гипотезы, которые требуют больших вычислительных ресурсов.

 

Некоторые подробности об исследованиях, проводимых в проекте:

Инструмент GARLI.

 Инструмент (приложение) GARLI позволяет построить филогенетическое дерево по анализу последовательности аминокислот или нуклеотидов. Разные модели нуклеотидов, аминокислот и кодонов создаются с помощью метода максимального правдоподобия.

Множественные построения деревьев с помощью этого метода, также как и бутстреп расчет, хорошо распараллеливаются с помощью Lattice Project на уровне индивидуального эвристического анализа, то есть каждый вычислительный узел должен провести полный эвристический анализ задания. Распараллеливание особенно полезно для большого количества относительно коротких расчетов. Такие расчеты типичны для нуклеотидных моделей бутстреп анализа, с большим количеством итераций.

 

Приложение GARLI используют несколько научных групп.

В частности:

В LepTree проекте исследуются эволюционные взаимоотношения внутри насекомых отряда Lepidoptera (мотыльки и бабочки), в частности в более высоких таксонах (до класса Насекомые). Молекулярный "костяк филогенеза" основан на анализе до 26 белок-кодирующих ядерных генов для нескольких сотен таксонов. Главный метод анализа, используемых в данном исследовании является нуклеотидная модель Метода Максимального Правдоподобия, который реализован в GARLI.

 

В лаборатории Совера изучают эволюцию миксин. Миксины, у которых нет челюстей и позвонков, считаются наиболее примитивными позвоночными, из когда-либо живущих на Земле. Они давно являются загадкой не только из-за своего положения в эволюции позвоночных, но также из-за того, что мы очень мало знаем об их метаболизме и функциональных особенностях. Ключевые моменты эндокринной системы размножения до сих пор не выяснены.

Применяемый филогенетический анализ рождает версию, что предшественниками целого семейства гормонов ГПГ-альфа и ГПГ-бета у позвоночных животных являются гликопротеиновая альфа-субъединица 2 и гликопротеиновая бета-субъединица 5, соответственно.

Идентифицированные альфа и бета субединицы ГПГ у миксин, похоже являются типичными для всех челюстноротых, согласно проведенному в проекте филогенетическому анализу.

Исследователи предполагают, что нахождение однофункционального ГПГ миксин, представит важные доказательства наличия гипофизарно-половой системы у самых ранних позвоночных, которая, вероятно, эволюционировала от беспозвоночных предков, из их нейрогуморального механизма, за счет появления и развития гипофиза, которого не было у Предхордовых.

  

Мириам Рейна Фабиан задалась целью изучить внутре- и межвидовые отличия у более чем 15 видов коловраток, которые сейчас относятся к Брахионидам. Виды этого семейства являются свободно живущими особями, и являются частью зоопланктона пресноводных и морских водоемов. Изменение морфологических признаков традиционно используется для дифференциации видов. Тем не менее, в области таксономии позиции 3 видов - Brachionus patulus , B. macracanthus и В. polyacanthus - были спорными. Исследование на основе сканирующей электронной микроскопии ( Segers и др., 1993 ) дает основание возвести эти 3 вида к новому роду: Plationus.

Филогенетический анализ семейства Brachionidae проводились на основе анализа генов, кодирующих субъединицы цитохромоксидазы 1 (ЦОГ 1) и различных областей (D2-D3) на 28S рРНК. В общей сложности 23 последовательности, в том числе 8 чужих, были приведены в соответствие. Филогенетическое дерево, полученное из этого исследования позволило подтвердить обоснованность нового рода Plationus. Проведенные анализы подтверждают гипотезу, что Plationus patulus и P. macracanthus с высокой долей вероятности образуют отдельную ветку от Brachionus и Platyias.

 

 Лаборатория Нила изучает филогенетические отношения между североамериканскими видами цветков рода Agalinis Raf. (Двудольные, порядок Ясноцветковые, семейство Заразиховые) Эти растения представляют таксономически сложную группу. Классификация этих растений претерпела большие изменения. Род Agalinis Ref. Включает в себя много редких видов, в том числе находящихся в федеральной красной книге исчезающих растений.

 

Сильвана Мартен-Родригес стремится понять роль опылителей в эволюции цветочных черт и систем размножения семейства Геснериевых на Антильских островах путем объединения филогенетических подходов с исследованиями экологии. Семейство Геснериевые охватывает виды, приспособленные для опыления колибри или летучими мышами. Но у них также есть система самоопыления, без участия колибри.

 

1400 видов бабочек семейства Бражники (Lepidoptera: Sphingidae) является одной из самых заметных и хорошо изученных групп насекомых, и является изучаемой моделью для многих биологических дисциплин. Тем не менее, надежные филогенетические границы для семейства четко не определены. Морфология не может уверенно определить отношения большинства групп друг относительно друга. В качестве важного шага на пути к пониманию отношений внутри этого семейства, была проведена первая масштабная молекулярная работа по филогенетическому анализу всего семейства Бражников, включая все подсемейства и роды.

Проводятся также и некоторые другие работы, например взаимоотношения членистоногих