Форум

Пожалуйста or Регистрация для создания сообщений и тем.

Есть ли место ГРИДам среди суперкомпьютеров?

Page 1 of 4Next

Размышления добровольца РВ по итогам НСКФ-2022.

Прошло несколько дней после окончания очередного форума НСКФ 2022 года. Можно немного прийти в себя после дороги и описать впечатления от форума.

  1. Общее впечатление двояко. С одной стороны - здорово, что это мероприятие вернулось у очному формату, с другой - 2 года ковидных ограничений и текущая санкционная ситуация очень сильно ударили как по самому Форуму, так и по всей суперкомпьютерной отрасли.
    Во-первых, ушли все зарубежные спонсоры и участники (почти). Наивно было бы ожидать сейчас стендов от IBM, Intel, AMD, NVidia и аналогичных компаний. Это сейчас объяснимо. Но вот НЕучастие как в спонсорской поддержке, так и в выставке и выступлениях большинства отечественных "гигантов" вычислительного компьютеростроения сами организаторы не смогли объяснить. Да, кто-то находится в очень сложной ситуации, как, например, производители и разработчики "Байкалов" или "Т-Платформы" (их мы практически потеряли). Но из остальных, Вы сами видели на фотографиях, кто почтил Форум своим участием. Ну и на страничке спонсоров тоже можно видеть наиболее смелых.
    Это печально.
  2. Одно из последствий ковидных годов (а может и достижением) стало большое число удаленных докладов. Даже целая секция Zoom-выступлений была организована. Это и ранее практиковалось, то сейчас подобное находится в большом тренде.
    Опять же, с одной стороны, наличие такого формата существенно расширяет возможность для многих сделать свои выступления, но, с другой, все-таки личное общение ничем не заменишь. Причем после живого прослушивания имеется возможность тут же организовать личную встречу и обсудить заинтересовавшие моменты. Так, например, Екатерибургским химикам, которые с трудом считают свои сложные модели и, которым, с учетом возможностей приданных им математиков-программистов и вычислительных средств приходится эти модели загрублять и упрощать, наши "товарищи" рассказали, что тут можно и "ГРИДы применить, в том числе и добровольцев подключить". Благо, что на первый взгляд, их задачи очень не плохо могут ложиться на эту технологию.
    Кто знает, может быть из такого общения вырастет новый BOINC-проект?
  3. Доклады. Они были разными. Некоторые даже для меня, как неспециалиста, интересные. Многие - непонятные, но чувствовалось, что серьезная работа была проделана. Были и откровенно слабые (это в основном студенческие и аспирантские - их сюда для "обкатки" присылают). Парочка была вообще за гранью моего разума - типа открытия новых направлений в физике/философии или "телекоммуникационных основах для суперкомпьютера". Но о них пусть рассуждают более сведущие люди.
  4. Ну и про ГРИДы.
    На итоговом банкете мне что-то вспомнилось, как в далеком 2013м году, сразу после проведения в Петрозаводске первого BOINCFast-а, М.Посыпкин попросил всех, буквально через 1.5-2 месяца приехать на НСКФ. Он сказал, что там надо там "застолбиться". Это был, можно сказать, "политический момент". И мы "застолбились". Конечно за это время новых докладов никто написать не успел и, практически, на том НСКФ-е был повторен BOINCFast. Но политическая цель была достигнута.
    И в этом году секция ГРИДов была одной из самых многочисленных.
    Конечно, снисходительное отношение все равно остается, и на "принтерах, говорят , можно считать", и бросить персоналки и уходить/покупать "облака", которые "сильно подешевели" предлагают, ну и другое всякое.
    Но, "… караван тем временем идет …"
    Судя по многим докладам реально к супервычислениям они имеют немного отношения, просто в силу недоступности для многих суперкомпьютеров и кластеров. Поэтому, когда в конце доклада задают вопросы "а на каком железе вы считали" - очень частый ответ: "развернули небольшую нейросеть на одном компьютере с одной видеокартой", или проверили свои исследования на сети из 10-15 узлов. На вопрос "а почему не больше?" отвечают- нам больше не дали.
    Вот и всё. Ну, или как с теми же химиками - "нам приходится существенно загрублять и упрощать свою модель, потому как на имеющихся вычислительных возможностях мы не можем иначе.
  5. Про общее состояние суперкомпьютерных вычислений.
    В настоящее время в России существует 7 суперкомпьютеров, попадающих в ТОП500. Из них 5 входят даже в первую сотню. Мало, конечно, но и это, вроде бы, должно даже немного радовать. НО …
    Вся 5-ка из ТОП100 это 3 машины Яндекса и 2 Сбера. А из оставшихся из ТОП500 одна - МТС и единственный научный МГУшный "Ломоносов".
    Т.е. бизнес и коммерция науку оставили далеко позади.
    Кроме того, в основном новые "монстры" были установлены и запущены в 2021 году. Соответственно, в ближайшее время нам вряд ли "светят" появление свежих мощностей. Возможно в чем-то поспособствует Китай и "серый импорт", но вряд ли возможно будет создать что-то выдающееся и крупное.
    Однако, по словам С.Абрамова, в России сейчас ведется работа над проектом "фотонной вычислительной машины". Что это такое и в какой стадии работа не было сказано. Остается поверить на слово выступающему, что тут мы пока стоим на передовых мировых позициях.
    Но, я подозреваю, что тут еще все на стадии теоретических разработок, планирования архитектуры и пр. А вот когда дойдет до воплощения в "железе". то станет гораздо сложнее, учитывая состояние отечественной микроэлектроники.

Кроме того, очень часто и в докладах и в личных беседах, говорилось об отсутствии для многих доступа к серьезным суперкомпьютерам. В некоторых университетах даже собственный парк персоналок позволяют задействовать в ограниченном количестве.
Когда Н.Храпов рассказывал о создании проекта USPEX, был задан вопрос:

  • А зачем вам распределенные вычисления, да еще и добровольные? Неужели Оганову не хватает выделяемых вычислительных мощностей в Сколково.
    Николай ответил, что хотя и не знает какими сейчас вычислительными возможностями располагает группа Оганова, но они работают над несколькими проектами и всё, что удается получить для расчетов - загружено полностью. И еще и не хватает.

В общем, возвращаясь к нашим любимым "ГРИДам" - уверен, что в настоящее время это достаточно перспективное и, главное, более доступное и реальное, направление высокопроизводительных вычислений, которое еще далеко не полностью исчерпало свой потенциал. Да и для ДРВ (добровольных распределенных вычислений) еще будет много работы. Хотелось бы, конечно, считать как можно больше своих - отечественных проектов. Но, собственно участие в таких конференциях, как Национальный Суперкомпьютерный Форум, в том числе, делает эти наши надежды более реальными.

Большинство докладов доступны в поиске на YouTube и на официальной страничке НСКФ-2022.

Array
evatutin, SerVal и ещё 2 отреагировали на эту запись.
evatutinSerValV0d01eyШмяка

Вопросы хорошие. Также, не в первый раз подметил кое-что ещё, про что напишу отдельно. Попробую пройтись по вопросам (1 вопрос == 1 сообщение). Итак:

Вопрос № 1: Общее состояние форума. По мне, так было бы намного лучше, если бы он проводился в середине лета, что сильно упрощало бы всё, кроме того, что итоги подводились бы не под Новый год. Летом и в Переславле-Залесском намного интереснее и весь день быть на ногах и думать куда проще. Также, если бы НСКФ захватывал бы выходные дни (например, с пятницы по понедельник), то было бы проще приезжать не только сотрудникам научных организаций, или тем, кто продаёт железо (это их работа по сути), но и тем, кто мог бы купить или донести информацию до тех, кто принимает решение. Но об этом - отдельно (*). Также, ноябрь - декабрь это время борьбы за то, чтобы "сделать и сдать всё до Нового Года" у большинства предприятий, различных компаний, банков и всех-всех-всех. В это время заманить их (я бы даже сказал "нас) на подобную конференцию - просто нереально. И, как мне кажется, оргкомитет это и не пробовал делать. О том, что, на мой личный взгляд, надо делать, также попробую написать отдельно. НСКФ организовывался исключительно для представителей институтов и, по моему мнению, это ошибка организаторов. В тоже время, делая так, они могут учитывать и другие условия, которые не учитываю я. И они могут быть даже важнее.

Array
AlexA отреагировал на эту запись.
AlexA

Вопрос № 2. Удалённые доклады. Это очень хорошо. И студенческие, даже если многие из них были слабыми - это отлично. Наша страна значительно больше тех территорий, с которых до Переславля можно добраться относительно быстро или недорого. То, что для воприятия удалённого общения, как чего-то нормального, как для НСКФ, так для организации страны в целом, потребовался коронавирус, в будущем, наши потомки будут воспринимать как абсолютное упёртое нежелание видеть реальность. Ещё до пандемии на эту тему в лёгкой форме спорили с коллегами по работе и многие не верили, что страну можно перевести на удалёнку. Оказалось, что вполне можно.

Ценность докладов студентов и другие примеры практического применения супер (или не очень "супер-") вычислительных технологий, как я думаю очень важны, даже если они выглядят слабыми. Потому что если их будут смотреть люди из предприятий, то они, думаю, будут находить в этих примерах практического применения что-то интересное для себя. Иногда, очень сильно отстоящее от исходной темы. Здесь важно увидеть "а что вообще можно делать".

Array
AlexA и Шмяка отреагировали на эту запись.
AlexAШмяка
Цитата: hoarfrost от 04.12.2022, 12:35

Ценность докладов студентов и другие примеры практического применения супер (или не очень "супер-") вычислительных технологий, как я думаю очень важны, даже если они выглядят слабыми. Потому что если их будут смотреть люди из предприятий, то они, думаю, будут находить в этих примерах практического применения что-то интересное для себя. Иногда, очень сильно отстоящее от исходной темы. Здесь важно увидеть "а что вообще можно делать".

Вот тут, как раз хорошее предложение на круглом столе прозвучало по поводу молодежной секции. Если через год сделают - было бы неплохо.

Array
evatutin отреагировал на эту запись.
evatutin

Вопрос № 3: Доклады. Так сам был только один день, то доклады буду ещё смотреть в записи, по мере просмотра, возможно что-то придумается. Про Гриды из ПК всё понравилось. 🙂 Отдельно хотелось бы обратить внимание на то, что на официальном канале НСКФ на YouTube, существующая раскладка видео на плей-листы, создаёт крайне неправильное ощущение о степени организации конференции. По мне, так плей-листы надо называть НСКФ-<год>. День <номер дня>. <Секция>.

Название отдельных записей: НСКФ-<год>. День <номер дня>. <Секция>.<Название доклада или же "Полная запись" (сначала выкладываются просто неразбитые трансляции)>

Например:

Плей-лист: "НСКФ-2022. День 1. Пленарные доклады."
А отдельная запись доклада: НСКФ-2022. День 1. Пленарные доклады. Проект SiDock@home.

Или "НСКФ-2022. День 4. Секция "Гриды из ПК"."
А доклад:
"НСКФ-2022. День 4. Секция "Гриды из ПК".Спектральные характетиристики ДЛК (Ватутин Э.И)."

Эти же записи выкладываются прежде всего для того, чтобы их могли посмотреть те, кто не был на конференции, а не те, кто и так всё помнит. Это вроде бы мелочь, но она многое говорит.

 

Array

Вопрос № 4: Гриды из ПК, BOINC, распределённые вычисления в целом. То, как те или иные участники конференции открывают для себя существование такой вещи как проекты РВ, выглядит, конечно, уже смешно. Потому, что это значит, что эти люди, как минимум, не увлекаются астрономией (а если бы они увлекались астрономией, то обязательно хоть как-то сталкивались бы с тематикой SETI, а там уже до SETI@home рукой подать) и мимо них совершенно незаметно "пролетело другое крыло самолёта" в виде Folding@home, про который во время начала пандемии говорили из каждого чайника. Одновременно, это говорит об уровне того, что и как рассказывают в университетах. Тут явно надо что-то исправлять в консерватории.

Было интересно услышать доклады коллег. Отмечу, что сильно нехватает вводного и обзорного доклада по проектам распределённых вычислений в котором растолковывалась бы людям в чём их как недостатки, так и преимущества. Насколько я вижу, очень многие люди, в том числе и от "железных компаний" или из различного начальства, просто не в курсе характеристик (и следующего из этого) современных серверных и десктопных процессоров. Что преимущество серверных CPU в многоядерности в значительной степени теряется, а то и полностью уничтожается десктопными CPU за счёт частоты. А нынешние Threadripper-ы - так и просто мощнее любого процесора, даже EPYC-а, потому что ядер у них столько же, а частота почти в 2 раза выше. У людей в голове упорно сидит что "сервер - это мощная машина" как и "Облако - это платформа для всего", хотя ни то, ни другое, в общем случае - неверно.

Про облака, раз мы упоминаем про них, стоит отметить, что ... об этом позже! (**)

Array
Шмяка и Mad_Max отреагировали на эту запись.
ШмякаMad_Max

Вопрос № 5: Общее состояние суперкомпьютерной отрасли. Мне бы очень хотелось услышать, какое оно всё-таки. Потому что никогда не слышал, чтобы об этом кто-то говорил. Возможно, что эти доклады были, но я их - не видел и не слышал. Нет, не про то, какие у нас есть суперкомпьютеры, не про то, на каких местах они находятся в TOP500. А про то, какие вычисления на наших суперкомпьютерах выполняются, какой практический выход получается и что это даёт экономике. Например в виде диаграммы процессорного времени того же "Ломоносова" и других суперкомпьютеров:

  • Физика: A% времени. Результаты: улучшение конструкции реакторов; Проверка теории внутреннего строения нейтронных звёзд; ...
  • Химия: B% времени. Поиск новых химических веществ; Оптимизация процессов горения в ЖРД. Перешли на новое топливо; Поиск лекарств. найдены перспективные лекарства от ..., проверяем в лаборатории; ...
  • Сопромат: С% времени. Просчитана конструкция N мостов в условиях зимы, лета, ветра, дождя, урагана и т.п.; Сэкономили 3 года на строительстве моста через реку R, и т.д.; Оптимизирована конструкция K кранов, двигателей, различных узлов станков, автомобилей и прочих агрегатов; ...
  • Геологоразведка: D% времени. Точнее определены координаты M месторождений, потребовалось пробурить в 3 раза меньше скважин, из-за правильной оценки расположения ресурсов минимизирован ущерб окружающей среде из-за правильного планирования добычи; ...
  • ...

Все много раз слышали об огромной пользе, которую приносит моделирование, но если результаты вычислений на наших суперкомпьютерах будут как-то систематизированы, то всем станет понятнее, что это даёт, а там, глядишь, и новые проще строить будет!

Вопрос Николаю Храпову про то, зачем нужен проект РВ, когда есть кластер, также был ещё одной демонстрацией того, что люди просто не понимают о каких мощностях (как в части кластера, так и в части проекта РВ) идёт речь и о том, сколько такие мощности в виде процессорного времени стоят в случае кластера или облака и "не стоят" в случае проекта РВ. В ту же канву ложится и упоминание С.М. Абрамова о том, что в рамках работы с современными суперкомпьютерами начинают учитывать то, сколько будет стоить тот или иной расчёт. Ну мы, например, в рамках работы своего подразделения, на своей работе, с одной стороны, в различные обоснования для закупки нового железа, стоимостью электроэнергии не оперировали, но эта часть Total Cost Ownership-ства, в голове сидит уже очень давно и очень прочно. Хотя ни к какой суперкомпьютерной отрасли мы не относимся. Хотя... это ещё как смотреть (***). 🙂

Array
Mad_Max отреагировал на эту запись.
Mad_Max

А вот теперь дополнительно выскажу своё мнение, по вопросам, связанным с тем, что выше отмечал в виде (*), (**), (***). Оно будет субьективно в силу того, что я будут опираться на свой опыт и свои данные, но я не стремлюсь объять всё, я стремлюсь высветить те моменты, которые мне кажутся важными.

Пункт № 0. Почему считаю возможным про это сказать. Потому что:

  • Участвую в распределённых вычислениях с 01 декабря 2004 года, а всяким (пусть и простым) численным моделированием увлекался ещё в школе;
  • Всё это время, любую вычислительную систему - от компьютера до кластера, от смартфона до сервера, всегда рассматриваю и в разрезе её мощности в вычислениях, скорости передачи данных, возможности хранения данных и т.д. То есть, как возможную часть вычислительной системы, даже если она никак в подобной деятельности участвовать не будет. А делается это потому, что когда ты "раскладываешь" так любое устройство - смартфона до appliance по характеристикам, тебе становится намного яснее, что и где оно может, насколько оно подходит для того, ради чего вам "это" хотят продать и что вам вообще тогда надо;
  • Одновременно, за время своей работы в iT-отрасли, мне доводилось участвовать в разработке бизнес-приложений, сопровождении и уже устаревающих, и современных систем, а также быть в команде сопровождения и администрирования одного из довольно крупных аналитических хранилищ данных. Входит ли оно, например, в 50-ку или 10-ку крупнейших в России - я не знаю. Но судя по разным обрывкам информации, оно точно входит в состав одних из наиболее хорошо и оптимально организованных, а также, поддерживающих очень высокую интенсивность работы с ним. Ну, а сейчас я вхожу в команду развития уже другого, тоже не очень маленького и тоже в России. 🙂

Начнём же!

Пункт № 1. А о чём же говорят? Об отрасли или...?

Когда я читаю или слушаю интервью самых разных представителей суперкомпьютерной отрасли России или слушаю их доклады на конференции, то у меня всё время возникает ощущение, что под суперкомпьютерной отраслью они понимают только строительство суперкомпьютеров (далее - СК) и главное что их беспокоит - это отсутствие заказов на новые СК. Строительство любого крупного суперкомпьютера требует хорошего планирования и пробел в вводе в строй новых - это нехорошо, об этом надо тревожиться и в этом они правы, но сама отрасль - намного шире. Отрасль должна давать некий конечный продукт, которым смогут воспользоваться другие отрасли. "Определение", очевидно, очень субьективное, но зато понятное. Каждая отрасль - это отдельная область знаний. Строительство СК однозначно входит в СК-отрасль, но в неё также входит разработка программного обеспечения и выполнение расчётов, выходные данные которых, поступив конструкторам, химикам, физикам, медикам, строителям, машинстроителям, ... и станут тем самым продуктом, который пройдёт через границу взаимодействия отраслей будет полезен отраслям соседним.

Строительство суперкомпьютеров невозможно оторвать от результатов которые они дают. И если мы не строим новые СК, то первое что приходит в голову, так это предположение о том, что либо они не дают нужного эффекта, либо эффект от них есть, но его неправильно монетизируют. "Монетизируют" - не значит "дерут деньги с заказчика вычислений". Это может быть представление результатов в какие-то профильные ведостмва или правительству в целом. Ну очевидно же, что если какая-то штука на 1 рубль за год приносит 2, то никто не окажется от её строительства! Или откажется по глупости? И вот чтобы точно было понятно "в чём дело" - ситуацию надо прояснять. Надо оперировать не числом СК, а результатами их работы.

Продолжение следует...

 

Array
AlexA, Шмяка и Mad_Max отреагировали на эту запись.
AlexAШмякаMad_Max

Макс, ты уже на целый доклад или статью тут понаписал. Мож правда обработать и найти куда опубликовать?

 

Array

Хм, все сегодня нами сегодня написанное уже перекопипастили на Пикабу 🙂

Array
Page 1 of 4Next