Форум

Пожалуйста or Регистрация для создания сообщений и тем.

WCG переезжает

Проект WCG останавливается в связи с миграцией в новый дата-центр.

В течение 17 лет инфраструктурную поддержку проекта осуществляла IBM, однако 2 марта 2022 г. она будет прекращена.

Теперь проект будет "вести" (и финансировать) Krembil Research Institute, Торонто, Канада.

Сроки намечены следующие:

  • 14 февраля прекращается отправка новых заданий,
  • 27 февраля будет прекращен прием посчитанных заданий от пользователей,
  • 28 февраля сервера (в т.ч. и web-сервер проекта) будут остановлены,
  • примерно 1.5 месяца займет процесс миграции: копирование ПО и баз данных, тестирование нового оборудования и развертывание проекта на нем,
  • 22 апреля 2022 г. проект должен быть переведен в активный режим.

 

Удачи проекту в этом нелегком и муторном процессе (как известно, 1 переезд = 1/2 пожара). Будем надеяться, что все закончится благополучно. Ну а там поглядим, как новый владелец себя покажет. Возможно, направление новых исследований станет "еще более медицинским" (хотя, вроде, и так уже дальше некуда: всего 1 климатический проект остался).

 

Array
maxiandr отреагировал на эту запись.
maxiandr
Цитата: zlodeck от 20.02.2022, 17:31

Проект WCG останавливается в связи с миграцией в новый дата-центр.

В течение 17 лет инфраструктурную поддержку проекта осуществляла IBM, однако 2 марта 2022 г. она будет прекращена.

Теперь проект будет "вести" (и финансировать) Krembil Research Institute, Торонто, Канада.

Сроки намечены следующие:

  • 14 февраля прекращается отправка новых заданий,
  • 27 февраля будет прекращен прием посчитанных заданий от пользователей,
  • 28 февраля сервера (в т.ч. и web-сервер проекта) будут остановлены,
  • примерно 1.5 месяца займет процесс миграции: копирование ПО и баз данных, тестирование нового оборудования и развертывание проекта на нем,
  • 22 апреля 2022 г. проект должен быть переведен в активный режим.

 

Удачи проекту в этом нелегком и муторном процессе (как известно, 1 переезд = 1/2 пожара). Будем надеяться, что все закончится благополучно. Ну а там поглядим, как новый владелец себя покажет. Возможно, направление новых исследований станет "еще более медицинским" (хотя, вроде, и так уже дальше некуда: всего 1 климатический проект остался).

 

В жопу климат, го медицину.

Array
maxiandr отреагировал на эту запись.
maxiandr

Перезапуск проекта отложен до 9 мая 2022г.

Спойлер

The Home Stretch keeps Stretching… We need to delay restart until May 9th, 2022

With a heavy heart we must announce to volunteers our intent to delay restarting the WCG until May 9th, 2022. Several issues discovered in our production environment remain unresolved, making it impossible to meet the April 22, 2022 deadline at this time.

Unexpected issues continue to delay the full validation of the QA environment, meaning there is no path yet to a responsible restart of the Production system even if all outstanding issues were resolved today. Several obstacles that proved difficult to resolve due to inexperience with specific components in the WCG software stack, contribute to our need for yet more time to bring the Grid back online.

Notably, the website build broke due to a dependency that brought React version 18.0.2 into the build, whereas the site was developed against React version 17. The lack of experience with React and modern web development practices within our team resulted in what now seems a simple fix, pinning React to the previously working version 17 for all dependencies that permitted a change in major versions when resolving required packages at build time. Volunteers may have noticed this issue, as it coincided with a long silence at http://www.worldcommunitygrid.org, which could not be updated. In addition, we overlooked a misconfiguration in the messaging/queueing middleware (IBM MQ), and a missing root certificate took far too long to discover as the reason Apache could not talk to IBM Websphere. The last few public IPs to be assigned were not routable due to a misconfigured VLAN. While these issues were all resolved, we now need more time to ensure there are no more surprises.

As a rule, this level of detail should be omitted from updates and has been omitted from previous updates. From our perspective, the specifics of the technical obstacles that hinder us are immaterial, as what we owe to volunteers is a working backend for the World Community Grid. The Grid is far too valuable to let go - and despite challenges, we are committed to supporting open science on the Grid. Given the already overlong timeframe of the migration, and to assuage concerns as to whether we are progressing towards the goal at all, we thought to make an exception given that we are asking for your patience just a while longer before we are fully ready to restart the WCG. We must and we will succeed.

Thank you to all who have contributed feedback and words of encouragement during the downtime. We do see your posts even if we cannot always reply at this stage. Your understanding and patience is truly appreciated. We will prepare a proper team introduction and answer the questions and address the comments once the Grid is back on.

WCG Tech team

Array
SerVal и maxiandr отреагировали на эту запись.
SerValmaxiandr

Еще два переноса. Следующая дата перезапуска - 24 мая 2022г.

Спойлер

Restart update

The revised date for launch will be May 24th, 2022, after Victoria day.



We were able to solve a redirection loop that caused much of the website to be unusable due to incorrect rewrite rules in Apache and their interaction with self-hosted DNS. Additional issues were then resolved that had resulted from the previously discussed necessary changes to the configuration of HAProxy, internal server certificates and thus domains, and IBM WebSphere.

We are now updating the content on the production website to include the updates that were published during downtime, porting the React dependency pin to version 17 from the current website hosted at http://www.worldcommunitygrid.org to the full-featured production website which was also affected. We then need to ensure functionality on all major browsers manually. Once finished, the website and forums will be good to go.

Finally, we were able to test BOINC client connections to our servers from newly created/registered accounts. While we were able to contact the BOINC scheduler and check for available workunits, we are now diagnosing a failure to validate the project key that occured in some cases.

On the server side, we were able to verify the flow of data from our research partners into the workunit management layer in our stack. Thus, this part is fully validated, and will proceed smoothly upon restart. We continue to assess readiness of the workunit management stack for launch together with the website.

Thank you

WCG Tech team

Array