Могут ли эти iMac вылечить рак? [Эксклюзивный]

В тихих предгорьях Кентукки огромный суперкомпьютер обрабатывает данные. Он ищет новые лекарства от рака.

Каждую неделю DataseamGrid обрабатывает вычисления на 300 человеко-лет. Да, это 300 лет расчетов каждую неделю. На открытие лекарств обычно уходит от 10 до 15 лет, но DataseamGrid выполняет эту работу за доли времени. Это один из крупнейших трубопроводов потенциальных новых лекарств от рака в стране. В этом году исследователи собираются начать испытания на людях нового лекарства, обнаруженного суперкомпьютером, которое, в случае успеха, может привести к созданию совершенно нового класса противораковых лекарств.

DataseamGrid - самая большая сетка такого типа на планете - машина-монстр, получившая до сих пор нет национальной прессы, которая примечательна таким большим, амбициозным и успешным проектом.

Но самым большим нововведением может быть его архитектура. Вычислительная мощность Grid обеспечивается 14 000 обычных компьютеров iMac, установленных в школьных классах по всему Кентукки. DataseamGrid - суперкомпьютер для бедняков, собранный из классных компьютеров в бедных государственных школах штата Блюграсс.

Дети в одной трети школьных округов Кентукки используют компьютеры Dataseam каждый день. Мало кто догадывается, что машина, помогающая им понимать дроби, также запускает в фоновом режиме ультрасовременную программу открытия лекарств.

«Парадоксально, что это высококлассное исследование проводится в одном из беднейших регионов страны», - сказал Брайан Гуптон, соучредитель и исполнительный директор Dataseam.

набор данных

DataseamGrid является частью новой волны проектов по грид-вычислениям, которые прошли долгий путь со времен охоты на инопланетян. SETI @ Home попали в заголовки газет в 1990-х годах. ЦЕРН в Швейцарии имеет сетку на 100000 процессоров, которая обрабатывает 15 петабайт данных, ежегодно производимых Большой адронный коллайдер. Эта сетка способствовала открытию бозона Хиггса «частицы Бога» в 2012 году. В других частях Европы суперкомпьютеры, такие как Европейская грид-инфраструктура и французская сеть Wisdom Grid занимались поиском лекарств для борьбы с птичьим гриппом, малярией и вирусом СПИДа.

В США Проект FightAIDS @Home соединяет тысячи компьютеров в поисках лучших лекарств от ВИЧ, в то время как Проект Einstein @ Home ищет доказательства гравитационных волн. Einstein @ Home - один из самых популярных проектов распределенных вычислений, привлекающий более 300 000 добровольцев в 221 стране. В феврале 2014 года сеть обслуживала около 1100 человек. Тфлопс вычислительной мощности, что помещает его в первую 30-ку в мире ТОП500 суперкомпьютеров.

Но DataseamGrid заметно отличается от более ранних проектов грид-вычислений, таких как SETI @ Home, заставка, которая использовала свободные циклы процессора для поиска признаков инопланетного интеллекта в радиосигналах от космическое пространство. SETI @ Home передал задачи по вычислению чисел на скринсейвер, загруженный тысячами добровольцев, но узлы не были связаны друг с другом. Когда расчеты были завершены, каждый узел загрузил результаты на централизованные серверы, которые свели результаты в таблицу. Задача была распределена, а не сам суперкомпьютер.

DataseamGrid в Кентукки больше похожа на огромную виртуальную машину, которая обрабатывает каждый узел как один из своих процессоров. Это виртуальный суперкомпьютер, который координирует работу между узлами, и в результате получается одна большая виртуальная машина.

«Грид-вычисления никогда не заслуживали уважения, - говорит Гуптон. «Это было замечено как новинка, хороший способ делать наборы Мандельброта. Мы узакониваем это как вычислительный метод ".

Brian_Gupton
Генеральный директор Dataseam Брайан Гуптон.

Гуптон - явный идеалист-синий воротничок и предприниматель. Сын шахтера, он, кажется, больше заинтересован в том, чтобы использовать компьютеры в классах, чем в проведении передовых исследований рака, хотя ему удается делать и то, и другое.

В 2001 году Гуптон объединился с доктором Джоном Трентом, исследователем рака из Университета Луисвилля, и двумя другими местными предпринимателями: Дином Хьюзом и Генри Хантом, который сейчас является главным операционным директором Dataseam. Они намеревались построить суперкомпьютер по дешевке.

Частные сети дороги, как и суперкомпьютеры, сделанные из готового оборудования, например Virginia Tech. Биг Мак, который был выведен из эксплуатации в 2012 году. DataseamGrid - это уникальное государственно-частное партнерство, построенное в основном с использованием государственного экономического развития. фонды, созданные для диверсификации экономического профиля Кентукки и компенсации сокращения угля в штате промышленность.

Кентукки - один из самых бедных штатов Америки. Его восточная часть покрывает горы Аппалачи, что издавна ассоциировалось с невзгодами. По мере роста безработицы появляется больше денег на стимулирование экономики. Dataseam использует средства для покупки новых компьютеров для школ, а взамен они присоединяются к сети. Компьютеры служат двойной цели: они обеспечивают новыми компьютерами некоторые из беднейших школьных округов страны и дают исследователям рака мощный суперкомпьютер для поиска лекарств от рака.

«Мы создаем вычислительную инфраструктуру, - говорит Гуптон, - и Джонни может использовать ее для школьной работы».

Первоначально он был построен с Xgrid от Apple, программным пакетом для распределенных вычислений, встроенным в Mac OS X от 10.4 до 10.7z. С помощью нескольких настроек и некоторого проприетарного программного обеспечения Xgrid упростил настройку системы: легко было добавить новые узлы - машина, класс, целая школа - и система почти не отказала, если бы целые районы пошли не в сети.

Для включения Xgrid в OS X достаточно было нажать одну кнопку. Система автоматически обнаружила все доступные машины в сети. Если сеть компьютеров уже была на месте, настройка кластера была в основном бесплатной - все было уже включено в OS X или загружено из Apple. Гарвардский и Стэнфордский университеты имеют кластеры Xgrid, состоящие примерно из 400 или 500 компьютеров, каждый из которых выполняет такие задачи, как поиск последовательности генома и Рентгеновская кристаллография; но Dataseam на сегодняшний день является самым крупным.

Apple удалила Xgrid из Snow Leopard (OS X 10.8), вынудив Dataseam написать собственное проприетарное программное обеспечение для работы с сетками.

Сетки

Dataseam Grid - это машина-монстр. Он состоит из 14 000 настольных компьютеров в 54 школьных округах Кентукки (см. Карту). Проект затрагивает около 100 000 детей и до 8 000 учителей. В iMac установлены двухъядерные процессоры с тактовой частотой 1,83 ГГц или лучше. Их более чем достаточно, чтобы обрабатывать сетку в фоновом режиме. В некоторых школах есть сотни машин в сети; у других десятки. Большинство компьютеров относительно новые.

«Теоретически у нас есть школьные округа с такой же мощностью, как в Лос-Аламосе», - говорит Гуптон, имея в виду суперкомпьютеры для ядерных испытаний в Лос-Аламосская национальная лаборатория.

Карта Dataseam, август 2013 г.
54 школьных округа Кентукки участвуют в DataseamGrid.

Dataseam Grid соединяется вместе по гигабитной оптоволоконной магистрали школьных округов. За последние несколько лет штат Кентукки соединил большинство своих школ с помощью очень быстрой инфраструктуры с высокой пропускной способностью. Во многом это было связано с федеральными eRate финансирование от FCC для магистральных коммуникационных проектов, который присуждает субсидии в зависимости от количества студентов, обучающихся по программам бесплатного или льготного обеда. Во многих школах Кентукки обучается от 80 до 90 процентов.

набор данных
Дети в классе работают на iMac, в то время как машины запускают в фоновом режиме программное обеспечение для поиска лекарств. Сетка работает 24/7.

Сетка очень гибкая. Dataseam может продолжать добавлять и обновлять машины, добавляя класс или весь школьный округ.

«Это очень рентабельный способ сделать это», - говорит Гуптон.

Сетка Dataseam никогда не останавливается. «Мы работаем круглосуточно, без выходных, даже когда дети сидят в боксах», - говорит Гуптон. Вычислительные задачи могут потребовать много ресурсов процессора, но Гуптон и Трент должны убедиться, что они не перегружают компьютеры.

«Все, что мы выполняем, не может повлиять на производительность клиента», - говорит Трент. «Мы не можем замедлить работу компьютеров на треть в школьных округах».

По словам Гуптона, в будущем государственные / частные сети, такие как Dataseam, будут служить в качестве утилит, предлагая обработку чисел по запросу для крупных исследовательских программ. Это форма облачных вычислений. Так же, как Amazon сдает в аренду свободные мощности своих массивных центров обработки данных, корпорации и учебные заведения смогут использовать неиспользуемые циклы ЦП в своих сетях.

«Когда мы с Брайаном начали исследование, у нас было пять процессоров, - говорит Трент. «Он невероятно вырос. Все, что мы делали в первый год, теперь можно сделать за одну ночь ».

Однако после того, как Apple прекратила выпуск Xgrid, суперкомпьютеры и кластеры на базе Mac становятся редкостью. Суперкомпьютер Virginia Tech был списан, и я не нашел упоминания о Mac в последних Список 500 самых быстрых машин в мире. Профессор Джек Донгарра, который ведет список, говорит, что их нет. «Я не думаю, что в Top500 есть кластеры Mac», - сказал он.

Исследование

Джон Трент
Доктор Джон Трент из Университета Луисвилля - ведущий исследователь рака, использующий сетку Dataseam. Он утверждает, что сеть помогла создать крупнейший в стране трубопровод противораковых препаратов.

Трент и его коллеги ищут химические вещества, которые нарушат или замедлят рост рака. На основе методов моделирования, которые только что выиграли Нобелевская премия по химии 2013 г., они создали симулятор, который берет трехмерную модель ракового белка и сопоставляет ее с молекулярной моделью химического вещества. Сетка перемещает трехмерные модели, пытаясь собрать их вместе, как трехмерную головоломку. Матч представляет собой потенциальный противораковый препарат. Если химическое вещество прочно связывается с белком, оно может остановить его рост в раковой клетке. Они работают с библиотекой из 20 миллионов химикатов.

набор данных
Это симуляция молекулярного ингибитора - потенциального лекарства - которое было обнаружено с использованием тех же методов, которые использовались в сетке.
Dataaseamgrid-белки
Сетка берет эти молекулы и пытается связать их с раком. Если есть совпадение, соединение является хорошей мишенью для потенциального лекарства.

Трент и его команда работают с 14 другими исследовательскими группами по раку по всей стране и за рубежом. Если они решат, что цель поддается моделированию - а не все - и она помещается в сетку для сопоставления с химической библиотекой. Сеть может обработать 7 миллионов соединений за один уик-энд. Он производит около 1,6 ТБ данных за один прогон. Результаты возвращаются через несколько дней. Если сетка дает многообещающие результаты, команда Трента физически проверяет химические вещества в лаборатории. Раковые белки и химические вещества смешивают в лаборатории, чтобы проверить, связываются ли они - так называемый функциональный анализ. Если они это сделают, химическое вещество - теперь потенциальное противораковое лекарство - может пройти длинную серию испытаний, чтобы проверить его пригодность для лечения рака человека.

«На открытие новых лекарств уходит несколько дней», - говорит Трент. «Клинические испытания занимают годы».

Лабораторная работа
После того, как сетка находит целевое соединение, оно тестируется в лаборатории, чтобы узнать, связывается ли оно с раковыми клетками в реальном мире.

Dataseam на порядки ускоряет процесс открытия лекарств. Десять лет назад эту работу выполняли бригады аспирантов с помощью чашек Петри. Они смешивали состав за составом, чтобы проверить, есть ли связывание. Теперь те же самые тесты можно моделировать, а привязки тестировать виртуально. Все исследования контролируются одним компьютером iMac в офисе Трента.

Dataseam_controller
Исследования представлены с MacPro в лаборатории доктора Трента. На большом экране отображается состояние сетки в одном из школьных округов.

В США есть всего два или три других онкологических исследовательских центра, которые проводят аналогичные высокопроизводительные обследования. используя суперкомпьютеры, среди которых Джорджтаун, Мичиганский университет и Калифорнийский университет в Сане. Франциско.

На данный момент DataseamGrid исследовал более 250 различных мишеней рака и обнаружил 30 химических веществ, которые прошли клиническую проверку. Один из потенциальных лекарств, обнаруженных сеткой, вот-вот войдет в испытания на людях. Это для лечения солидных опухолей; то есть большинство других видов рака, кроме лейкемии. Трент говорит, что в случае успеха соединение может представлять новый класс противораковых препаратов. По иронии судьбы, некоторые из наиболее многообещающих противораковых соединений исследовательской программы получены из табака - одной из основных товарных культур штата.

Однако процесс клинических испытаний - это сложная часть. Два потенциальных лекарства, ранее обнаруженных в онкологическом центре Университета, до прошлого года проходили II фазу тестирования. Компания, проводившая испытания, столкнулась с финансовыми проблемами, и испытания приостановлены. Трент надеется, что один из препаратов повторно пройдет испытания в этом году. Другой находится в клинической неопределенности. «Это наркобизнес», - признает он.

Трент надеется, что сетевые компьютеры могут произвести революцию в открытии лекарств для лечения более редких видов рака, которые не привлекают внимание фармацевтов из-за экономических соображений. Его особенно интересуют детские раковые заболевания. «На исследования для детей нет денег, - говорит он. «Рак - это болезнь пожилых людей».

University_of_louisville
Центр трансляционных исследований (CTR) Университета Луисвилля, где работает доктор Трент.

Настройки

Кентукки - маловероятное место для проведения ультрасовременной программы медицинских исследований. Известный своим бурбоном, жареной едой и табаком, уровень заболеваемости раком здесь на 220% выше, чем в среднем по стране. Он возглавляет нацию с раком легких и колоректального рака, а также с сердечными заболеваниями.

«Здесь много курения и неправильного питания, - говорит Гуптон.

Студент с охотой
Главный операционный директор Dataseam Генри Хант со студентом. «Обучите персонал, и компании придут», - говорит он.

Кентукки очень беден. Средний доход штата составляет 42 000 долларов на семью, но может упасть до 10 000 долларов в беднейших округах, где уровень безработицы достигает 20%, а почти 40% населения живут за национальной чертой бедности. Если вы посмотрите на карту уровня образования и уровня доходов, «большие участки Кентукки выглядят как индейские резервации в Нью-Мексико», - говорит Гуптон.

Гуптон вспоминает реакцию члена школьного совета его родного города, когда он впервые рассказал о Dataseam Grid. «Он фермер. Съеден раком. Он был жив просто назло. Комбинезон. Мутные сапоги. Он сказал: «Я ничего не знаю о компьютерах, но если они помогут в борьбе с раком, мы поможем их вставить сегодня вечером».

Гуптон продолжает: «Мне неприятно звучать так, будто мы нездоровы и необразованны, но у нас есть свои проблемы». Работа в Кентукки традиционно связана с добычей угля. Но по мере того, как отрасль сокращается, рабочие места исчезают, а новые не появляются. Отсутствие образования только усугубляет проблему. «Но у нас также есть возможности», - добавляет он.

«Обучайте персонал, и компании придут», - говорит Генри Хант, главный операционный директор Dataseam. «Может быть, до того, как будущее этих детей было за рудником. Теперь мы отправляем детей в колледж на стипендии ».

Именно образование вдохновляет команду Dataseam. Это часть программы, которой Гуптон больше всего увлечен. Найти противораковые препараты - это круто, но на самом деле им движет обучение детей.

Гуптон в классе
Генеральный директор Dataseam Брайан Гуптон стремится улучшить экономику своего штата. «Мы движем экономическое развитие», - говорит он. «Мы создаем человеческую инфраструктуру и капитал».

Некоторые школы работали Маки из LC-эпоха. Теперь дети выпускают подкасты, информационные бюллетени и цифровые видео. Они транслируют баскетбольные матчи, общаются с другими детьми и солдатами за границей и используют их для школьных занятий.

Dataseam выделяет около 20 стипендий в год, отправляя студентов в два местных университета - Университет Луисвилля и Государственный университет Морхеда. Он также обеспечил обучение и повышение квалификации около 6000 учителей.

Он также подготовил более 112 школьных ИТ-специалистов с профессиональными сертификатами Apple, что делает Кентукки самой высокой концентрацией сертифицированных Apple технических специалистов в США на душу населения. основание.

«У нас растут умы, - говорит Гуптон. «Дело не в сильной спине. Дело в том, можете ли вы думать ».

Он продолжает: «Рабочие места, которые мы пытаемся создать, создают в государстве новую экономику и устойчивое благосостояние. Мы движем экономическое развитие. Мы создаем человеческую инфраструктуру и капитал ».

Знаменитая фотография LBJ, сделанная журналом Time Magazine на крыльце дома Тома Флетчера в округе Мартин, штат Кентукки, в апреле 1964 года, где он объявил войну бедности.

Гуптон рассказывает о человеке из округа Мартин, где Линдон Б. Джонсон объявил войну бедности в 1964 году. Он начинал уборщиком в школьной системе, зарабатывая менее 14 долларов в час. Он учился на сертифицированного системного инженера Apple, программа поддерживается Dataseam. Теперь он работает в местном школьном округе в качестве сертифицированного специалиста по технологиям, зарабатывая от 50 до 60 000 долларов в год. «Этот парень - один из успешных участников программы», - говорит Гуптон. «Он показывает, что такое образование. Это оказало огромное влияние на его жизнь и его семью ».

«Раньше речь шла о пластах угля, - говорит Гуптон. "Теперь это швы данных".

Последнее сообщение в блоге

Новости, аналитика и мнения Apple, а также общие технические новости
August 20, 2021

Cloudflare, Darkroom и другие замечательные приложения неделиОзнакомьтесь с замечательными приложениями на этой неделе.Фото: Cult of MacНа этой нед...

| Культ Mac
August 20, 2021

Дрейка Просмотры альбом собрал 1 миллион продаж всего за пять днейПросмотры - это настоящий успех iTunes для Дрейка.Фотография: AppleДрейк, конечно...

Новости, аналитика и мнения Apple, а также общие технические новости
August 20, 2021

Нехватка 12-дюймового MacBook намекает на скорое обновлениеНе платите полную стоимость за 12-дюймовый MacBook.Фотография: AppleПришло время обновит...