Суперкомпьютеры: с древнейших времен и до наших дней

«Суперкомпьютер» — что означает этот термин? Интуитивно он понятен нам всем, только вот каждому – по-своему. Шутливая классификация известных разработчиков вычислительных систем Гордона Белла и Дона Нельсона относит к суперкомпьютерам «всё, что весит более тонны». В некоторой степени они правы – даже микроминиатюризация не смогла сделать суперкомпьютеры компактнее; они и сейчас, как десятилетия назад, занимают целые залы и требуют мощных систем теплоотвода, заполняющих едва ли не больше места, чем сам компьютер. Другое шуточное определение суперкомпьютера: «компьютер, который проблему скорости вычислений сводит к проблеме ввода-вывода». В этом определении тоже есть своя доля истины – при огромной скорости выполнения программ узким местом системы становятся устройства хранения данных и каналы передачи информации. Условно можно назвать суперкомпьютером систему с огромной вычислительной мощностью, предназначенную для одновременной работы над небольшим числом вычислительных задач. К компьютерам, предназначенным для большого числа независимых вычислительных процессов, по традиции применяют термин «мэйнфрейм».
 
Cray-1
 
«Cray-1»
 
В мировой лексикон термин «суперкомпьютер» вошел вместе с компьютерами Сеймура Крея в конце 60-х – начале 70-х годов прошлого века. И сейчас марка «Cray» приходит на ум в первую очередь, когда требуется привести пример сверхмощной вычислительной машины. Любопытно, что сам Крей свои детища суперкомпьютерами не называл никогда. Корпорация «Cray Inc.» и по сей день является одним из мировых лидеров в производстве вычислительных систем большой мощности, наряду с такими мировыми гигантами, как IBM и Hewlett Packard. «Cray-1», выпущенный в 1974 году — первое детище организованной Сеймуром Креем компании. Он имел производительность 133 Мфлопс – миллионов операций над числами с плавающей точкой в секунду. «Cray-1» относится к четвертому поколению компьютерной техники, поколению построенному на сверхбольших интегральных схемах. «Cray-X1E», решение, предлагаемое компанией сейчас, несмотря на гигантский скачок в производительности — до 147 Тфлопс (триллионов операций над вещественными числами в секунду) – также принадлежит к четвертому поколению ЭВМ. 
 
Суперкомпьютеры изначально создавались для трудоемких математических расчетов, поэтому их быстродействие определяется способностью работать с вещественными числами. Абстрактные цифры количества используемых процессоров, их тактовых частот, объема оперативной памяти в данной области заказчиков интересуют мало. Эталоном для измерения производительности суперкомпьютера служат тесты LINPACK BENCHMARK, предложенные Джеком Донгаррой (Jack Dongarra). Эталонные тесты LINPACK основаны на решении системы линейных уравнений с плотно заполненной матрицей коэффициентов над полем действительных чисел методом исключения Гаусса. Результатом работы теста являются два числа – достигнутое количество операций в секунду и реальная производительность системы в процентах от пиковой, максимально возможной для данного компьютера. Обычно реальная производительность на тестах LINPACK колеблется в промежутке от 60 до 80%.
 
Cray-X1E
 
«Cray-X1E»
 
Говоря об истории суперкомпьютеров, стоит упомянуть об отечественных разработках. Возможно, для некоторых это окажется неожиданностью, но в 60-х годах прошлого века отечественная вычислительная отрасль не отставала от лидировавшей тогда американской. В 1996 году куратор Музея вычислительной техники в Великобритании Дорон Свейд написал статью с сенсационным заглавием: "Российская серия суперкомпьютеров БЭСМ, разрабатывавшаяся более чем 40 лет тому назад, может свидетельствовать о лжи Соединенных Штатов, объявлявших технологическое превосходство в течение лет холодной войны". Длинновато и немного пафосно – но суть отражает верно. БЭСМ-6, завершенная в 1966 году, имела производительность порядка 1 Мфлопс. Она выпускалась серийно в течение почти двух десятков лет, регулярно подвергаясь модернизации. БЭСМ-6, в отличие от упомянутого выше «Cray-1», принадлежала к третьему поколению вычислительной техники. Ее технологическая основа – интегральные микросхемы.
 
На смену серии БЭСМ в 1979 пришли суперкомпьютеры серии «Эльбрус». Как и их заокеанские коллеги «Cray», они были построены на сверхбольших интегральных схемах, с применением микропроцессорной архитектуры. Если первые компьютеры этой серии имели быстродействие около 10 Мфлопс,  то последние, появившиеся в 1985 году – до 100 Мфлопс. В процессорах «Эльбрусов» впервые в мире была реализована суперскалярность – технология параллельного выполнения независимых друг от друга команд. Эта технология много позже найдет свое применение в процессорах Intel Pentium, AMD Athlon и других, более поздних, процессорах этих фирм. Кстати, согласно одной из версий, своему  возникновению процессор Pentium обязан некоему Александру Пентакову, работавшему первоначально в команде разработчиков «Эльбруса», но позднее перешедшему в фирму Intel. Справедливости ради отмечу, что подтверждений этой версии я не нашел.
 
БЭСМ-6
 
«БЭСМ-6»
 
К сожалению, с течением времени отставание отечественной компьютерной отрасли от западной нарастало.  И если в сфере теоретических разработок и новейших концепций наши специалисты сохраняли передовые позиции, то в области элементной базы – быстродействующих процессоров, скоростных емких накопителей — Советский Союз к моменту распада серьезно отставал от своих западных конкурентов-противников. Отдельные попытки копирования западных образцов не смогли выправить положение, а распад страны и приход на внутренний рынок западной вычислительной техники подписал отечественной микроэлектронной промышленности окончательный приговор. Сегодня суперкомпьютеры в России представляют собой чаще всего продукты IBM, Sun и других известных фирм, реже – отечественные разработки, но на зарубежной элементной базе.
 
Распад Советского Союза и окончание «холодной» войны оказали влияние и на зарубежных производителей суперкомпьютеров. Первоначально основными заказчиками мощных вычислительных систем были государственные структуры, в первую очередь – военные. Моделирование ядерных взрывов, ставшее актуальным после договора о запрете ядерных испытаний, взлом вражеских шифров, расчет параметров аэрокосмической техники – это требовало все новых и новых вычислительных мощностей. Перестройка, смахнувшая с глобуса основного противника, серьезно уменьшила объемы заказов от правительств стран НАТО, и вынудило производителей суперкомпьютеров активнее искать гражданское применение своей технике. Это оказалось не так сложно: предсказание погоды и разработка новых лекарств, исследования генокода и геологоразведка, ядерная и термоядерная энергетика – вот лишь малая часть возможных применений суперкомпьютеров в «мирных» отраслях. Проблема оказалась в другом – частные заказчики, в отличие от правительств, не нуждаются в дорогостоящих (Cray-1, к примеру, стоил порядка 10 миллионов долларов в ценах 70-х годов) сверхпроизводительных игрушках. Выход был один – превратить суперкомпьютер из уникального, монструозного устройства в серийное, неприхотливое в эксплуатации изделие.
 
SGI-2800
 
«SGI-2800»
 
Этому способствовала эволюция  микропроцессорных устройств. Микроэлектронная промышленность освоила выпуск недорогих, надежных процессоров, регулярно удваивая их производительность. Таким образом, появилась возможность создания на базе стандартных комплектующих масштабируемых мультипроцессорных систем с возможностью наращивания мощности путем добавления новых процессорных блоков. Подобные схемы, называемые  массивно-параллельными системами с распределенной памятью (Massively Parallel Processing, MPP), состоят из обычных микропроцессоров (в настоящее время это, чаще всего, Intel Xeon), каждый из которых снабжен своей локальной памятью. Процессорные блоки связаны между собой сверхбыстрыми каналами связи (Ethernet или оптоволокно). Мощность подобных систем растет практически линейно с числом включаемых в общую сеть процессоров; и значит, зная требуемую для решения задач вычислительную мощность, можно рассчитать необходимое количество процессорных блоков. Если потребуются дополнительные вычислительные мощности, всегда можно добавить к системе новые процессоры. Достоинства подобной MPP-архитектуры очевидны, и более 70% суперкомпьютеров в списке самых быстродействующих суперкомпьютеров Top-500 (www.top500.org)  собраны именно по этой схеме.
 
Кому же принадлежит сегодня пальма первенства в мире суперкомпьютеров? На первом месте в июньском рейтинге Top-500 – компьютер Roadrunner производства IBM. Введенный в строй в 2008 году, этот монстр имеет 98 терабайт оперативной памяти и быстродействие на пике 1375 Тфлопс (или 1,3 Пфлопс – 1,3 квадриллиона операций в секунду). Любопытен выбор процессоров для лидера – процессор PowerXCell 8i 3.2 Ghz (всего 12240 единиц) изначально был разработан для Sony Playstation 3. В системе он работает в связке с двухъядерным AMD Opteron (всего 6562 единицы). Основное назначение – обсчет процессов, происходящих в ядерных зарядах армии США, с целью обеспечения безопасности и боеготовности ядерного оружия. Второе и третье место в этом престижном рейтинге тоже принадлежит IBM – оно досталось суперкомпьютерам серии BlueGene. Правда, их вычислительная мощность даже на пике едва дотягивает до 0,5 Пфлопс. Всего в первой десятке – пять суперкомпьютеров IBM, два – Hewlett Packard, по одному – SGI, Cray Inc. и Sun Microsystems.
 
IBM Roadrunner
 
«IBM Roadrunner»
 
36-е место в этом почетном списке занимает построенный в рамках программы «СКИФ-ГРИД» суперкомпьютер «СКИФ МГУ». Вычислительная мощность созданного отечественной компанией T-Platforms компьютера – 60 Тфлопс на пике. Рейтинг Top-500 обновляется раз в полгода, поэтому в него не попал другой отечественный суперкомпьютер, принадлежащий Российской Академии Наук. Он имеет пиковую вычислительную мощность порядка 75 Тфлопс. Найти свежий  рейтинг 50-ти отечественных суперкомпьютеров можно на сайте Supercomputers.Ru.
 
Наблюдая развитие этой отрасли, можно отметить две основные тенденции. С одной стороны, растет максимальная мощность суперкомпьютеров. Они уже перешагнули барьер в 1 Пфлопс, скоро подобная производительность станет стандартом; а на очереди – уже новый рубеж, в 1000 Пфлопс. С другой стороны, тенденция к удешевлению суперкомпьютеров тоже никуда не исчезла. В этом году Cray предложил покупателям модель Cray CX1, которая, без всякого преувеличения, способна значительно расширить круг владельцев суперкомпьютеров. Все дело в цене – для базовой конфигурации она равна 25000 долларов. В состав Cray CX1 может входить до восьми узлов, в каждом из которых работает по два процессора Intel Xeon (двух- или четырехъядерных). Один узел содержит до 64 ГБ оперативной памяти и до 4 ТБ дисковой памяти. Система рассчитана на установку в офисе, исследовательской лаборатории или университетской аудитории. По словам производителя, Cray CX1 является самым производительным компьютером, питающимся от обычной электросети. К слову, его производительность – порядка 700 Гфлопс (миллиардов операций в секунду). Это в пять тысяч раз больше, чем у первого компьютера серии Cray. Разница в массе также значительна – 5,5 тонн у предка, и 28,6 кг у потомка. Но разница в размерах и мощностях скрывает от наших глаз тот факт, что и пятитонный предшественник, и тридцатикилограммовый потомок – все они принадлежат к одному и тому же поколению ЭВМ, четвертому. Микроэлектроника проделала громадную работу над улучшением разработанной три десятка лет назад технологии, но ничего качественно нового, способного заменить кристаллы интегральных схем, пока не появилось. Периодически проскакивают новости о разработках в области оптических компьютерных элементов, но пока эти разработки не спешат воплощаться в новую технологию. Между тем, все чаще и чаще слышны мнения, что текущий вектор прогресса, направленный на миниатюризацию интегральных схем, почти исчерпал себя…
 
Cray CX1
 
«Cray-CX1»
 
Но вернемся к теме настольных  суперкомпьютеров. Все таки 25 000 долларов для обычного человека – это немало. Пока не появились суперкомпьютеры дешевле, ученые и фанаты компьютеров решают проблему быстрых вычислений по-другому. Астрофизик Гаурав Ханна из Массачусетского университета собрал суперкомпьютер из 16 приставок Sony PlayStation 3. Ученый соединил приставки недорогим Ethernet-адаптером, а работает этот кошмар игромана под операционной системой Linux. Жаль, не получается найти данных о производительности данной системы.
 
Другой вариант – использование в качестве суперкомпьютера сборки современных видеокарт. К примеру, исследователи, работающие в университете Антверпена, создали суперкомпьютер на базе четырех видеоадаптеров NVIDIA GeForce 9800 GX2. Этот суперкомпьютер использует исследовательская группа ASTRA, задачей которой является разработка вычислительных методов томографии. По словам участников группы, восемь графических процессоров NVIDIA обеспечили более высокую производительность, чем сборка из 300 процессоров Intel Core 2 Duo, работающих на частоте 2,4 ГГц. Новая система решает задачи быстрее и потребляет энергии гораздо меньше, чем подобный суперкомпьютерный кластер. И неудивительно – современные графические процессоры как нельзя лучше подходят для организации параллельных вычислений; даже странно как-то использовать подобную мощь только для игр.

Подводя итоги этого краткого экскурса, можно отметить: суперкомпьютеры не только не думают исчезать, напротив, они все больше и больше проникают в нашу жизнь, постепенно превращаясь из сердца крупного вычислительного центра в инструмент на рабочем столе конструктора, инженера, ученого. Навстречу им движется ветвь эволюции персональных компьютеров, постепенно наращивая количество ядер, объем памяти, быстродействие. Хотя справедливости ради отмечу, что чаще всего подобная вычислительная мощность в быту избыточна. Но это — уже совсем другая тема.

Related posts

Leave a Comment