- 39 -
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение высшего профессионального образования
«ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
Факультет автоматики и вычислительной техники
Кафедра вычислительной техники
Организация ЭВМ и систем
Реферат на тему
«Особенности развития, структурная и функциональная организация суперЭВМ»
Исполнитель
студент группы 8030 __________ И.А. Переливский
Руководитель
доцент, к.т.н__________А.Д. Чередов
Томск - 2008
СОДЕРЖАНИЕ
Введениеальных средств для анализа и отладки параллельных программ.
Cray T90
Производитель |
Cray Inc., Cray Research. |
|
Класс архитектуры |
Многопроцессорная векторная система (несколько векторных процессоров работают на общей памяти). |
|
Предшествен-ники |
CRAY Y-MP C90, CRAY X-MP. |
|
Модели |
Серия T90 включает модели T94, T916 и T932. |
|
Процессор |
Системы серии T90 базируются на векторно-конвейерном процессоре Cray Research с пиковой производительностью 2GFlop/s. |
|
Число процессоров |
Система T932 может включать до 32 векторных процессоров (до 4-х в модели T94, до 16 модели T916), обеспечивая пиковую производительность более 60GFlop/s. |
|
Масштабируе-мость |
Возможно объединение нескольких T90 в MPP-системы. |
|
Память |
Система T932 содержит от 1GB до 8GB (до 1 GB в модели T94 и до 4GB в модели T916) оперативной памяти и обеспечивает скорость обменов с памятью до 800MB/sec. |
|
Системное ПО |
Используется операционная система UNICOS. |
|
Cray SV1
Производитель |
Cray Inc. |
|
Класс архитектуры |
Масштабируемый векторный суперкомпьютер. |
|
Процессор |
Используются 8-конвейерные векторные процессоры MSP (Multi-Streaming Processor) с пиковой производительностью 4.8 GFLOP/sec; каждый MSP может быть подразделен на 4 стандартных 2-конвейерных процессора с пиковой производительностью 1.2 GFLOP/sec. Тактовая частота процессоров - 250MHz. |
|
Число процессоров |
Процессоры объединяются в SMP-узлы, каждый из которых может содержать 6 MSP и 8 стандартных процессоров. Система (кластер) может содержать до 32 таких узлов. |
|
Память |
SMP-узел может содержать от 2 до 16GB памяти. Система может содержать до 1TB памяти. Вся память глобально адресуема (архитектура DSM). |
|
Системное ПО |
Используется операционная система UNICOS. |
|
Средства программирова-ния |
Поставляется векторизующий и распараллеливающий компилятор CF90. Поддерживается также явное параллельное программирование с использованием интерфейсов MPI, OpenMP или Shmem. |
|
Cray X1
Производитель |
Cray Inc. |
|
Класс архитектуры |
Масштабируемый векторный суперкомпьютер. |
|
Процессор |
Используются 16-конвейерные векторные процессоры с пиковой производительностью 12.8 GFLOP/sec. Тактовая частота процессоров - 800MHz. |
|
Число процессоров |
В максимальной конфигурации - до 4096. |
|
Память |
Каждый процессор может содержать до 16GB памяти. В максимальной конфигурации система может содержать до 64TB памяти. Вся память глобально адресуема (архитектура DSM). Максимальная скорость обмена с оперативной памятью составляет 34.1 Гбайт/сек. на процессор, скорость обмена с кэш-памятью 76.8 Гбайт/сек. на процессор. |
|
Системное ПО |
Используется операционная система UNICOS/mp. |
|
Средства программирова-ния |
Реализованы компиляторы с языков Фортран и Си++, включающие возможности автоматической векторизации и распараллеливания, специальные оптимизированные библиотеки, интерактивный отладчик и средства для анализа производительности. Приложения могут писаться с использованием MPI, OpenMP, Co-array Fortran и Unified Parallel C (UPC). |
|
Cray XT3
Производитель |
Cray Inc. |
|
Класс архитектуры |
Массивно-параллельный суперкомпьютер. |
|
Процессор |
Используются процессоры AMD Opteron. |
|
Число процессоров |
В максимальной конфигурации - до 30508. |
|
Память |
Каждый процессор может содержать от 1 до 8 Гбайт оперативной памяти. В максимальной конфигурации система может содержать до 239 Тбайт памяти. |
|
Системное ПО |
Используется операционная система UNICOS/lc. |
|
Средства программирова-ния |
На компьютере устанавливаются компиляторы Fortran 77, 90, 95, C/C++, коммуникационные библиотеки MPI (с поддержкой стандарта MPI 2.0) и SHMEM, а также оптимизированные версии библиотек BLAS, FFTs, LAPACK, ScaLAPACK и SuperLU. Для анализа производительности системы устанавливается система Cray Apprentice2 performance analysis tools. |
|
SGI Origin2000
Производитель |
Silicon Graphics |
|
Класс архитектуры |
Модульная система с общей памятью (cc-NUMA). |
|
Процессор |
64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz |
|
Модуль |
Основной компонент системы - модуль Origin, включающий от 2 до 8 процессоров MIPS R10000 и до 16GB оперативной памяти. |
|
Масштабируе-мость |
Поставляются системы Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей. |
|
Коммутатор |
Модули системы соединены с помощью сети CrayLink, построенной на маршрутизаторах MetaRouter. |
|
Системное ПО |
Используется операционная система SGI IRIX. |
|
Средства программирова-ния |
Поставляется распараллеливающий компилятор Cray Fortran 90. Поддерживается стандарт OpenMP. |
|
SGI Altix3000
Производитель |
Silicon Graphics |
|
Класс архитектуры |
Модульная система с общей памятью (cc-NUMA). |
|
Процессор |
Intel Itanium II 1.3GHz/1.5GHz |
|
Модули |
Вся система строится из модулей (вычислительных, коммутационных, проч.) Вычислительный компонент системы - модуль C-brick, состоящий из 2-х блоков, включающий 4 процессора (по 2 на блок), 4 слота памяти по 8DIMM (от 4 до 16Gb на C-brick). |
|
Масштабируе-мость |
Поставляются системы Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей. |
|
Коммутатор |
Модули системы соединены с помощью сети NUMAlink, построенной на собственных маршрутизаторах R-bricks. |
|
Системное ПО |
Используется доработанная ("открытые" доработки) операционная система Linux. |
|
Onyx2 InfiniteReality2
Производитель |
Silicon Graphics |
|
Класс архитектуры |
Многопроцессорная система визуализации; по аппаратной архитектуре очень похожа на Origin2000. |
|
Число процессоров |
Система может включать до 128 процессоров MIPS R10000. |
|
Визуализация |
Графические возможности системы обеспечивают специальные устройства трех типов: геометрические (векторные) процессоры, растровые процессоры, генераторы аналоговых сигналов. Система может быть оборудована 16 независимыми каналами графического вывода (visualization pipelines). На аппаратном уровне поддерживается графический интерфейс OpenGL. |
|
Системное ПО |
Используется операционная система SGI IRIX. |
|
Sun HPC 10000 (StarFire)
Производитель |
Sun Microsystems, серия Sun HPC. |
|
Класс архитектуры |
Многопроцессорный SMP-сервер. |
|
Процессор |
UltraSPARC II/336MHz |
|
Число процессоров |
Система StarFire объединяет от 16 до 64 процессоров. |
|
Память |
Система включает от 2GB до 64GB памяти. |
|
Системное ПО |
ОС Solaris, ПО распределения ресурсов Load Sharing Facility (LSF). |
|
Средства разработки |
Поставляется пакет поддержки параллельных приложений Sun HPC 2.0, включающий такие средства как HPF, MPI, PVM, PFS (параллельная файловая система), Prism (визуальная среда разработки), S3L (библиотека математических подпрограмм), и др. |
|
Sun Fire 15K
Производитель |
Sun Microsystems. |
|
Класс архитектуры |
Многопроцессорный SMP-сервер. |
|
Процессор |
UltraSPARC III/900MHz |
|
Число процессоров |
Система Sun Fire 15K объединяет до 106 процессоров. |
|
Память |
Система включает до 576GB памяти. |
|
Системное ПО |
ОС Solaris 8. |
|
NEC SX-5
Производитель |
NEC, серия SX. |
|
Класс архитектуры |
Параллельный векторный суперкомпьютер (PVP). |
|
Предшествен-ники |
NEC SX-4. |
|
Узел |
Каждый узел системы является векторно-конвейерным SMP-суперкомпьютером, объединяющим до 16 индивидуальных векторных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s). |
|
Память |
Объем памяти каждого узла - до 128GB, производительность обменов с памятью достигает 1TB/sec. |
|
Масштабируе-мость |
Система может включать до 32 узлов, обеспечивая совокупную пиковую производительность до 4 TFlop/s. |
|
Коммутатор |
Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch). |
|
Системное ПО |
Используется операционная система SUPER-UX. |
|
Средства программирова-ния |
поставляются компилятор языка HPF, реализация интерфейса MPI, компиляторы Фортран 77/90 с автоматической векторизацией и поддержкой OpenMP 1.1, а также интегрированная среда разработки и оптимизации PSUITE. |
|
NEC SX-6
Производитель |
NEC, серия SX. |
|
Класс архитектуры |
Параллельный векторный суперкомпьютер (PVP). |
|
Предшествен-ники |
NEC SX-5. |
|
Узел |
Каждый узел системы является векторно-конвейерным SMP-суперкомпьютером, объединяющим от 2 до 8 индивидуальных векторных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s). |
|
Память |
Объем памяти каждого узла - до 64GB, производительность обменов с памятью достигает 1TB/sec. |
|
Масштабируе-мость |
Система может включать до 128 узлов, обеспечивая совокупную пиковую производительность до 8 TFlop/s. |
|
Коммутатор |
Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch). |
|
Системное ПО |
Используется операционная система SUPER-UX с улучшенной поддержкой SSI (Single System Image). |
|
Средства программирова-ния |
поставляются компилятор языка HPF 2.0, реализация интерфейса MPI, компиляторы Фортран 77/90 с автоматической векторизацией, интегрированная среда разработки и оптимизации PSUITE, поддерживается OpenMP 1.1 (в конце 2002 года предполагается поддержка OpenMP 2.0). |
|
Fujitsu VPP
Производитель |
Fujitsu |
|
Класс архитектуры |
Параллельный векторный суперкомпьютер (PVP). |
|
Модификации |
VPP300, VPP700, VPP5000 |
|
Процессорный элемент |
Каждый процессорный элемент (PE) системы VPP700E состоит скалярного устройства (SU), векторного устройства (VU), блока памяти и устройства сопряжения. |
|
Масштабируе-мость |
Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительность до 14.4 GFLOP/sec |
|
Коммутатор |
Процессорные элементы связаны коммутатором (crossbar network), который производит двухсторонние обмены, не прерывая вычислений. Пропускная способность каналов коммутатора: для VPP700 - 615MB/sec, для VPP5000 - 1.6GB/sec. |
|
Системное ПО |
Используется операционная система UXP/V, основанная на UNIX System VR4. |
|
Средства программирова-ния |
Среди средств разработки поставляются: распараллеливающий и векторизующий компилятор Fortran90/VPP, оптимизированная для VPP библиотека математических подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и PVM 3.3. |
|
Fujitsu PrimePower 2000
Производитель |
Fujitsu |
|
Класс архитектуры |
Многопроцессорные сервера с общей памятью (SMP). |
|
Назначение |
Сервер масштаба предприятия(Enterprise Server) |
|
Виртуальные домены |
до 15 |
|
Процессоры |
от 8 до 128 SPARC64-V, тактовая частота 675/788MHz, L1 кэш 128/128KB, L2 кэш 8MB |
|
Пропускная способность шины |
57.6 GB/sec |
|
Память |
2GB - 512GB ECC SDRAM |
|
Дисковые накопители |
внутренние 8,736GB, внешние 414 TB, поддерживается горячая замена |
|
Слоты ввода-вывода |
PCI 12-192, из них 6-96 64bit/66MHz/33MHz и 6-96 64bit/33MHz, встроенный SCSI контроллер UltraWide |
|
Операционная система |
Solaris 2.6, 7, 8, 9 |
|
Минимальная конфигурация |
8*675MHz CPU, 4 GB память, 18.2 GB диски, стоимость 1004730 долларов США |
|
Fujitsu PrimePower 2500
Производитель |
Fujitsu |
|
Класс архитектуры |
Многопроцессорные сервера с общей памятью (SMP). |
|
Назначение |
Сервер масштаба предприятия(Enterprise Server) |
|
Partitions (разделы) |
до 15 независимых физических, до 15 дополнительных |
|
Процессоры |
от 8 до 128 SPARC64-V, тактовая частота 1.35GHz, L1 кэш 256KB, L2 кэш 8MB |
|
Пропускная способность шины |
133 GB/sec |
|
Память |
2GB - 512GB ECC SDRAM |
|
Дисковые накопители |
внутренние 9,34TB (32 PCI/Disk box), внешние 147GB * 4 диска на PCI/Disk box, поддерживается горячая замена |
|
Слоты ввода-вывода |
PCI до 320, встроенный SCSI контроллер UltraWide |
|
Операционная система |
Solaris 8, 9 |
|
AlphaServer
Производитель |
Compaq (Digital). |
|
Класс архитектуры. |
AlphaServer GS/ES - высокопроизводительный SMP-сервер, AlphaServer SC - массивно-параллельная система, AlphaServer HPC - кластерные системы. |
|
Модификации |
GS320, GS160, HPC320, HPC160, GS140, GS60, ES40, DS20 и др. |
|
Процессор |
Alpha 21264, 21264A (тактовая частота до 731 MHz в новых моделях) |
|
Число процессоров |
до 32 (модель GS320) |
|
Память |
до 256 GB (модель GS320) |
|
Масштабируе-мость |
Системы HPC320 включают до 4-х узлов AlphaServer ES40, т.е. до 16 процессоров. Системы AlphaServer SC могут объединять до 128 узлов AlphaServer ES40, т.е. до 512 процессоров. Также Compaq предлагает разнообразные кластерные решения на базе своих серверов. |
|
Системное ПО |
На платформе AlphaServer поддерживаются операционные системы Tru64 UNIX (это новое имя Digital UNIX), OpenVMS и Linux. Поставляется ПО кластеризации TruCluster Software. |
|
Средства программирова-ния |
Поддерживается параллельное программирование в стандартах OpenMP и MPI. |
|
5. ДЕСЯТКА САМЫХ МОЩНЫХ КОМПЬЮТЕРОВ
Данный список был взят из Top500 на ноябрь 2004 года. В списке представлены следующие данные по каждому компьютеру:
§ Rank - порядковый номер в списке Top500;
§ Site - организация, в которой установлен компьютер;
§ Country - страна - местоположение системы;
§ Year - год инсталляции или последнего серьезного обновления системы;
§ Computer - название (тип) компьютера, указанное поставщиком;
§ Processors - количество процессоров;
§ Manufacturer - производитель или поставщик компьютера;
§ Computer Family - семейство компьютеров;
§ Model - модель компьютера или вычислительного узла;
§ Installation Type - вид установки (исследовательская, академическая, правительственная, промышленная, закрытая);
§ Installation Area - область применения (погода, геофизика);
§ Nmax - размер задачи, необходимый для достижения Rmax;
§ Nhalf - размер задачи, необходимый для достижения половины Rmax;
§ Rmax - максимальная полученная производительность по LINPACK;
§ Rpeak - теоретическая пиковая производительность.
Таблица 5.1 - десятка самых мощных компьютеров
Rank |
Site Country/Year |
Computer Processors Manufacturer |
Computer Family Model |
Inst. type |
Rmax Rpeak |
Nmax nhalf |
|
1 |
IBM/DOE United States/2004 |
BlueGene/L beta-System BlueGene/L DD2 beta-System (0.7 GHz PowerPC 440) / 32768 |
IBM BlueGene/L BlueGene/L |
Research |
70720 91750 |
933887 |
|
2 |
NASA/Ames Research Center/NAS |
Columbia SGI Altix 1.5 GHz, Voltaire Infiniband / 10160 SGI |
SGI Altix |
Research |
51870 60960 |
1.29024e+06 |
|
3 |
The Earth Simulator Center |
Earth-Simulator / 5120 NEC |
NEC Vector |
Research |
35860 |
1.0752e+06 |
|
4 |
Barcelona Supercomputer Center |
MareNostrum |
IBM Cluster |
Academic |
20530 |
812592 |
|
5 |
Lawrence Livermore National Laboratory |
Thunder |
NOW - Intel Itanium |
Research |
19940 |
975000 |
|
6 |
Los Alamos National Laboratory |
ASCI Q |
HP AlphaServer |
Research |
13880 |
633000 |
|
7 |
Virginia Tech |
System X |
NOW - PowerPC |
Academic |
12250 |
620000 |
|
8 |
IBM - Rochester |
BlueGene/L DD1 Prototype (0.5GHz PowerPC 440 w/Custom) / 8192 |
IBM BlueGene/L |
Vendor |
11680 |
331775 |
|
9 |
Naval Oceanographic Office (NAVOCEANO) |
eServer pSeries 655 (1.7 GHz Power4+) / 2944 |
IBM SP |
Research |
10310 |
||
10 |
NCSA |
Tungsten |
Dell Cluster |
Academic |
9819 |
630000 |
|
ЗАКЛЮЧЕНИЕ
Бурное развитие индустрии суперЭВМ послужило откликом на необходимость человечества в машинах, моделирующих процессы в реальном времени и выполняющих ряд других сложных задач. СуперЭВМ всегда являлись воплощением новейших научно-технических достижений и задавали темп и тенденции развития других видов машин. Пока рост производительности суперЭВМ отвечает увеличению сложности предстающих перед человеком проблем. Однако, можно заметить, что современная концепция развития вычислительных средств направлена, в основном, на количественное улучшение характеристик. Процесс разработки в некоторой степени можно назвать “выжиманием” максимума из уже созданного. Это подразумевает, что современный этап развития вычислительной техники уже вошел в состояние относительной стабильности, и каких-либо качественных измененний в пределах современной концепции едва ли придется ожидать. Очевидно, что за этапом стабильности, который может продлиться неопределенное время (но явно небольшое в масштабе постоянно ускоряющегося темпа жизни), последует “смутный период”, когда уровень возможностей суперЭВМ уже не сможет идти в ногу с потребностями человечества. Эта проблема породит необходимость в переходе на качественно новый уровень вычислительной техники.
Еще одним большим вопросительным знаком в развитии суперЭВМ остается проблема практического отсутствия достаточно чётких и понятных стратегических направлений достижения очевидной цели - создание искусственной интеллектуальной системы, максимально соответствующей естественной, то есть Человеку. Внося существенную неопределённость в саму стратегию развития суперЭВМ, эта проблема порождает ситуацию, когда постоянно расширяющаяся в последнее время мозаика феноменальных научных достижений в области создания ЭВМ, лишённая чёткой связующей системы взглядов на описание и моделирование интеллектуальных систем, не только не уменьшает эту неопределённость, но и в ряде случаев создаёт предпосылки к её увеличению.
Поэтому очень важным шагом, который следует сделать сейчас, является конкретизация стратегии дальнейшего развития суперЭВМ.
СПИСОК ИСТОЧНИКОВ
1. Информационно-аналитический центр по параллельным вычислениям
! |
Как писать рефераты Практические рекомендации по написанию студенческих рефератов. |
! | План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом. |
! | Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач. |
! | Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты. |
! | Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ. |
→ | Виды рефератов Какими бывают рефераты по своему назначению и структуре. |