Реферат по предмету "Программирование, компьютеры и кибернетика, ИТ технологии"


Особенности развития, структурная и функциональная организация суперЭВМ


- 39 -

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

«ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

Факультет автоматики и вычислительной техники

Кафедра вычислительной техники

Организация ЭВМ и систем

Реферат на тему

«Особенности развития, структурная и функциональная организация суперЭВМ»

Исполнитель

студент группы 8030 __________ И.А. Переливский

Руководитель

доцент, к.т.н__________А.Д. Чередов

Томск - 2008

СОДЕРЖАНИЕ

Введениеальных средств для анализа и отладки параллельных программ.

Cray T90

Производитель

Cray Inc., Cray Research.

Класс архитектуры

Многопроцессорная векторная система (несколько векторных процессоров работают на общей памяти).

Предшествен-ники

CRAY Y-MP C90, CRAY X-MP.

Модели

Серия T90 включает модели T94, T916 и T932.

Процессор

Системы серии T90 базируются на векторно-конвейерном процессоре Cray Research с пиковой производительностью 2GFlop/s.

Число процессоров

Система T932 может включать до 32 векторных процессоров (до 4-х в модели T94, до 16 модели T916), обеспечивая пиковую производительность более 60GFlop/s.

Масштабируе-мость

Возможно объединение нескольких T90 в MPP-системы.

Память

Система T932 содержит от 1GB до 8GB (до 1 GB в модели T94 и до 4GB в модели T916) оперативной памяти и обеспечивает скорость обменов с памятью до 800MB/sec.

Системное ПО

Используется операционная система UNICOS.

Cray SV1

Производитель

Cray Inc.

Класс архитектуры

Масштабируемый векторный суперкомпьютер.

Процессор

Используются 8-конвейерные векторные процессоры MSP (Multi-Streaming Processor) с пиковой производительностью 4.8 GFLOP/sec; каждый MSP может быть подразделен на 4 стандартных 2-конвейерных процессора с пиковой производительностью 1.2 GFLOP/sec. Тактовая частота процессоров - 250MHz.

Число процессоров

Процессоры объединяются в SMP-узлы, каждый из которых может содержать 6 MSP и 8 стандартных процессоров. Система (кластер) может содержать до 32 таких узлов.

Память

SMP-узел может содержать от 2 до 16GB памяти. Система может содержать до 1TB памяти. Вся память глобально адресуема (архитектура DSM).

Системное ПО

Используется операционная система UNICOS.

Средства программирова-ния

Поставляется векторизующий и распараллеливающий компилятор CF90. Поддерживается также явное параллельное программирование с использованием интерфейсов MPI, OpenMP или Shmem.

Cray X1

Производитель

Cray Inc.

Класс архитектуры

Масштабируемый векторный суперкомпьютер.

Процессор

Используются 16-конвейерные векторные процессоры с пиковой производительностью 12.8 GFLOP/sec. Тактовая частота процессоров - 800MHz.

Число процессоров

В максимальной конфигурации - до 4096.

Память

Каждый процессор может содержать до 16GB памяти. В максимальной конфигурации система может содержать до 64TB памяти. Вся память глобально адресуема (архитектура DSM). Максимальная скорость обмена с оперативной памятью составляет 34.1 Гбайт/сек. на процессор, скорость обмена с кэш-памятью 76.8 Гбайт/сек. на процессор.

Системное ПО

Используется операционная система UNICOS/mp.

Средства программирова-ния

Реализованы компиляторы с языков Фортран и Си++, включающие возможности автоматической векторизации и распараллеливания, специальные оптимизированные библиотеки, интерактивный отладчик и средства для анализа производительности. Приложения могут писаться с использованием MPI, OpenMP, Co-array Fortran и Unified Parallel C (UPC).

Cray XT3

Производитель

Cray Inc.

Класс архитектуры

Массивно-параллельный суперкомпьютер.

Процессор

Используются процессоры AMD Opteron.

Число процессоров

В максимальной конфигурации - до 30508.

Память

Каждый процессор может содержать от 1 до 8 Гбайт оперативной памяти. В максимальной конфигурации система может содержать до 239 Тбайт памяти.

Системное ПО

Используется операционная система UNICOS/lc.

Средства программирова-ния

На компьютере устанавливаются компиляторы Fortran 77, 90, 95, C/C++, коммуникационные библиотеки MPI (с поддержкой стандарта MPI 2.0) и SHMEM, а также оптимизированные версии библиотек BLAS, FFTs, LAPACK, ScaLAPACK и SuperLU. Для анализа производительности системы устанавливается система Cray Apprentice2 performance analysis tools.

SGI Origin2000

Производитель

Silicon Graphics

Класс архитектуры

Модульная система с общей памятью (cc-NUMA).

Процессор

64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz

Модуль

Основной компонент системы - модуль Origin, включающий от 2 до 8 процессоров MIPS R10000 и до 16GB оперативной памяти.

Масштабируе-мость

Поставляются системы Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей.

Коммутатор

Модули системы соединены с помощью сети CrayLink, построенной на маршрутизаторах MetaRouter.

Системное ПО

Используется операционная система SGI IRIX.

Средства программирова-ния

Поставляется распараллеливающий компилятор Cray Fortran 90. Поддерживается стандарт OpenMP.

SGI Altix3000

Производитель

Silicon Graphics

Класс архитектуры

Модульная система с общей памятью (cc-NUMA).

Процессор

Intel Itanium II 1.3GHz/1.5GHz

Модули

Вся система строится из модулей (вычислительных, коммутационных, проч.) Вычислительный компонент системы - модуль C-brick, состоящий из 2-х блоков, включающий 4 процессора (по 2 на блок), 4 слота памяти по 8DIMM (от 4 до 16Gb на C-brick).

Масштабируе-мость

Поставляются системы Origin2000, содержащие до 256 процессоров (т.е. до 512 модулей). Вся память системы (до 256GB) глобально адресуема, аппаратно поддерживается когерентность кэшей.

Коммутатор

Модули системы соединены с помощью сети NUMAlink, построенной на собственных маршрутизаторах R-bricks.

Системное ПО

Используется доработанная ("открытые" доработки) операционная система Linux.

Onyx2 InfiniteReality2

Производитель

Silicon Graphics

Класс архитектуры

Многопроцессорная система визуализации; по аппаратной архитектуре очень похожа на Origin2000.

Число процессоров

Система может включать до 128 процессоров MIPS R10000.

Визуализация

Графические возможности системы обеспечивают специальные устройства трех типов: геометрические (векторные) процессоры, растровые процессоры, генераторы аналоговых сигналов. Система может быть оборудована 16 независимыми каналами графического вывода (visualization pipelines). На аппаратном уровне поддерживается графический интерфейс OpenGL.

Системное ПО

Используется операционная система SGI IRIX.

Sun HPC 10000 (StarFire)

Производитель

Sun Microsystems, серия Sun HPC.

Класс архитектуры

Многопроцессорный SMP-сервер.

Процессор

UltraSPARC II/336MHz

Число процессоров

Система StarFire объединяет от 16 до 64 процессоров.

Память

Система включает от 2GB до 64GB памяти.

Системное ПО

ОС Solaris, ПО распределения ресурсов Load Sharing Facility (LSF).

Средства разработки

Поставляется пакет поддержки параллельных приложений Sun HPC 2.0, включающий такие средства как HPF, MPI, PVM, PFS (параллельная файловая система), Prism (визуальная среда разработки), S3L (библиотека математических подпрограмм), и др.

Sun Fire 15K

Производитель

Sun Microsystems.

Класс архитектуры

Многопроцессорный SMP-сервер.

Процессор

UltraSPARC III/900MHz

Число процессоров

Система Sun Fire 15K объединяет до 106 процессоров.

Память

Система включает до 576GB памяти.

Системное ПО

ОС Solaris 8.

NEC SX-5

Производитель

NEC, серия SX.

Класс архитектуры

Параллельный векторный суперкомпьютер (PVP).

Предшествен-ники

NEC SX-4.

Узел

Каждый узел системы является векторно-конвейерным SMP-суперкомпьютером, объединяющим до 16 индивидуальных векторных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s).

Память

Объем памяти каждого узла - до 128GB, производительность обменов с памятью достигает 1TB/sec.

Масштабируе-мость

Система может включать до 32 узлов, обеспечивая совокупную пиковую производительность до 4 TFlop/s.

Коммутатор

Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch).

Системное ПО

Используется операционная система SUPER-UX.

Средства программирова-ния

поставляются компилятор языка HPF, реализация интерфейса MPI, компиляторы Фортран 77/90 с автоматической векторизацией и поддержкой OpenMP 1.1, а также интегрированная среда разработки и оптимизации PSUITE.

NEC SX-6

Производитель

NEC, серия SX.

Класс архитектуры

Параллельный векторный суперкомпьютер (PVP).

Предшествен-ники

NEC SX-5.

Узел

Каждый узел системы является векторно-конвейерным SMP-суперкомпьютером, объединяющим от 2 до 8 индивидуальных векторных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s).

Память

Объем памяти каждого узла - до 64GB, производительность обменов с памятью достигает 1TB/sec.

Масштабируе-мость

Система может включать до 128 узлов, обеспечивая совокупную пиковую производительность до 8 TFlop/s.

Коммутатор

Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch).

Системное ПО

Используется операционная система SUPER-UX с улучшенной поддержкой SSI (Single System Image).

Средства программирова-ния

поставляются компилятор языка HPF 2.0, реализация интерфейса MPI, компиляторы Фортран 77/90 с автоматической векторизацией, интегрированная среда разработки и оптимизации PSUITE, поддерживается OpenMP 1.1 (в конце 2002 года предполагается поддержка OpenMP 2.0).

Fujitsu VPP

Производитель

Fujitsu

Класс архитектуры

Параллельный векторный суперкомпьютер (PVP).

Модификации

VPP300, VPP700, VPP5000

Процессорный элемент

Каждый процессорный элемент (PE) системы VPP700E состоит скалярного устройства (SU), векторного устройства (VU), блока памяти и устройства сопряжения.
Для VPP700: VU состоит из 7 конвейеров и обеспечивает пиковую производительность до 2.4 GFLOP/sec. Объем памяти - до 2GB.
Для VPP5000: VU состоит из 4 конвейеров, пиковая производительность - 9.6 GFLOP/sec. Объем памяти - до 16GB.

Масштабируе-мость

Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительность до 14.4 GFLOP/sec
Для VPP5000: до 512 PE, суммарная пиковая производительность до 4.9 TFLOP/sec.

Коммутатор

Процессорные элементы связаны коммутатором (crossbar network), который производит двухсторонние обмены, не прерывая вычислений. Пропускная способность каналов коммутатора: для VPP700 - 615MB/sec, для VPP5000 - 1.6GB/sec.


Системное ПО

Используется операционная система UXP/V, основанная на UNIX System VR4.

Средства программирова-ния

Среди средств разработки поставляются: распараллеливающий и векторизующий компилятор Fortran90/VPP, оптимизированная для VPP библиотека математических подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и PVM 3.3.

Fujitsu PrimePower 2000

Производитель

Fujitsu

Класс архитектуры

Многопроцессорные сервера с общей памятью (SMP).

Назначение

Сервер масштаба предприятия(Enterprise Server)

Виртуальные домены

до 15

Процессоры

от 8 до 128 SPARC64-V, тактовая частота 675/788MHz, L1 кэш 128/128KB, L2 кэш 8MB

Пропускная способность шины

57.6 GB/sec

Память

2GB - 512GB ECC SDRAM

Дисковые накопители

внутренние 8,736GB, внешние 414 TB, поддерживается горячая замена

Слоты ввода-вывода

PCI 12-192, из них 6-96 64bit/66MHz/33MHz и 6-96 64bit/33MHz, встроенный SCSI контроллер UltraWide

Операционная система

Solaris 2.6, 7, 8, 9

Минимальная конфигурация

8*675MHz CPU, 4 GB память, 18.2 GB диски, стоимость 1004730 долларов США

Fujitsu PrimePower 2500

Производитель

Fujitsu

Класс архитектуры

Многопроцессорные сервера с общей памятью (SMP).

Назначение

Сервер масштаба предприятия(Enterprise Server)

Partitions (разделы)

до 15 независимых физических, до 15 дополнительных

Процессоры

от 8 до 128 SPARC64-V, тактовая частота 1.35GHz, L1 кэш 256KB, L2 кэш 8MB

Пропускная способность шины

133 GB/sec

Память

2GB - 512GB ECC SDRAM

Дисковые накопители

внутренние 9,34TB (32 PCI/Disk box), внешние 147GB * 4 диска на PCI/Disk box, поддерживается горячая замена

Слоты ввода-вывода

PCI до 320, встроенный SCSI контроллер UltraWide

Операционная система

Solaris 8, 9

AlphaServer

Производитель

Compaq (Digital).

Класс архитектуры.

AlphaServer GS/ES - высокопроизводительный SMP-сервер, AlphaServer SC - массивно-параллельная система, AlphaServer HPC - кластерные системы.

Модификации

GS320, GS160, HPC320, HPC160, GS140, GS60, ES40, DS20 и др.

Процессор

Alpha 21264, 21264A (тактовая частота до 731 MHz в новых моделях)

Число процессоров

до 32 (модель GS320)

Память

до 256 GB (модель GS320)

Масштабируе-мость

Системы HPC320 включают до 4-х узлов AlphaServer ES40, т.е. до 16 процессоров. Системы AlphaServer SC могут объединять до 128 узлов AlphaServer ES40, т.е. до 512 процессоров. Также Compaq предлагает разнообразные кластерные решения на базе своих серверов.

Системное ПО

На платформе AlphaServer поддерживаются операционные системы Tru64 UNIX (это новое имя Digital UNIX), OpenVMS и Linux. Поставляется ПО кластеризации TruCluster Software.

Средства программирова-ния

Поддерживается параллельное программирование в стандартах OpenMP и MPI.

5. ДЕСЯТКА САМЫХ МОЩНЫХ КОМПЬЮТЕРОВ

Данный список был взят из Top500 на ноябрь 2004 года. В списке представлены следующие данные по каждому компьютеру:

§ Rank - порядковый номер в списке Top500;

§ Site - организация, в которой установлен компьютер;

§ Country - страна - местоположение системы;

§ Year - год инсталляции или последнего серьезного обновления системы;

§ Computer - название (тип) компьютера, указанное поставщиком;

§ Processors - количество процессоров;

§ Manufacturer - производитель или поставщик компьютера;

§ Computer Family - семейство компьютеров;

§ Model - модель компьютера или вычислительного узла;

§ Installation Type - вид установки (исследовательская, академическая, правительственная, промышленная, закрытая);

§ Installation Area - область применения (погода, геофизика);

§ Nmax - размер задачи, необходимый для достижения Rmax;

§ Nhalf - размер задачи, необходимый для достижения половины Rmax;

§ Rmax - максимальная полученная производительность по LINPACK;

§ Rpeak - теоретическая пиковая производительность.

Таблица 5.1 - десятка самых мощных компьютеров

Rank

Site Country/Year

Computer Processors Manufacturer

Computer Family Model

Inst. type
Installation Area

Rmax Rpeak

Nmax nhalf

1

IBM/DOE United States/2004

BlueGene/L beta-System BlueGene/L DD2 beta-System (0.7 GHz PowerPC 440) / 32768
IBM

IBM BlueGene/L BlueGene/L

Research

70720 91750

933887

2

NASA/Ames Research Center/NAS
United States/2004

Columbia SGI Altix 1.5 GHz, Voltaire Infiniband / 10160 SGI

SGI Altix
SGI Altix 1.5 GHz

Research

51870 60960

1.29024e+06

3

The Earth Simulator Center
Japan/2002

Earth-Simulator /

5120 NEC

NEC Vector
SX6

Research

35860
40960

1.0752e+06
266240

4

Barcelona Supercomputer Center
Spain/2004

MareNostrum
eServer BladeCenter JS20 (PowerPC970 2.2 GHz), Myrinet / 3564
IBM

IBM Cluster
JS20 CLuster, Myrinet

Academic

20530
31363

812592

5

Lawrence Livermore National Laboratory
United States/2004

Thunder
Intel Itanium2 Tiger4 1.4GHz - Quadrics / 4096
California Digital Corporation

NOW - Intel Itanium
Itanium2 Tiger4 Cluster - Quadrics

Research

19940
22938

975000
110000

6

Los Alamos National Laboratory
United States/2002

ASCI Q
ASCI Q - AlphaServer SC45, 1.25 GHz / 8192
HP

HP AlphaServer
SC Alpha-Server-Cluster

Research

13880
20480

633000
225000

7

Virginia Tech
United States/2004

System X
1100 Dual 2.3 GHz Apple XServe/Mellanox Infiniband 4X/Cisco GigE / 2200
Self-made

NOW - PowerPC
XServe Cluster

Academic

12250
20240

620000

8

IBM - Rochester
United States/2004

BlueGene/L DD1 Prototype (0.5GHz PowerPC 440 w/Custom) / 8192
IBM/ LLNL

IBM BlueGene/L
BlueGene/L

Vendor

11680
16384

331775

9

Naval Oceanographic Office (NAVOCEANO)
United States/2004

eServer pSeries 655 (1.7 GHz Power4+) / 2944
IBM

IBM SP
SP Power4+, Federation

Research

10310
20019.2

10

NCSA
United States/2003

Tungsten
PowerEdge 1750, P4 Xeon 3.06 GHz, Myrinet / 2500
Dell

Dell Cluster
PowerEdge 1750, Myrinet

Academic

9819
15300

630000

ЗАКЛЮЧЕНИЕ

Бурное развитие индустрии суперЭВМ послужило откликом на необходимость человечества в машинах, моделирующих процессы в реальном времени и выполняющих ряд других сложных задач. СуперЭВМ всегда являлись воплощением новейших научно-технических достижений и задавали темп и тенденции развития других видов машин. Пока рост производительности суперЭВМ отвечает увеличению сложности предстающих перед человеком проблем. Однако, можно заметить, что современная концепция развития вычислительных средств направлена, в основном, на количественное улучшение характеристик. Процесс разработки в некоторой степени можно назвать “выжиманием” максимума из уже созданного. Это подразумевает, что современный этап развития вычислительной техники уже вошел в состояние относительной стабильности, и каких-либо качественных измененний в пределах современной концепции едва ли придется ожидать. Очевидно, что за этапом стабильности, который может продлиться неопределенное время (но явно небольшое в масштабе постоянно ускоряющегося темпа жизни), последует “смутный период”, когда уровень возможностей суперЭВМ уже не сможет идти в ногу с потребностями человечества. Эта проблема породит необходимость в переходе на качественно новый уровень вычислительной техники.

Еще одним большим вопросительным знаком в развитии суперЭВМ остается проблема практического отсутствия достаточно чётких и понятных стратегических направлений достижения очевидной цели - создание искусственной интеллектуальной системы, максимально соответствующей естественной, то есть Человеку. Внося существенную неопределённость в саму стратегию развития суперЭВМ, эта проблема порождает ситуацию, когда постоянно расширяющаяся в последнее время мозаика феноменальных научных достижений в области создания ЭВМ, лишённая чёткой связующей системы взглядов на описание и моделирование интеллектуальных систем, не только не уменьшает эту неопределённость, но и в ряде случаев создаёт предпосылки к её увеличению.

Поэтому очень важным шагом, который следует сделать сейчас, является конкретизация стратегии дальнейшего развития суперЭВМ.

СПИСОК ИСТОЧНИКОВ

1. Информационно-аналитический центр по параллельным вычислениям



Не сдавайте скачаную работу преподавателю!
Данный реферат Вы можете использовать для подготовки курсовых проектов.

Поделись с друзьями, за репост + 100 мильонов к студенческой карме :

Пишем реферат самостоятельно:
! Как писать рефераты
Практические рекомендации по написанию студенческих рефератов.
! План реферата Краткий список разделов, отражающий структура и порядок работы над будующим рефератом.
! Введение реферата Вводная часть работы, в которой отражается цель и обозначается список задач.
! Заключение реферата В заключении подводятся итоги, описывается была ли достигнута поставленная цель, каковы результаты.
! Оформление рефератов Методические рекомендации по грамотному оформлению работы по ГОСТ.

Читайте также:
Виды рефератов Какими бывают рефераты по своему назначению и структуре.