Федеральноеагентство связи
Бурятскийфилиал ГОУ ВПО «СибГУТИ»
КафедраИВТ
Курсоваяработа
Подисциплине: Организация и архитектура ЭВМ
На тему: Архитектурамногокристального МП К10 и К10.5
Специальность:230100: ИВТ
Улан-Удэ
2011 г.
/>/>/>/>/>/>Введение
Построение ЭВМ наоснове микропроцессорных БИС позволяет уменьшить стоимость микроЭВМ, сравнимыхпо своим параметрам с ранее созданными ЭВМ, в 103 — 104раз, габаритным размерам — в (2-3)x104 раз, по мощности потребления- в 105 раз. Это означает, что без увеличения общих затрат микроэлектроннаятехнология позволяет обществу произвести в сотни и тысячи раз больше ЭВМ, чемранее.
Микропроцессор – функционально законченное устройство обработкиинформации, управляемое хранимой в памяти программой. Появлениемикропроцессоров (МП) стало возможным благодаря развитию интегральнойэлектроники. Это позволило перейти от схем малой и средней степени интеграции кбольшим и сверхбольшим интегральным микросхемам (БИС и СБИС).
По логическимфункциям и структуре МП напоминаетупрощенный вариант процессора обычных ЭВМ. Конструктивно он представляет собойодну или несколько БИС или СБИС.
По конструктивномупризнаку МП можно разделить на однокристальные МП с фиксированной длиной(разрядностью) слова и определенной системой команд; многокристальные(секционные) МП с наращиваемой разрядностью слова и микропрограммнымуправлением (они состоят из двух БИС и более).
В последнее времяпоявились однокристальные МП с микропрограммным управлением.
Архитектурамногокристального МП с микропрограммным управлением позволяет достичь гибкостив его применении и сравнительно простыми средствами организовать параллельноевыполнение отдельных машинных операций, что повышает производительность ЭВМ натаких МП.
В данной курсовойработе будут рассмотрены два поколения микропроцессорной архитектуры – К10 иК10.5
/>/>/>История создания
K10 —поколение архитектуры микропроцессоров x86 компании AMD. Процессоры этойархитектуры появились в продаже в конце 2007 года.
Первое упоминание омикроархитектуре следующего поколения появилось в 2003 году, на форумеMicroprocessor Forum 2003. На форуме отмечалось, что в новую микроархитектурубудет положено многоядерность процессоров, которые будут работать на тактовыхчастотах до 10 ГГц. Позднее тактовые частоты были в несколько раз занижены.Первые официальные упоминания AMD о разработке четырёхъядерных процессорахпоявились в мае 2006-го в роадмапе, опубликованном на срок до 2009 года.Правда, тогда новая микроархитектура значилась под кодовым наименованием AMDK8L, и только в феврале 2007 года было утверждено окончательное наименованиеAMD K10. Процессоры, основанные на улучшенной архитектуре AMD K8, должны былистать первыми четырёхъядерными процессорами AMD, а также первыми процессорамина рынке, в котором все 4 ядра расположены на одном кристалле (ранее ходилислухи о появлении четырёхъядерного процессора AMD, представляющего собой двадвухъядерных кристалла Opteron).
Серийный выпускчетырёхъядерных Phenom II X4 начался в январе 2009 года, трёхъядерных Phenom IIX3 – в феврале 2009 года, двуядерных Phenom II X2 – в июне 2009 года, ашестиядерных Phenom II X2 – в апреле 2010 года.
Athlon II – заменаSempron – представляет собой Phenom II, лишённый одного из важнейших егодостоинств – большой кэш-памяти третьего уровня (L3), общей для всех ядер.Выпускается в дву-, трёх- и четырёхъядерных вариантах. Athlon II X2производится с июня 2009 года, X4 – c сентября 2009 года, а X3 – c ноября 2009года.
В 2008 году осуществлен выпуск архитектуры К10.5,основанной на К10.
/>/>/>Описание К10
К10 представляетсобой 65нм процессор SOI. Состоит из 450 млн. транзисторов и имеет площадьядра: 283 кв.мм. Напряжение:1.05V-1.38V. Socket: AM2+(940pin)/F(1207 pin)
Оригинальное ядроK10 имеет кодовое имя Barcelona (AMD), для сопроцессоров, предназначенных длясерверов. Позже были выпущены процессоры для настольных компьютеров, там ядроK10 получило название Agena.
Все процессоры сядром К10, попавшие на рынок в 2007 году, имеют степпинг В2 и ВА и содержатошибку в контроллере памяти, из-за которой в определённых условиях микропроцессорможет неправильно функционировать (так называемый «TLB bug»).
TLB bug
В связи спроцессорами Agena и Barcelona (AMD) часто упоминается так называемая TLB bugили ошибка TLB. Данная ошибка встречается во всех четырёхъядерных процессорахAMD ревизии B2 и может привести в очень редких случаях к непредсказуемомуповедению системы при высоких нагрузках. Данная ошибка критична в серверномсегменте, что явилось причиной приостановки всех поставок процессоров Barcelona(AMD) ревизии В2. Для настольных процессоров Phenom был предложен TLB patchкоторый предотвращает возникновение ошибки путём отключения части логики TLB.Данный патч, хоть и спасает от TLB bug но также негативно влияет напроизводительность. Ошибка исправлена в ревизии B3.
TDP и ACP
С выходомпроцессоров Opteron 3G на ядре Barcelona (AMD) компания AMD ввела новуюэнергетическую характеристику под названием ACP (Average CPU Power) — среднийуровень энергопотребления новых процессоров при нагрузке. AMD также продолжитуказывать и максимальный уровень энергопотребления — TDP.
Обозначение
C появлениемпроцессоров поколения К10 в ассортименте AMD изменились также их обозначения —под новыми обозначениями скрываются как модели, основанные на К10, так и на AMDK8
Системаобозначений процессоров AMD Серия процессоров Обозначение Phenom X4 quad-core (Agena) X4 9xx0 Phenom X3 triple-core (Toliman) X3 8xx0 Athlon dual-core (Kuma) 7xx0 Athlon single-core (Lima) 1xx0 Semporn single-core (Sparta) 1xx0 />/>/> ОписаниеК 10.5
Следующее заBarcelona ядро серверных процессоров имеет кодовое имя Shanghai и производитьсяпо 45 нм нормам. Однако это не простой перенос архитектуры K10 на новыйтехпроцесс. Его архитектура называется K10.5 и имеет расширенный наборинструкций, обладает 6 Мб распределенного кэша L3 и поддержкой сокета 1207+ЯдроDeneb (Shanghai) представляет собой 45нм процессор поколения К10.5. Состоит из~758 млн транзисторов и имеет площадь в 243 мм (против 731 млн и 246 мм у Intel Nehalem). Отличается увеличенным кэшем L3 (с 2 МБ до 6 МБ), а такженезначительными оптимизациями архитектуры.
Основная цель —повышение частот процессорной линейки Phenom, снижение TDP, а такжесебестоимости производства. По словам AMD, процессоры Deneb/Shanghai обходятравночастотные Agena/Barcelona на величину до 35 %, обладая энергопотреблениемна 30% ниже. Анонс процессоров Opteron на ядре Shanghai состоялся 13 ноября2008. Процессоры Deneb ожидались в 1ом квартале 2009. Первые процессоры на ядреDeneb выпущены AMD 8 января 2009 года под именем Phenom II X4 (модели 920 и 940Black Edition)./>/>/> Особенностиархитектуры К10
· Основным отличием процессоровпоколения K10 от своих предшественников на базе AMD K8 является объединениечетырёх ядер на одном кристалле, обновления протокола Hyper-Transport до версии3.0, общий для всех ядер кэш L3, а также перспективная поддержка контроллеромпамяти DDR3. Сами ядра также были модернизированы по сравнению с ядрами AMD K8.
· Чипы K10 могут выполнять 64-битныеSSE-инструкции как одну. Именно поэтому увеличение разрядности SSE-блоков такважно и производительность должна вырасти довольно значительно.
· Увеличена разрядность интерфейсамежду SSE-блоками и кэшем данных первого уровня. Теперь за один такт сталавозможной загрузка двух 128-битных инструкций за такт против двух 64-битных уK8.
· Связь между кэшем L2 иконтроллером памяти также увеличила разрядность и теперь составляет 128 бит.
· Поддерживаются инструкции SSE4a,которые, помимо стандартного набора, включают: комбинированный набор инструкций(EXTRQ/INSERTQ) и векторные потоковые инструкции (MOVNTSD/MOVNTSS).
· Архитектура K10 позволяетотслеживать гораздо больше переходов и ветвлений, за счет чего повышаетсяточность предсказаний. А чем точнее предсказания переходов, тем более полнопроцессор способен загрузить работой свои исполнительные блоки.
· Также вдвое в сравнении с K8увеличен размер стека возврата. У K8 при выполнении длинной цепочки запросоввозможна ситуация, когда места для записи начального адреса в стеке возврата нехватает и тогда предсказания ветвлений становятся невозможными. Теперьвероятность этого значительно снизилась.
· Позволяет увеличитьпроизводительность и эффективность путём прямого соединения контроллера памятии канала ввода/вывода с ядром.
· Разработана для одновременноговыполнения как 32-битных, так и 64-битных вычислений.
· Интеграция контроллера памятистандарта DDR2 (вплоть до режима 533 (1066) МГц, а также с перспективнойподдержкой DDR3)/>/>/> Особенностиархитектуры К10.5
· Ширина шины памяти контроллера:128 бит
· Поддержка шины Hyper Transport 3.0
· Частота системной шины: 1800 — 2600 МГц (эффективная 3600 — 5200 МГц)
· Поддержка технологии AMD64Technology
· Поддержка 64-битных вычислений
· Поддержка технологий AMD Cool'n'Quiet 3.0, AMD CoolCore, DualDynamic Power Management
· Поддержка технологий EVP (Enhanced Virus Protection) и AMDVirtualization Techology
· Поддержка инструкций SSE, SSE2, SSE3, SSE4a, ABM, MMX, 3DNow!
· Максимальная температура: 62°С
· Рассеиваемая мощность (TDP) 125 Вт/>/>/> СравнениеК10 и К10.5
Наиболеепримечательной особенностью четырёхъядерных процессоров с микроархитектурой К10является улучшенная схема управления питанием и тактовой частотой. Теперькаждое процессорное ядро вправе само «решать», на какой частоте емуработать, причём изменение происходит динамически и никак не влияет на частотуработы остальных ядер.
Иначе говоря, чембольше загружен процессор, тем больше ядер участвуют в работе. При этомнагрузка может быть распределена неравномерно, и каждое ядро, в зависимости отсвоей «участи», будет работать на собственной тактовой частоте,оптимальной с точки зрения производительности. Кроме того, часть ядер можетбыть попросту отключена, когда их участие в работе процессора не требуется.
Подобная технологиябыла реализована и в более ранних процессорах AMD и Intel и также была призванаснизить среднюю потребляемую мощность. Однако для четырёхъядерных решений AMDпроблема тепловыделения стала особенно актуальной, поскольку процессоры моглизапросто рассеивать колоссальные 250 Вт тепла. Для сравнения, четырёхъядерныепроцессоры Intel ограничивались куда более скромным значением в 130 Вт.
/>/>/>Преимущества К10
Увеличениепроизводительности приложений путём сокращения задержек при обращении к памяти.
Распределяет полосупропускания памяти в зависимости от запросов.
ТехнологияHyper-Transport обеспечивает соединение на пиковой скорости до 16,0 ГБ/сек дляпредотвращения задержек.
До 33,1 ГБ/сексуммарной пропускной способности между процессором и системой (с учетом шиныHyper-Transport и контроллера памяти).
В процессорахархитектуры K8, а также Intel NetBurst(Pentium 4)процессор выгружает обработанные данные только после получения новых, чтонесколько снижает производительность. Часть исполнительных блоков процессорапростаивает.
Архитектура K10дает возможность загружать новые данные до выгрузки обработанных. Подобноеотличие существует и между архитектурами NetBurst и Core, но реализациятехнологии у AMD и Intel разная. Если у Intel используется предсказатель,который предотвращает опережение загрузки данных над их выгрузкой из одной итой же ячейки памяти, то чипы AMD адрес выгрузки рассчитывают, что исключаетвозможность ошибки. Если подобная ошибка происходит, то данные будут потеряны ивыполнение команды придется начинать сначала.
Реализациятехнологии внеочередной загрузки команд у K10 выглядит привлекательней./>/>/>/> Преимущества К10.5
Номинальная частотаработы процессора, составляющая 3,7 ГГц, формируется по схеме: множитель 18,5 xшаг 200 МГц. На кристалле процессора располагаются четыре вычислительных ядрана базе архитектуры x86-64, каждое из которых оснащается индивидуальным кэшем512 Кб, при этом размер общей для всех четырёх ядер кэш-памяти третьего уровнясоставляет 6 Мб. Платой за высокую частоту работы является весьма немалоеэнергопотребление процессора, составляющее 125 Вт. Интегрированный контроллерпамяти поддерживает работу с памятью DDR2 и DDR3 в двухканальном режиме. Новыйпроцессор AMD с Socket AM3 обратно совместим с процессорным разъёмом AM2+, чтопредполагает возможность его использования в материнскихплатах на базе сокета AM2+. Для связи с чипсетом используетсяшина HyperTransport с полосой пропускания 41.6 Гт/с. />/>/> Перспективаразвития К10 и К10.5
В июле 2011 годабудут выпущены первые гибриды процессоров, созданных по старой технологии К10 иК10.5 – Llano.
Процессоры Llanoбудут выпускаться по 32 нм технологии с применением материалов, имеющих высокоезначение диэлектрической константы (high-k), а также транзисторов сметаллическим затвором. Технология «напряжённого кремния» будетсоседствовать с соединениями германия и кремния. При производстве процессоровбудет задействована технология иммерсионной литографии второго поколения. Какмы уже сообщали, каждое из четырёх процессорных ядер Llano будет иметь площадь9.69 кв.мм без учёта кэш-памяти второго уровня объёмом 1 Мб, на этой площадиразместится более 35 млн. транзисторов.
Процессоры Llanoсмогут работать на частотах свыше 3 ГГц, уровень энергопотребления будетколебаться от 2.5 до 25 Вт, номинальное напряжение будет лежать в пределах от0.8 до 1.3 В. Каждое процессорное ядро получит 1 Мб кэша второго уровня,архитектурно ядра Llano будут представлять собой усовершенствованные Phenom II.Встроенное графическое ядро поколения Evergreen с поддержкой DirectX 11 посвоим возможностям будет соответствовать бюджетным решениям семейства Radeon HD5xxx. Графическое и вычислительные ядра будут размещаться на одном кристалле. микропроцессор архитектура структура
Процессоры Llanoбудут потреблять очень мало энергии в состоянии покоя, чему будутспособствовать продвинутые механизмы управления питанием, внедрённые на уровнепроцессорного ядра. Предполагается, что вслед за процессорами Thuban поддержкунекоего аналога Turbo Boost получат и процессоры Llano. Технология будетпозволять динамически повышать или понижать частоту каждого ядрапропорционально уровню нагрузки. Переход из одного энергетического состояния вдругое потребует от процессоров Llano в два раза меньших затрат электрическойэнергии по сравнению с предшественниками.
/>Заключение
Сочетание превосходнойпроизводительности, высокой тактовой частоты, впечатляющей пропускнойспособности системной шины и надежная конструкция делают процессоры архитектурыК10, К10.5 наиболее оправданным выбором для настольных ПК высокого уровня,рабочих станций и серверов.
Основнымипринципами стали:
· Модульность;
· Масштабируемость;
· Мобильность;
· Доступность и открытость;
· Совместимость и эффективность.
За этим наборомслов скрываются большие возможности (согласно планам компании) по построениюсистем, которые можно переконфигурировать для различных задач с цельюдостижения более высокой эффективности, возможность линейного увеличенияпроизводительности при решении однопоточных и многопоточных задач, применениеэнергоэффективных технологий для использования в мобильных системах, открытостьдля внедрения инновационных решений, обратная совместимость и возможностьобновления, использование эффективных встроенных систем ввода-вывода.
Данная курсоваяработа была подготовлена по материалам интернета.
/>/>/>Список использованной литературы
a) http://ru.wikipedia.org/wiki/K10
b) http://www.amd.com/ru/products/Pages/processors.aspx
c) http://www.computerra.ru/print/338908
d) http://www.mobimag.ru/Articles/2580/AMD_K10_arhitektura_markirovka_i_drugie_osobennosti_gryadushei_revolyucii.htm
e) http://www.overclockers.ru/hardnews/27803.shtml
f) http://www.ixbt.com/news/hard/index.shtml?08/92/09
g) http://www.overclockers.ru/hardnews/36100/AMD_rasskazyvaet_o_gibridnyh_processorah_Llano.html
h) http://www.upweek.ru/bulldozer-i-bobcat-novye-arxitektury-amd.html
i) http://www.3dnews.ru/news/dati-vihoda-amd-bulldozer-i-llano-popali-v-set/