Главная страница

Цель рассмотреть характеристики видов процессоров в их историческом развитии


Скачать 0.78 Mb.
НазваниеЦель рассмотреть характеристики видов процессоров в их историческом развитии
Дата29.04.2022
Размер0.78 Mb.
Формат файлаrtf
Имя файлаbibliofond.ru_872352.rtf
ТипДокументы
#503772
страница5 из 5
1   2   3   4   5



2.3 Основные направления развития архитектуры универсальных микропроцессоров


процессор центральный архитектура цифровой

Развитие микропроцессорной техники в области универсальных микропроцессоров идет по пути постоянного повышения их производительности. Традиционными направлениями такого развития являются повышение тактовой частоты работы МП и увеличение количества одновременно выполняемых команд за счет увеличения числа конвейеров (исполнительных устройств) в МП.

Однако оба эти направления следует признать экстенсивными, имеющими естественные ограничения.

Повышение тактовой частоты, которое в основном обеспечивается путем увеличения количества ступеней в конвейере, приводит к большим потерям времени при необходимости перезагрузки конвейера вследствие конфликтов по управлению или при переключении на новую задачу. Такое увеличение имеет также и физические ограничения, связанные со схемотехникой кристалла БИС. Ограничения определяются также влиянием накладных расходов при передаче частично обработанной команды на следующую ступень конвейера. На больших частотах эти расходы становятся соизмеримыми с длительностью обработки на очередном этапе. Во многом это направление исчерпало себя в микропроцессоре Pentium 4, работающем на частотах, близких к 4 ГГц.

Повышение производительности за счет увеличения числа конвейеров в микропроцессоре можно оценить увеличением числа команд, выполняемых программами за такт (IPC - INsTRuctions Per Cycle). Так, для МП Alpha 21264 этот показатель равен 6, столько же микроопераций за такт может выдать Pentium 4. Но это предельные значения, а реальные программные коды, в частности, из-за различных взаимозависимостей, дают гораздо более низкое значение IPC. Дальнейшее увеличение числа исполнительных устройств ведет к усложнению расположенного в БИС устройства управления, распределяющего команды по конвейерам, а также к сложным взаимозависимостям между данными. К тому же реальные коды программ не позволяют обеспечить эффективную загрузку всех имеющихся в МП исполнительных устройств, что приводит к их простоям. Следует отметить также, что рост производительности микропроцессора не является прямо пропорциональным росту количества конвейеров, а обычно существенно ниже.

В настоящее время для повышения производительности микропроцессоров используется ряд новых подходов, представленные в таблице 2.
Таблица 2. Основные направления повышения производительности МП

Направление повышения производительности

Принцип

Класс решаемых задач

Примеры

CMP (Chip Multi ProcessINg)

Создание на одном кристалле системы из нескольких микропроцессоров (многоядерность);

Мультимедийные задачи- обработка видеозаписей, работы с большими базами данных, одновременное выполнение нескольких ресурсоемких заданий, например, компьютерной игры, записи DVD и загрузки файлов из Интернета.

1.Компания Tilera ( 2007) - процессор Tile64 - 64 ядра. В 2010 году 120-ядерная модификация процессора Tile. 2. 80-ядерный процессор от фирмы INTel

SMT (Simultaneous MultiThreadINg)

Многонитевая архитектура;

Распараллеливание процессов, выполняемых задач, в целях разгрузки МП

Sun Microsystems - процессор ULTRaSPARC T2 (Тактовая частота от 900 МГц до 1,4 ГГц).

EPIC (Explicitly Parallel INsTRuction ComputINg)

Вычисления с явным параллелизмом в командах

Распараллеливание алгоритма между исполнительными модулями производится компилятором на этапе создания машинного кода, когда команды объединяются в связки и не конкурируют между собой за ресурсы микропроцессора.

Микропроцессор Itanium фирмы Intel.


Рассмотрим эти направления подробнее.

Направление CMP обеспечивается возросшими технологическими возможностями, которые позволяют создать на одном кристалле несколько микропроцессоров и организовать их работу по принципу мультипроцессорных систем [4].

Производители чипов уже не гонятся за частотой, сместив акцент на многоядерную архитектуру, которая позволяет наращивать производительность, сохраняя в приемлемых границах энергопотребление и тепловыделение.

При таком подходе задача повышения производительности работы отдельных приложений требует распараллеливания последних, то есть проблема перемещается с аппаратного на программный уровень. На данный момент сложности заключаются в том, что большая часть существующего программного обеспечения создавалась без расчета на использование в многоядерных и многопроцессорных конфигурациях. Другими словами, прогресс в области аппаратных средств на какое-то время опередил прогресс в области программного обеспечения.

-ядерный процессор от фирмы INTel Polaris

Микропроцессор построен по технологии 65 нм из 100 млн транзисторов на кристалле площадью 275 мм2. Для сравнения: двухъядерный Intel Core 2 ExTReme, также с технологическими нормами 65 нм, содержит 291 млн транзисторов на площади 143 мм2. Разница обусловлена малым количеством памяти на кристалле нового МП и доминированием логических схем и схем ввода-вывода, размер которых трудно минимизировать. Большое внимание в нем уделено новому показателю, который занимает все более главенствующее положение, - производительность/ватт. По этому показателю Polaris обеспечивает чрезвычайную энергоэффективность: 16 гигафлопс/Вт. Процессор работает при напряжении питания 0,95 В.

Согласно заявлению представителей Intel, достигнутые показатели отнюдь не являются предельными. Инженеры компании могут значительно увеличить производительность процессора за счет увеличения его тактовой частоты. Так, например, на частоте 5,1 ГГц процессор демонстрирует 1,63 терафлопс, а на частоте 5,7 ГГц - 1,81 терафлопс. Однако с ростом тактовой частоты растет и потребляемая мощность, составляя при вышеуказанных режимах работы 175 и 265 ватт соответственно.представляет собой 80 одинаковых процессорных элементов, каждый из которых состоит из вычислителя и маршрутизатора на 6 портов. Вычислитель содержит 2 устройства для операций умножения с накоплением (FP MultIPle-Accumulator, FPMAC), 3 Кбайт памяти команд и 2Кбайт памяти данных, набор 32-разрядных регистров и оперирует 96-разрядными сверхдлинными словами команд (Very Long INsTRuction Word -VLIW). Планирование и параллельное выполнение команд возлагается на компилятор (архитектура EPIC, аналогичная реализованной разработчиками Intel и в процессоре Itanium). Она позволяет процессору исполнять до восьми команд за один такт. По своему набору инструкций новый микропроцессор несовместим с x86.

Эффективность многоядерных процессоров во многом определяется пропускной способностью памяти системы. Применение многоканальных шин памяти и повышение их частоты сопряжено с чрезмерным усложнением контроллеров. Другой путь уменьшения задержки - ввести еще один уровень иерархии кэш-памяти. Однако это приведет к неоправданному увеличению памяти на кристалле, площадь которого эффективнее использовать для вычислительной логики. Несколько мегабайт дополнительной кэш-памяти занимают площадь, достаточную для 10 процессорных ядер. Такой подход обеспечит широкий доступ ядер процессора к памяти. Каждый слой будет содержать до 256 Мбайт.

Другой фактор, ограничивающий производительность современных компьютеров, - пропускная способность процессорной шины. Разделяемые шины уже уступают свое место соединениям типа «точка-точка».

Направление SMT в развитии архитектуры микропроцессоров базируется на том, что одна задача не в состоянии полностью загрузить все возрастающие ресурсы микропроцессора. Поэтому на одном процессоре осуществляется запуск нескольких задач одновременно, при этом распараллеливание программ осуществляется аппаратными средствами МП [4].

Это позволяет более равномерно загрузить ресурсы процессора. Параллельно в разных устройствах МП могут выполняться команды из разных задач. Так, микропроцессор Alpha 21264 поддерживает выполнение до 4 задач одновременно. При поддержке SMT на 4 нити каждый процессор с точки зрения операционной системы выглядит как 4 логических процессора. Исследования показали, что SMT позволяет увеличить производительность данного процессора до двух раз, а дополнительные схемы управления занимают всего около 10 % площади кристалла.

Направление EPIC фактически использует известную технологию VLIW (Very Large INsTRuction Word) - очень длинного командного слова [3].

Особенности архитектуры EPIC [4]:

Явный параллелизм в машинном коде. Поиск зависимостей между командами проводит не процессор, а компилятор.

Большое количество регистров.

Масштабируемость архитектуры до большого количества функциональных устройств (АЛУ, FPU, MMX, SSE и т. п.).

Применение предикатов. Предикатный подход исходит из предпосылки, что возросшие мощности микропроцессоров позволяют запускать параллельно команды из разных ветвей условного ветвления вместо того, чтобы ожидать формирования истинных признаков для выбора правильного направления или полагаться на блок предсказания переходов, рискуя прийти к необходимости перезагрузки достаточно длинных конвейеров в случае неудачного предсказания. При этом каждая команда снабжается специальным полем условия (предикатом) (рис. 5) [3]. По мере определения истинных признаков ветвления те команды, предикаты которых указывали, что они выбраны из другой ветви, снимаются с обработки в конвейере. Результаты команд не записываются в приемник до определения правильности направления перехода.


Рис. 5. Предикатное исполнение команд
Отметим основные достоинства этого подхода:

Упрощается архитектура процессора. Вместо логики распараллеливания на EPIC-процессоре можно разместить больше регистров, функциональных устройств и т. п.

Процессор не тратит время на анализ потока команд.

Возможности процессора по анализу программы во время выполнения ограничены сравнительно небольшим участком программы, тогда как компилятор способен произвести анализ всей программы.

Если некоторая программа должна запускаться многократно (а именно так и бывает в подавляющем большинстве случаев), выгоднее распараллелить ее один раз при компиляции, а не тратить на это время каждый раз, когда она исполняется на процессоре.

Однако архитектуре EPIC присущ и ряд недостатков:

Компилятор производит статический анализ программы, раз и навсегда планируя вычисления. Однако даже при небольших изменениях исходных данных путь выполнения программы существенно изменяется.

Значительно усложняются компиляторы, следовательно, увеличиваются время компиляции программы и число ошибок в самих компиляторах. Если первый фактор, учитывая высокое быстродействие современных компьютеров, не очень существенен, то на второй следует обратить определенное внимание. Исследования показывают, что к моменту поставки даже ответственного программного обеспечения в нем содержится примерно 1 ошибка на 10 000 строк исходного кода. Следовательно, программа из 500 тыс. строк будет содержать около 50 ошибок, как бы хорошо ни работали тестировщики. И эти ошибки могут проявиться самым неожиданным образом.

Производительность микропроцессора во многом определяется качеством компилятора. Правда, здесь необходимо четко определить, что понимается под производительностью, ведь количество операций, выполняемых микропроцессором в единицу времени, от компилятора не зависит. Но это тема будет особо рассмотрена далее.

Увеличивается сложность отладки, так как отлаживается не исходная программа, а оптимизированный параллельный код. Программисту тяжело определить место и причину появления ошибки, так как в процессе трансляции исходной программы ее отдельные команды будут переставлены компилятором для обеспечения оптимальности работы микропроцессора.


ЗАКЛЮЧЕНИЕ
Анализ новых решений построения структуры компьютера показывает, что процессор, память, устройства ввода - вывода составляют основу любого компьютера. Современный компьютер можно представить в большинстве случаев упрощенной структурной схемой, где выделены центральная и периферийная части. К центральной части относятся процессор и внутренняя память, к периферийной части - устройства ввода-вывода и внешняя память.

В курсовой работе даны определения микропроцессора и микропроцессорной системы, принципы и устройства микропроцессора. Приведена классификация микропроцессоров по их архитектуре, представлены параметры, которые характеризуют микропроцессоры каждого класса как вычислительное устройство и как электронное изделие. Описаны структура и основные блоки микропроцессора i486, являющегося базовым микропроцессором для этой архитектуры. В работе также были рассмотрены классические направления повышения производительности микропроцессоров, показаны их ограничения. Представлены современные пути развития универсальных микропроцессоров.

Будущее микропроцессорной техники связано сегодня с двумя новыми направлениями - нанотехнологиями и квантовыми вычислительными системами. Эти теоретические исследования касаются использования в качестве компонентов логических схем молекул и даже субатомных частиц: основой для вычислений должны служить не электрические цепи, как сейчас, а положение отдельных атомов или направление вращения электронов. Если "микроскопические" компьютеры будут созданы, то они обойдут современные машины по многим параметрам.

Таким образом, поставленные задачи решены, цель достигнута.





Список использованных источников



1. Богданов А.В., Корхов В.В., Мареев В.В., Станкова Е.Н.Архитектуры и топологии многопроцессорных вычислительных систем.- М.: БИНОМ. Лаборатория знаний, 2004. - 176 с.:ил.

2. Горюнов А.Г. Ливенцов С.Н. Микропроцессоры: Учеб. пособие. - Томск: Изд-во ТПУ, 2005. - 89 с.

. Гуров В.В. Архитектура микропроцессоров. - М.: БИНОМ. Лаборатория знаний, 2010. - 273 с.:ил.

. Гуров В.В. Компоненты и архитектура компьютеров: конспект лекций, 2008.- 104 с.

. Информатика: Базовый курс / С. В. Симонович и др. - СПб.: Питер, 2003. - 640 с.: ил.

. Микропроцессоры: В 3-х кн. / Под ред. Преснухина. М.: Высшая школа, 1986. Кн.1. 495 с. Кн. 2. 383 с. Кн. 3. 351 с.

. Нестеров П. В. Микропроцессоры.- М.: Высшая школа, 1984. -104 с.

. Новиков Ю.В. , Скоробогатов П.К. Основы микропроцессорной техники. - М.: БИНОМ. Лаборатория знаний, 2008. - 368 с.:ил.

. Новиков Ю.В. Введение в цифровую схемотехнику.- М.: БИНОМ. Лаборатория знаний, 2006. - 344 с.:ил.

. Таненбаум Э. Архитектура компьютера. 5-е изд. (+CD). - СПб.: Питер, 2007. - 844 с: ил.
1   2   3   4   5


написать администратору сайта