Главная страница
Навигация по странице:

  • Суперскалярные процессоры

  • длинным командным словом (VLIW

  • ЛЕКЦИЯ 9 Процессор: устройство и принцип работы.

  • Этапы цикла выполнения

  • ЛЕКЦИЯ 10 Основные принципы построения оперативной памяти. Иерархическая организация памяти. Стратегии управления памятью. Принципы работы кэш- памяти.

  • Иерархия памяти ЭВМ.

  • Конспект лекций архитектура аппаратных средств. 10.-Конспекты-лекций.-ОП.02-Арх-итектура-аппаратных-средств.-09.. Конспекты лекций по дисциплине


    Скачать 0.6 Mb.
    НазваниеКонспекты лекций по дисциплине
    АнкорКонспект лекций архитектура аппаратных средств
    Дата23.08.2022
    Размер0.6 Mb.
    Формат файлаpdf
    Имя файла10.-Конспекты-лекций.-ОП.02-Арх-итектура-аппаратных-средств.-09..pdf
    ТипКонспект
    #651101
    страница5 из 7
    1   2   3   4   5   6   7
    RISC - Reduced Instruction Set Computer – архитектура компьютера с сокращенным набором команд. RISC-архитектура предполагает реализацию в ЭВМ сокращенного набора простейших, но часто употребляемых команд, что позволяет упростить аппаратурные средства процессора и благодаря этому получить возможность повысить его быстродействие.
    Современные процессоры типа RISC характеризуются следующими особенностями:
    1. упрощенный набор команд, имеющих одинаковую длину.
    2.
    Отсутствуют макрокоманды, усложняющие структуру процессора и уменьшающую скорость его работы.
    3.
    Взаимодействие с оперативной памятью ограничивается операциями пересылки данных.
    4.
    Уменьшено число способов адресации
    5.
    Используется конвейер команд.
    6.
    Применяется высокоскоростная память.
    Новый подход к архитектуре команд процессора значительно сократил площадь, требуемой для него на кристалле интегральной микросхемы. Это позволило резко увеличить число регистров (более 100 по лекциям, а вообще в типовых RISC-процессорах реализуются 32 или большее число регистров по сравнению с 8 - 16 регистрами в CISC- архитектурах). В результате процессор стал на 20-30% реже обращаться к оперативной памяти. Упростилась топология процессора, сократились сроки ее разработки, она стала дешевле.
    Особенностью RISC архитектуры является механизм перекрывающихся окон, предназначенный для уменьшения числа обращений к оперативной памяти и межрегистровых передач, что способствует увеличению производительности ЭВМ.

    Наиболее широко используемые в настольных компьютерах процессоры архитектуры x86 ранее являлись CISC-процессорами, однако новые процессоры, начиная с Intel 486DX, являются CISC-процессорами с RISC-ядром. Они непосредственно перед исполнением преобразуют CISC-инструкции x86-процессоров в более простой набор внутренних инструкций RISC.
    Суперскалярные процессоры – дальнейшее развитие конвейеризации. Их отличительной особенностью является возможность выполнения нескольких команд за один процессорный цикл.
    Архитектура их вычислительного ядра используюет несколько декодеров команд, которые могут нагружать работой множество исполнительных блоков. Если в процессе работы команды, обрабатываемые конвейером, не противоречат друг другу, и одна не зависит от результата другой, то такое устройство может осуществить параллельное выполнение команд. В суперскалярных системах формирование расписания управления команд возлагается на микропроцессор, что требует много ресурсов.
    При описании архитектуры суперскалярного процессора часто используется модель окна исполнения. При исполнении программы микропроцессор как бы продвигает по статической структуре программы окно исполнения. Команды в окне исполнения могут исполняться параллельно, если между ними нет зависимости. Для устранения зависимостей, вызванных командами перехода, используется метод
    предсказания.
    VLIW – появилась в России. Она не попадает под принципы фон Неймана
    (нарушает принцип программного управления, т.е. последовательного выполнения команд).
    Архитектура ЭВМ с длинным командным словом (VLIW – Very Long Instruction
    Word) позволяет сократить объем оборудования, требуемого для реализации параллельной выдачи несколько команд, базируется на множестве независимых командных устройств. Вместо того чтобы выдавать на эти устройства последовательные команды, операции упаковываются в одну очень длинную команду. Ответственность за вывод параллельно выдаваемых для выполнения команд полностью ложится на компилятор.
    В процессорах VLIW задача решается распределения работы между вычислительными модулями во время компиляции. Аппаратные средства, необходимые для реализации параллельной обработки, отсутствуют.
    Для машин с VLIW-архитектурой был разработан новый метод планирования выдачи команд – трассировочное планирование. Во время планирования генерируется длинное командное слово. Процесс упаковки команд последовательной программы в длинные командные слова продолжается до тех пор, пока не будет оптимизирована вся программа.
    Примеры процессоров на этой архитектуре – Intel Itanium (архитектура IA-64,
    Merced), микропроцессоры серии «Эльбрус» («Эльбрус 2000», «Эльбрус S»).
    MISC, minimal instruction set computer — минимальный набор команд компьютера.
    Увеличение разрядности процессоров привело к идее укладки нескольких команд в одно большое слово (связку, bound). Это позволило использовать возросшую производительность компьютера и его возможность обрабатывать одновременно несколько потоков данных. Кроме этого, MISC использует стековую модель вычислений.
    Процессоры, образующие «компьютеры с минимальным набором команд» (MISC), как и процессоры RISC, характеризуются небольшим числом чаще всего встречающихся команд. Вместе с этим, принцип «очень длинных командных слов» (VLIW) обеспечивает выполнение группы непротиворечивых команд за один цикл работы процессора. Порядок выполнения команд распределяется таким образом, чтобы в максимальной степени загрузить маршруты, по которым проходят потоки данных. Таким образом архитектура

    MISC объединила вместе суперскалярную и VLIW-концепции. Компоненты процессора просты и работают на высоких частотах.
    Контрольные вопросы:
    1.
    Для чего используется АЛУ?
    2.
    Назовите основные блоки процессора?
    3.
    Что такое CISC?
    4.
    Что такое RISK?
    5.
    Что такое MISC?
    ЛЕКЦИЯ 9
    Процессор: устройство и принцип работы.
    План лекции:
    1
    История
    2
    Архитектура фон Неймана
    2.1
    Конвейерная архитектура
    2.2
    Суперскалярная архитектура
    2.3
    CISC-процессоры
    2.4
    RISC-процессоры
    2.5
    MISC-процессоры
    2.6
    VLIW-процессоры
    2.7
    Многоядерные процессоры
    Системы команд и классы процессоров: СISC, RISC, MISC, VLIM.
    Изначально термин центральное процессорное устройство описывал специализированный класс логических машин, предназначенных для выполнения сложных компьютерных программ. Вследствие довольно точного соответствия этого назначения функциям существовавших в то время компьютерных процессоров он естественным образом был перенесён на сами компьютеры. Начало применения термина и его аббревиатуры по отношению к компьютерным системам было положено в 1960-е годы. Устройство, архитектура и реализация процессоров с тех пор неоднократно менялись, однако их основные исполняемые функции остались теми же, что и прежде.
    Главными характеристиками
    ЦПУ являются: тактовая частота, производительность, энергопотребление, нормы литографического процесса, используемого при производстве (для микропроцессоров), и архитектура.
    Ранние ЦП создавались в виде уникальных составных частей для уникальных и даже единственных в своём роде компьютерных систем. Позднее от дорогостоящего способа разработки процессоров, предназначенных для выполнения одной единственной или нескольких узкоспециализированных программ, производители компьютеров перешли к серийному изготовлению типовых классов многоцелевых процессорных устройств. Тенденция к стандартизации компьютерных комплектующих зародилась в эпоху бурного развития полупроводниковых элементов, мейнфреймов и мини- компьютеров, а с появлением интегральных схем она стала ещё более популярной.
    Создание микросхем позволило ещё больше увеличить сложность ЦП с одновременным уменьшением их физических размеров. Стандартизация и миниатюризация процессоров привели к глубокому проникновению основанных на них цифровых устройств в повседневную жизнь человека. Современные процессоры можно найти не только в таких высокотехнологичных устройствах, как компьютеры, но и в автомобилях, калькуляторах,
    мобильных телефонах и даже в детских игрушках. Чаще всего они представлены микроконтроллерами, где, помимо вычислительного устройства, на кристалле расположены дополнительные компоненты (память программ и данных, интерфейсы, порты ввода-вывода, таймеры и др.). Современные вычислительные возможности микроконтроллера сравнимы с процессорами персональных ЭВМ десятилетней давности, а чаще даже значительно превосходят их показатели.
    Архитектура фон Неймана
    Основная статья: Архитектура фон Неймана
    Большинство современных процессоров для персональных компьютеров в общем основано на той или иной версии циклического процесса последовательной обработки данных, изобретённого Джоном фон Нейманом.
    Дж. фон Нейман придумал схему постройки компьютера в 1946 году.
    Отличительной особенностью архитектуры фон Неймана является то, что инструкции и данные хранятся в одной и той же памяти.
    В различных архитектурах и для различных команд могут потребоваться дополнительные этапы. Например, для арифметических команд могут потребоваться дополнительные обращения к памяти, во время которых производится считывание операндов и запись результатов.
    Этапы цикла выполнения:
    Процессор выставляет число, хранящееся в регистре счётчика команд, на шину адреса и отдаёт памяти команду чтения.
    Выставленное число является для памяти адресом; память, получив адрес и команду чтения, выставляет содержимое, хранящееся по этому адресу, на шину данных и сообщает о готовности.
    Процессор получает число с шины данных, интерпретирует его как команду
    (машинную инструкцию) из своей системы команд и исполняет её.
    Если последняя команда не является командой перехода, процессор увеличивает на единицу (в предположении, что длина каждой команды равна единице) число, хранящееся в счётчике команд; в результате там образуется адрес следующей команды.
    Данный цикл выполняется неизменно, и именно он называется процессом (откуда и произошло название устройства).
    Во время процесса процессор считывает последовательность команд, содержащихся в памяти, и исполняет их. Такая последовательность команд называется программой и представляет алгоритм работы процессора. Очерёдность считывания команд изменяется в случае, если процессор считывает команду перехода, — тогда адрес следующей команды может оказаться другим. Другим примером изменения процесса может служить случай получения команды останова или переключение в режим обработки прерывания.
    Команды центрального процессора являются самым нижним уровнем управления компьютером, поэтому выполнение каждой команды неизбежно и безусловно. Не производится никакой проверки на допустимость выполняемых действий, в частности, не проверяется возможная потеря ценных данных. Чтобы компьютер выполнял только допустимые действия, команды должны быть соответствующим образом организованы в виде необходимой программы.
    Скорость перехода от одного этапа цикла к другому определяется тактовым генератором. Тактовый генератор вырабатывает импульсы, служащие ритмом для центрального процессора. Частота тактовых импульсов называется тактовой частотой.

    Конвейерная архитектура
    Основная статья: Вычислительный конвейер
    Конвейерная архитектура (англ. pipelining) была введена в центральный процессор с целью повышения быстродействия. Обычно для выполнения каждой команды требуется осуществить некоторое количество однотипных операций, например: выборка команды из
    ОЗУ, дешифровка команды, адресация операнда в ОЗУ, выборка операнда из ОЗУ, выполнение команды, запись результата в ОЗУ. Каждую из этих операций сопоставляют одной ступени конвейера. Например, конвейер микропроцессора с архитектурой MIPS-I содержит четыре стадии: получение и декодирование инструкции, адресация и выборка операнда из ОЗУ, выполнение арифметических операций, сохранение результата операции.
    После освобождения {\displaystyle k}k-й ступени конвейера она сразу приступает к работе над следующей командой. Если предположить, что каждая ступень конвейера тратит единицу времени на свою работу, то выполнение команды на конвейере длиной в
    {\displaystyle n}n ступеней займёт {\displaystyle n}n единиц времени, однако в самом оптимистичном случае результат выполнения каждой следующей команды будет получаться через каждую единицу времени.
    Действительно, при отсутствии конвейера выполнение команды займёт
    {\displaystyle n}n единиц времени (так как для выполнения команды по-прежнему необходимо выполнять выборку, дешифровку и т. д.), и для исполнения {\displaystyle m}m команд понадобится {\displaystyle n\cdot m}n\cdot m единиц времени; при использовании конвейера (в самом оптимистичном случае) для выполнения {\displaystyle m}m команд понадобится всего лишь {\displaystyle n+m}n+m единиц времени.
    Факторы, снижающие эффективность конвейера:
    Простой конвейера, когда некоторые ступени не используются (например, адресация и выборка операнда из ОЗУ не нужны, если команда работает с регистрами).
    Ожидание: если следующая команда использует результат предыдущей, то последняя не может начать выполняться до выполнения первой (это преодолевается при использовании внеочередного выполнения команд — out-of-order execution).
    Очистка конвейера при попадании в него команды перехода (эту проблему удаётся сгладить, используя предсказание переходов).
    Некоторые современные процессоры имеют более 30 ступеней в конвейере, что повышает производительность процессора, но, однако, приводит к увеличению длительности простоя (например, в случае ошибки в предсказании условного перехода).
    Не существует единого мнения по поводу оптимальной длины конвейера: различные программы могут иметь существенно различные требования.
    Суперскалярная архитектура
    Основная статья: Суперскалярность
    Способность выполнения нескольких машинных инструкций за один такт процессора путём увеличения числа исполнительных устройств. Появление этой технологии привело к существенному увеличению производительности, в то же время существует определённый предел роста числа исполнительных устройств, при превышении которого производительность практически перестает расти, а
    исполнительные устройства простаивают. Частичным решением этой проблемы является, например, технология Hyper-threading.
    CISC-процессоры
    Основная статья: CISC
    Complex instruction set computer — вычисления со сложным набором команд.
    Процессорная архитектура, основанная на усложнённом наборе команд. Типичными представителями CISC являются микропроцессоры семейства x86 (хотя уже много лет эти процессоры являются CISC только по внешней системе команд: в начале процесса исполнения сложные команды разбиваются на более простые микрооперации (МОП), исполняемые RISC-ядром).
    RISC-процессоры
    Основная статья: RISC
    Reduced instruction set computer — вычисления с упрощённым набором команд (в литературе слово reduced нередко ошибочно переводят как «сокращённый»). Архитектура процессоров, построенная на основе упрощённого набора команд, характеризуется наличием команд фиксированной длины, большого количества регистров, операций типа регистр-регистр, а также отсутствием косвенной адресации. Концепция RISC разработана
    Джоном Коком из IBM Research, название придумано Дэвидом Паттерсоном (David
    Patterson).
    Упрощение набора команд призвано сократить конвейер, что позволяет избежать задержек на операциях условных и безусловных переходов. Однородный набор регистров упрощает работу компилятора при оптимизации исполняемого программного кода. Кроме того, RISC-процессоры отличаются меньшим энергопотреблением и тепловыделением.
    Среди первых реализаций этой архитектуры были процессоры MIPS, PowerPC,
    SPARC, Alpha, PA-RISC. В мобильных устройствах широко используются ARM- процессоры.
    MISC-процессоры
    Основная статья: MISC
    Minimum instruction set computer — вычисления с минимальным набором команд.
    Дальнейшее развитие идей команды Чака Мура, который полагает, что принцип простоты, изначальный для RISC-процессоров, слишком быстро отошёл на задний план. В пылу борьбы за максимальное быстродействие, RISC догнал и обогнал многие CISC- процессоры по сложности. Архитектура MISC строится на стековой вычислительной модели с ограниченным числом команд (примерно 20—30 команд).
    VLIW-процессоры
    Основная статья: VLIW
    Very long instruction word — сверхдлинное командное слово. Архитектура процессоров с явно выраженным параллелизмом вычислений, заложенным в систему команд процессора. Являются основой для архитектуры EPIC. Ключевым отличием от суперскалярных CISC-процессоров является то, что для них загрузкой исполнительных устройств занимается часть процессора (планировщик), на что отводится достаточно малое время, в то время как загрузкой вычислительных устройств для VLIW-процессора занимается компилятор, на что отводится существенно больше времени (качество загрузки и, соответственно, производительность теоретически должны быть выше).
    Например, Intel Itanium, Transmeta Crusoe, Efficeon и Эльбрус.

    Многоядерные процессоры
    Основная статья: Многоядерный процессор
    Содержат несколько процессорных ядер в одном корпусе (на одном или нескольких кристаллах).
    Процессоры, предназначенные для работы одной копии операционной системы на нескольких ядрах, представляют собой высокоинтегрированную реализацию мультипроцессорности.
    Контрольные вопросы:
    1. Какие предпосылки превели к созданию микропроцессоров?
    2. Что такое «Архитектура фон Неймана»?
    3. Поясните принцип работы конвейерной архитектуры;
    4.
    Поясните принцип работы суперскалярной архитектуры
    5. В чём различие между CISC, RISC, VLIW-процессорами?
    ЛЕКЦИЯ 10
    Основные принципы построения оперативной памяти. Иерархическая
    организация памяти. Стратегии управления памятью. Принципы работы кэш-
    памяти.
    План.
    1. Контрольный опрос
    2. Иерархическая организация памяти
    3. Стратегии управления памятью
    4. Принципы работы кэш-памяти
    Иерархия памяти ЭВМ.Память ЭВМ должна иметь большую информационную емкость V, малое время обращения t (высокое быстродействие), высокую надежность и низкую стоимость. Но с увеличением емкости снижается быстродействие и растет стоимость. Деление памяти на ОЗУ и ВЗУ не снимает это противоречие полностью, так как различие в быстродействии процессора, ОЗУ и ВЗУ очень велико. Поэтому обмен информацией производится через дополнительные буферные устройства, то есть память
    ЭВМ имеет иерархическую многоуровневую структуру. Чем больше быстродействие ЗУ, тем выше стоимость хранения 1 байта, тем меньшую емкость имеет ЗУ.
    Иерархия памяти ЭВМ:
    · регистры микропроцессорной памяти, а также кэш-память первого и второго уровня t=10-9-10-6 t=10-9-10-6 с, V=102-104 бит);
    · внутренняя память ПЗУ, ОЗУ t=10-6-10-3 t=10-6-10-3 с, V=10-4-107 бит);
    · внешняя память (t=10-3-1 с, V=107-109 бит);
    · массовая или архивная память (t=1-10 с, V=109-1010 V=109-1010 бит).
    Эта система запоминающих устройств работает как единое ЗУ с большой емкостью
    (за счет внешних ЗУ) и высоким быстродействием (за счет внутренних ЗУ).
    Микропроцессорная память -- высокоскоростная память небольшой емкости, входящая в МП и используемая АЛУ для хранения операндов и промежуточных результатов вычислений. КЭШ-память -- это буферная, не доступная для пользователя память, автоматически используемая компьютером для ускорения операций с информацией, хранящейся в медленно действующих запоминающих устройствах. Для ускорения операций с основной памятью организуется регистровая КЭШ-память внутри микропроцессора (КЭШ-память первого уровня) или вне микропроцессора на материнской плате (КЭШ-память второго уровня); для ускорения операций с дисковой памятью организуется КЭШ-память на ячейках электронной памяти.

    Внутренняя память состоит из ПЗУ (ROM -- Read Only Memory) и ОЗУ (RAM --
    Random Access Memory -- память с произвольным доступом). ПЗУ состоит из установленных на материнской плате микросхем и используется для хранения неизменяемой информации: загрузочных программ операционной системы (ОС), программ тестирования устройств компьютера и некоторых драйверов базовой системы ввода-вывода (BIOS -- Base Input-Output System) и др. Из ПЗУ можно только считывать информацию, емкость ПЗУ -- сотни Кбайт. Это энергонезависимая память, -- при отключении ЭВМ информация сохраняется.
    Внешняя память относится к внешним устройствам ЭВМ и используется для долговременного хранения любой информации, которая может потребоваться. В ВЗУ хранится программное обеспечение ЭВМ. Внешняя память: НЖМД и ЖМД, НГМД и
    ГМД (магнитный диск), стример (НМЛ -- накопитель на магнитной ленте), оптические накопители для CD-ROM и DVD-дисков.
    Информационная структура внешней памяти -- файловая. Наименьшей именуемой единицей является файл, -- наименованная совокупность однородных данных.
    Информация в файле состоит из битов и байтов, но они не имеют адресов, так как носитель (магнитный диск) не дискретный.
    1   2   3   4   5   6   7


    написать администратору сайта