Мухамятжанов курсовой проект. Обнаружение дефектов видео карты gtx 1080
Скачать 3.68 Mb.
|
Департамент образования и науки города Москвы
Кафедра: Информационных коммуникационных технологий и сервисов Пояснительная записка к курсовой работе на тему ОБНАРУЖЕНИЕ ДЕФЕКТОВ ВИДЕО КАРТЫ GTX 1080
Москва 2022 СОДЕРЖАНИЕ ВВЕДЕНИЕ Видеокарта — устройство, преобразующее графический образ, хранящийся как содержимое памяти компьютера (или самого адаптера), в форму, пригодную для дальнейшего вывода на экран монитора. Обычно видеокарта выполнена в виде печатной платы (плата расширения) и вставляется в слот расширения материнской платы, универсальный либо специализированный (AGP, PCI Express). Также широко распространены и расположенные на системной плате видеокарты — как в виде дискретного отдельного чипа GPU, так и в качестве составляющей части северного моста чипсета или ЦПУ; в случае ЦПУ, встроенный (интегрированный) GPU, строго говоря, не может быть назван видеокартой. Видеокарты не ограничиваются простым выводом изображения, они имеют встроенный графический процессор, который может производить дополнительную обработку, снимая эту задачу с центрального процессора компьютера. Например, видеокарты Nvidia и AMD (ATi) осуществляют рендеринг графического конвейера OpenGL и DirectX и Vulkan на аппаратном уровне. Также имеет место тенденция использовать вычислительные возможности графического процессора для решения неграфических задач (например, добычи криптовалюты). Майнинг на видеокарте — это процесс добычи криптовалюты с помощью графических процессоров (GPU). Для майнинга криптовалют используют видеокарты взамен процессоров, т.к они осуществляют обработку большего количества информации за меньшее время. К их единственному недостатку относится большое потребление электроэнергии, но высокая отдача легко компенсирует подобную слабость. Для майнинга используются полноценные дискретные видеокарты, интегрированные в процессор чипы не используются. В сети также встречаются статьи про майнинг на внешней видеокарте, но это также работает не во всех случаях и является не лучшим решением Также правильная и полнофункциональная работа графического адаптера обеспечивается с помощью видеодрайвера — специального программного обеспечения, поставляемого производителем видеокарты и загружаемого в процессе запуска операционной системы. Видеодрайвер выполняет функции интерфейса между системой с запущенными в ней приложениями и видеоадаптером. Так же, как и видео-BIOS, видеодрайвер организует и программно контролирует работу всех частей видеоадаптера через специальные регистры управления, доступ к которым происходит через соответствующую шину. Драйвер устройства обычно поддерживает одну или несколько карт, и должен быть написан специально для определённой операционной системы (ОС). Большинство устройств требуют проприетарных драйверов для использования всей функциональности, эти драйвера для популярных ОС обычно поставляются с устройством и часто доступны для бесплатного скачивания с сайта производителя. Разрабатывается несколько драйверов видеокарт с открытым исходным кодом, но многие из них могут использовать лишь основную функциональность карт. 1 ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ Если быть более точным, то GeForce GTX 1070 и GeForce GTX 1080 (РИС.1) — это субфлагманы тысячного поколения. «Зеленые» верны своим традициям. Компания и ранее выпускала видеокарты, которые на определенном промежутке времени считались самыми быстрыми, но спустя некоторое время в рамках одной линейки уходили на второй план. Например, парочку GeForce GTX 770/780 впоследствии сменили на пьедестале более быстрые версии GeForce GTX 780 Ti/TITAN. Почти два года назад вышли в продажу GeForce GTX 970/980, но затем свет увидели по-настоящему топовые Maxwell-решения — GeForce GTX 980 Ti/TITAN X. Кому-то подобный цикл не нравится, ведь хочется получить все и сразу, но есть неоспоримый факт: GeForce GTX 1080 на данный момент времени — это самая быстрая одночиповая игровая видеокарта NVIDIA В первой части обзора я рассмотрю основные особенности графического процессора GP104, а также архитектуры Pascal в целом. И изучу работу эталонной версии GeForce GTX 1080 Founders Edition. Рисунок 1.1 - NVIDIA GeForce GTX 1080 Founders Edition Процессор GP104, архитектура Pascal и память GDDR5X Если описать архитектуру Pascal одной фразой, то получится следующее: доработка Maxwell плюс переход на 16-нанометровый техпроцесс. Действительно, если отбросить использование FinFET, никаких радикальных новшеств, смены вектора развития или чего-нибудь еще разработка NVIDIA не предлагает. Однако процессор GP104, используемый в GeForce GTX 1080, заметно быстрее субфлагмана прошлого поколения — GM204 (GeForce GTX 980). Взгляните хотя бы на пиковую вычислительную мощность. Далеко не самый производительный Pascal-чип почти вдвое быстрее решения Maxwell. Если судить по количеству ГФЛОПС, то GP104 вообще нет равных среди игровых видеокарт, так как у процессора GM200, используемого в GeForce GTX TITAN X, всего 6144 ГФЛОПС. Таблица 1.1 – Характеристики процессоров GP104 и GM204
Переход на новый техпроцесс заметно уменьшил полезную площадь кристалла, но при этом серьезно увеличил транзисторный бюджет GPU. Легко подсчитать: на каждый квадратный миллиметр GP104 (рис.2) приходится 23 миллиона затворов FinFET, а у GM204 только 13 миллионов. GeForce GTX 1080 — это первая видеокарта, в которой используется процессор с трехмерными транзисторами, но не планарными. Очевидно, что 7,2 млрд не являются пределом для контрактного производителя NVIDIA — компании TSMC. Вторым положительным эффектом при переходе на 16-нанометровую технологию производства, безусловно, стало гигантское увеличение тактовой частоты. Один лишь буст по ядру в размере 481 МГц дает приличный прирост быстродействия. А ведь по сравнению с GM204 в GP104 серьезно прибавилось CUDA-ядер и текстурных блоков. Третий плюс 16 нанометров — низкое энергопотребление. GeForce GTX 1080 почти вдвое мощнее GeForce GTX 980 в плане вычислений, но требует при этом всего на 15 Вт больше. Рисунок 1.1.1 - Графический процессор GP104 Построение основных элементов у GP104 такое же, как у GM204. Есть основной элемент — потоковый мультипроцессор SM. Несколько таких блоков объединяются в крупную вычислительную ячейку — кластер процессорной графики GPC. У Maxwell в одном GPC содержится четыре SM, у Pascal — пять. Таким образом, NVIDIA продолжает дробить блоки, увеличивая как численное количество вычислительных элементов (CUDA-ядер и текстурных блоков), так и параллелизм. Если учесть, что в каждый SM входит 128 CUDA и 8 текстурных блоков, то разница получается ощутимая: 2560 ядер против 2048 и 160 TMU против 128 TMU. Накладываем на все это разницу в частоте (481 МГц) — вот и получается практически двукратное превосходство GP104 в вычислительной мощности над GM204. Все логично. Количество блоков растеризации осталось неизменным — 64 единицы на весь процессор. И это, пожалуй, самое слабое место GP104. У GM200 таких элементов 96, что может сказаться на быстродействии в разрешении Ultra HD в некоторых играх. В более низких Full HD и WQHD у GeForce GTX 1080 точно все будет в порядке. Наконец, по тому же принципу работает кэш. В каждом потоковом мультипроцессоре есть 256 Кбайт для регистров, 96 Кбайт общей памяти и 48 Кбайт кэша первого уровня. Объем кэша второго уровня, общего для всех кластеров процессорной графики, составляет 2 Мбайт.(рисунок 1.1.2) Рисунок 1.1.2 - Блок-схема GP104 Помимо экстенсивных преобразований, совершенных за счет перехода на 16-нанометровый техпроцесс, Pascal-чипы получили улучшенный движок Polymorph Engine 4.0(рис.4), в который включен аппаратный блок Simultaneous Multi-Projection (SMP), отвечающий за генерацию нескольких проекций одного потока геометрии. Это особенно актуально в связи с популяризацией мониторов и телевизоров с изогнутыми экранами, а также шлемов виртуальной реальности. SMP-блок обрабатывает до 16 заранее симулированных проекций одного потока геометрии. Или репликации 32 проекций, разделенных на два центра проецирования (для устройств VR). Рисунок 1.1.3 - Simultaneous Multi-Projection (SMP) в GP104 Следующий важный элемент в архитектуре Pascal — поддержка асинхронных вычислений. Как показывает практика, их эффективность сказывается в играх с программным интерфейсом DirectX 12. Классический (статический) сценарий работы графического процессора (как у Maxwell) предполагает, что два типа нагрузки — обработка графики и вычисления (например, физика) — выполняются разными вычислительными блоками за одинаковое количество времени. Но GPU не всегда выполняет вычисления разного рода одновременно. В итоге часть блоков элементарно простаивает. Динамический алгоритм асинхронных вычислений решает эту проблему, направляя незадействованные элементы процессора на обработку вычислений Второй сценарий предполагает выполнение задач, критичных ко времени исполнения. Это может быть алгоритм асинхронного искажения времени в виртуальной реальности, например. Если он не выполняется до развертки (scan out), то кадр будет сброшен. Поэтому чип обязан уметь быстро переключаться между задачами. Pascal — первая архитектура NVIDIA, в которой применяется «пиксельное прерывание операций» (Pixel Level Preemption). Алгоритм следит за состоянием рендеринга, при необходимости останавливает (прерывает) работу по раскраске треугольника, дает команду выполнить другое действие, а затем вновь возвращается к раскраске треугольника, причем на том же уровне, на каком она была прервана. Рисунок 1.1.4 - Асинхронные вычисления в NVIDIA Pascal Видеокарта GeForce GTX 1080 получила восемь гигабайт памяти стандарта GDDR5X. Главной характеристикой новых «мозгов» является очень высокая реальная частота в размере 2500 МГц. Вкупе с 256-битной шиной пропускная способность памяти составляет 320 Гбайт/с. Не рекорд, конечно, но это почти на 100 Гбайт/с больше, чем у GeForce GTX 980. Но меньше, чем у GeForce GTX 980 Ti. Младший флагман — GeForce GTX 1070 — получил обыкновенную GDDR5 (1750 МГц), но те же 8 Гбайт. Первые игровые видеокарты с HBM2, видимо, появятся только в следующем году. Еще один момент. Очевидно, что в 2016 году наличие 4 Гбайт — это необходимый минимум для игровой видеокарты. А потому не исключаю, что уже в следующем году адаптеры уровня GeForce GTX 970/980 потихоньку начнут «задыхаться» от нехватки памяти. К сожалению, системные требования в современных играх растут непропорционально улучшению качества графики. Рисунок 1.1.5 - Видеопамять GDDR5X производства Micron Проблема потребления ресурсов и видеопамяти в частности — одна из самых насущных на сегодняшний день. Поэтому алгоритмы сжатия данных приходятся как нельзя кстати. В Pascal реализовано сразу два новых метода сжатия изображения с соотношением 4:1 и 8:1. Первый случай эффективен, когда разница в значении цвета пикселей блока невелика. Второй сочетает алгоритм сжатия 4:1 блоков размером 2x2 пикселя с двукратным сжатием дельты между блоками. В среднем экономится до 20% памяти, если сравнивать новую архитектуру с Maxwell. Рисунок 1.1.6 - Эффективность сжатия текстур Каждая видеокарта оснащена двумя «гребешками». К ним подключаются и старые гибкие мостики, но их пропускной способности, по словам NVIDIA, будет достаточно лишь для разрешений Full HD и WQHD. В остальных случаях лучше использовать новый жесткий коннектор. Рисунок 1.1.7 - SLI-массив NVIDIA GeForce GTX 1080 Founders Edition NVIDIA выпустит сразу три вариации — для трех типов расстояний между PEG-портами на материнской плате. SLI-контроллер отныне работает на увеличенной до 650 МГц частоте. Именно поэтому и рекомендуется использовать новые мостики. Появление DirectX 12 поспособствовало появлению новых SLI-режимов: MDA (Multi Display Adapter) и LDA (Linked Display Adapter). Второй тип имеет две подформы: Implicit, который используется программистами NVIDIA, и Explicit, который используется разработчиком компьютерной игры. Главной и долгожданной особенностью LDA-режима стала возможность объединения массива видеопамяти в единый банк. Однако необходимо учитывать, что работе подобного алгоритма будет сопутствовать определенная задержка, так как одному адаптеру придется обращаться к памяти другого через шину PCI Express. MDA-тип подразумевает классический принцип работы, в котором каждый GPU работает лишь со своими чипами памяти. LDA-режим предназначен для объединения видеокарт с идентичными чипами, а MDA — с разными, в том числе и от разных производителей вообще. Во втором случае требуется выверенная оптимизация кода игры. Изучая современный конвейер, можно сразу же предположить, что никто этим заниматься не будет. Рисунок 1.1.8 - SLI-массив NVIDIA GeForce GTX 1080 Founders Edition Из важных нововведений отмечу поддержку нового типа вертикальной синхронизации — Fast Sync. Подробно описывать принцип действия функции не буду. Главное — результат. Алгоритм позволяет серьезно снизить задержки при выводе картинки на экран. Для этого используется дополнительный третий буфер кадров, получивший название Last Rendered Buffer (LRB). Рисунок 1.1.9 - Задержки вертикальной синхронизации Наконец, контроллер дисплея GP104 получил поддержку нескольких важных стандартов. Например, BT.2020 с поддержкой реальных 10/12 бит и HDR. I/O-панель GeForce GTX 1080 оснащена видеовыходами HDMI 2.0b и DisplayPort 1.4. «Зеленые» презентовали еще несколько технологий и функций. Так, уделили внимание звуку в VR. Наглядный видеоролик прилагаю. NVIDIA представила платформу ANSEL, способную скрупулезно и творчески работать со скриншотами. На бумаге Pascal и ее первенцы выглядят очень даже интересно: 16-нанометровый техпроцесс серьезно увеличил производительность GPU. В том числе и за счет высокой тактовой частоты; движок Simultaneous Multi-Projection улучшил и ускорил обработку изображения с применением устройств виртуальной реальности, изогнутых телевизоров и многомониторных систем; ресурсы кэша и оперативной памяти задействуются более экономно; технология SLI отныне складывает VRAM; улучшена работа асинхронных вычислений; введена поддержка BT.2020 и HDR. NVIDIA GeForce GTX 1080 Founders Edition У видеокарт GeForce GTX 980 Ti и GeForce GTX TITAN X больше и CUDA-ядер, и текстурных блоков. Однако за счет иной конструкции кластера процессорной графики их эффективность несколько ниже, чем у GeForce GTX 1080. И не забываем, что сам GPU «шустрит» на очень высокой тактовой частоте. Таблица 1.2.1 – Характеристики видеокарт NVIDIA
Референс, он же Founders Edition, очень красив. Личное мнение. Понятно, что для видеокарты этот факт не имеет никакого значения, главное — эффективность и надежность. И все же. Сама карта получилась стандартной длины — 267 мм. Рисунок 1.2.1 - NVIDIA GeForce GTX 1080 Founders Edition Адаптер занимает два слота расширения. Ближе к видеовыходам расположена пара коннекторов для подключения SLI-мостика. К видеокарте необходимо подключить один 8-пиновый провод от блока питания. Рисунок 1.2.2 - NVIDIA GeForce GTX 1080 Founders Edition, вид сверху Оборотная сторона Founders Edition получила бекплейт. Вот честно, мы в редакции так и не смогли понять, из какого материала он выполнен. Вроде пластик. Или металл. Впрочем, особой разницы нет. Часть бекплейта снимается. Так, по мнению инженеров NVIDIA, видеокарта будет лучше себя чувствовать в паре с другой GeForce GTX 1080. Нечто похожее использовалось и в референсной версии GeForce GTX 980. Система охлаждения у Founders Edition такая же, как и у других референсов. А именно используется радиатор с испарительной камерой и тангенциальный нагнетатель. Рисунок 1.2.3 - Система охлаждения NVIDIA GeForce GTX 1080 Founders Edition Под нагрузкой «турбина» раскручивается до 2150 об/мин, что составляет 54% от максимально возможной частоты вращения. Система охлаждения при этом держит температуру на уровне 81 градуса Цельсия. Максимальный показатель для GP104 — 92 градуса Цельсия. Шум заметен. На расстоянии метра измерительный прибор зафиксировал 41,5 дБ. Это громче референсной GeForce GTX 980, но тише эталонных версий GeForce GTX 980 Ti и GeForce GTX TITAN X. Отмечу, что вентилятор вращается все время. Видимо, в драйвере для прессы не активирован полупассивный режим работы кулера, когда крыльчатка начинает раскручиваться только при достижении графическим процессором определенной температуры. 2 ПРИНЦИП ПОИСКА НЕИСПРАВНОСТЕЙ И ПОСЛЕДОВАТЕЛЬНОСТЬ ДЕЙСТВИЙ 2.1 Основные способы поиска неполадки Прежде чем провести ремонт важно определить в чем проблема – этот процесс называется диагностикой. Итак, можно выделить два этапа проверки электронных приборов: 1 Проверка работоспособности прибора. Не всегда случается так что устройство совсем «мёртвое», нужно проверить не включается прибор совсем, или включается и сразу выключается, или же не работают какие-то конкретные кнопки или функции. Например, при ремонте LCD-мониторов встречается такая проблема как выход из строя подсветки. При этом монитор может либо не включатся совсем тогда его индикатор моргает, либо же индикатор указывает на включенное состояние, но изображения нет. В таком случае если посветить фонарём в экран можно увидеть, что изображение все-таки есть и монитор как бы работает, но он тёмный – и это только один из примеров, когда предварительная проверка упрощает диагностику. 2 Визуальный осмотр. Внешне можно определить большинство проблем с электрическим прибором. Это могут быть как просто сгоревшие компоненты – диоды, резисторы, транзисторы и конденсаторы, так и дефекты пайки или механические повреждение элементов и самой печатной платы. 3 Измерения. Если плата и детали выглядят нормально, то следует переходить к измерениям. Их проводят в основном с помощью мультиметра и осциллографа. В отдельных случаях используют специализированные приборы, типа частотомеров, логических анализаторов и прочего. Итак, обобщенным алгоритмом поиска неисправности является: осмотр платы; определение чрезмерного нагрева электронных компонентов платы; измерения и прозвонка мультиметром; использование осциллографа и других приборов; замена вышедшей из строя детали или блока. Рисунок 2.1.1 - Осмотр платы Визуальный осмотр следует проводить от общего к частному. Или простыми словами – осмотреть общий вид электронного устройства, сразу проверяем целостность кабелей и проводов питания. Их покров должен быть ровным и целым, без изломов и резких перегибов, шишек и других неравномерностей на оболочке быть не должно. Рисунок 2.1.2 - Визуальный осмотр После того как вы убедились в целостности устройства, нужно его разобрать и добраться к печатной плате. Осмотр внутренностей следует начинать с проверки целостности шлейфов, проводов других межблочных соединений. Важно не порвать их еще при разборке, так как часто шлейфы идут от плат к блокам клавиш и дисплеям, закрепленным на корпусе. Рисунок 2.1.3 - Осмотр шлейфов Далее проверяют целостность предохранителя в цепи питания, часто если он перегорел можно определить невооруженным взглядом. Он стоит около того места, где подключается к плате шнур питания. Рисунок 2.1.4 - Осмотр предохранителей После этого осматривают наличие следов нагрева или сажи на плате и поврежденные компоненты. Рассмотрим, как выглядят неисправные электронные компоненты. Например, корпуса неисправных транзисторов и сгоревших диодов разрывает или они трескаются. Рисунок 2.1.5 - Осмотр платы на наличие следов нагрева или сажи на плате На интегральных микросхемах появляется трещина или мелкая точка. В некоторых случаях и те, и другие сгорают, оставляя в результате следы гари на плате. Обращайте внимание нет ли характерного запаха горелой изоляции. Так можно локализировать от какого элемента или участка платы исходит этот запах. Как определить сгоревшие транзисторы и микросхемы вы видите ниже. Рисунок 2.1.6 - Поиск сгоревших транзисторов и микросхем Резисторы обычно сгорают или темнеют, реже происходит обрыв резистивного слоя и деталь выглядит исправной. Рисунок 2.1.7 Осмотр резисторов Как определить сгоревшие конденсаторы? Они в основном пробивают «накоротко» между обкладками и, если стоят в силовой цепи – тогда повреждаются дорожки платы или корпус конденсатора. Если цепь была слаботочной – пробитый конденсатор просто закоротит её без видимых следов протекания больших токов. Реже трескаются корпуса конденсаторов. Рисунок 2.1.8 - Осмотр конденсаторов В то время как электролитические конденсаторы можно вычислить по деформированной крышке корпуса или следам протекшего вниз электролита. На крышке конденсатора есть две диагональных борозды, она нужна чтобы корпус не разорвало в аварийной ситуации. Крышка в таком случае вздувается либо трескается. Реже выдавливает дно Рисунок 2.1.9 - Осмотр конденсаторов Чаще всего люди интересуются электроникой чтобы уметь починить какой-либо прибор. Самостоятельной разработкой занимается лишь малая часть любителей. Теоретические знания хоть и дают общее понимания принципа работы компонентов, но для ремонта гораздо важнее знать методы их проверки. Мы расскажем, как найти неисправность в электронной схеме своими руками, глазами и простым инструментом. 2.2 Поиск неисправностей GTX 1080 У нас есть плата Asus ROG STRIX GTX 1080 (Рисунок 2.2.1) Рисунок 2.2.1 – Плата Asus ROG STRIX GTX 1080 Для того чтобы нам найти неисправность мы будем руководствоваться пункту 2.1: осмотр платы; определение чрезмерного нагрева электронных компонентов платы; измерения и прозвонка мультиметром; использование осциллографа и других приборов; замена вышедшей из строя детали (транзистор указанный на схеме U3, рисунок 2.2.2). Рисунок 2.2.2 – Транзистор U3 ЗАКЛЮЧЕНИЕ Таким образом, поиск неисправностей целесообразно проводить от более простых элементов к более сложным и дорогостоящим по заранее составленному плану. Предпочтителен метод последовательного исключения подозреваемых в отказе компонентов, если имеются заведомо исправные компоненты для замены. Для выбора метода диагностики и определения первичных и вторичных симптомов отказа необходимо уметь классифицировать неисправность, т. к. первичный отказ часто вызывает целый спектр отказов вторичных, являющихся следствием первичного и затеняющих причину неисправности СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ Видеокарта GeForce GTX 1080 [в 28 бенчмарках] [Электронный ресурс]. – Режим доступа: https://technical.city/ru/video/GeForce-GTX-1080. Видеоускоритель Nvidia GeForce GTX 1080 [Электронный ресурс]. – Режим доступа: https://www.ixbt.com/video4/geforce-gtx1080-part1.shtml. Обзор видеокарты NVIDIA GeForce GTX 1080. Часть 1: архитектура Pascal и знакомство с референсом Foundets Edition – Ferra.ru [Электронный ресурс]. Режим доступа: https://www.ferra.ru/review/computers/nvidia-geforce-gtx-1080.htm. Видеокарта – Википедия [Электронный ресурс]. Режим доступа: https://ru.wikipedia.org/wiki/Видеокарта. |