Лаба №6. Лаба 6. Отчет по лабораторной работе 6 по дисциплине Системная инженерия
Скачать 81.92 Kb.
|
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнёва» Институт Информатики и телекоммуникаций Кафедра информатики и вычислительной техники Отчет по лабораторной работе № 6 по дисциплине «Системная инженерия» Выполнил: ст. гр. МИМ21-01 Джумагулова Айдар Проверил: доцент каф. ИВТ Вдовенко В. В. Красноярск 2021 г. 1.Основные стандартизованные определения показателей надежности Надежность – свойство объекта (ИС) сохранять во времени в установленных пределах способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, ремонтов, хранения и транспортирования. Надежность является комплексным свойством, включающим в себя безотказность, ремонтопригодность и сохраняемость. Безотказность – свойство системы или элемента непрерывно сохранять работоспособное состояние в течение некоторого времени или некоторой наработки. Под наработкой понимают объем работы объекта (системы). Сохраняемость – свойство системы непрерывно сохранять исправное, работоспособное состояние в течение всего времени хранения. Ремонтопригодность – свойство системы или элемента, заключающееся в приспособлении к предупреждению, обнаружению и устранению причин возникновения отказов путем проведения ремонтов и технического обслуживания. Объекты делятся на восстанавливаемые и невосстанавливаемые, в зависимости от того какое решение должно быть принято в случае отказа объекта. Таким образом можно видеть, что понятие надежности является фундаментальным понятием, которое охватывает все стороны технической эксплуатации элементов и систем. В свою очередь надежность является составной частью более широкого понятия – эффективности. Под эффективностью понимается свойство системы (элемента) выполнять заданные функции с требуемым качеством. Средства повышения надежности ИС В настоящее время, можно выделить несколько основных направлений работ по повышению надежности ИС и микропроцессорных систем [1,35,52]. 1. В первую очередь надежность ИС достигается за счет использования в ней высоконадежных элементов. Это достигается применением в устройствах ИС интегральных схем с высокой степенью интеграции (интенсивность отказов в ИС 10-6÷10-8 1/ч), использованием оптических элементов, а также внедрением новых типов печатных плат, контактных соединений, новых технологий ИС и т.д. 2. Вторым направлением повышения надежности являются обеспечение оптимальных режимов работы элементов. Большое значение при этом имеет выбор коэффициента нагрузки по тепловому, механическому и радиационному режиму. Режимы зависят от конструкции устройств, от принятых технических решений, которые необходимо учитывать в процессе проектирования. 3. Эффективным средством повышения надежности технических систем является введение избыточности или резервирования. Резервирование – применение дополнительных средств и возможностей с целью сохранения работоспособного состояния объекта при отказе одного или нескольких его элементов. В компьютерах, КС используются различные виды резервирования: структурное, временное, функциональное, информационное и программное. 4. Эффективным методом повышения надежности является восстановление отказавших устройств. Здесь необходимо решить задачи, связанные с обнаружением отказа и с поиском отказавших элементов. Эффективность диагностирования повышается при использовании автоматизированных систем контроля. Одним из средств повышения надежности является уменьшение времени восстановления. Время восстановления сокращается за счет обеспечения доступности всех узлов устройства для осмотра, т.е. определяется ремонтопригодностью разрабатываемых конструкций. В настоящее время широко используется модульно-блочный принцип построения устройств, при которых замена отказавших элементов осуществляется путем замены целых блоков. Снятые блоки уже вне изделия подлежат восстановлению на специальных стендах с использованием контрольно-измерительных приборов. 5. Для повышения надежности компьютеров, КС, ИС необходимо обеспечить надежность программного обеспечения. Надежность программного обеспечения может быть увеличена за счет программного резервирования и использования средств автоматического контроля за правильностью выполнения вычислительного процесса. Наличие системы автоматического контроля способствует увеличению готовности и обслуживаемости ИС. 6. Одним из перспективных путей достижения высоких показателей надежности ИС является их построение на базе использования самопроверяемых средств функционального диагностирования, создание самопроверяемых устройств и отказоустойчивых систем. Из всех перечисленных особо можно отметить проблему контроля и диагностирования. Анализ надежности элементов ИС показывает, что примерно 40-45% всех отказов возникает из-за ошибок на этапе проектирования, 20% от ошибок, допущенных при производстве, 30% от неправильной эксплуатации и 5-10% от естественного износа и старения. Рассмотрим основные методы обеспечения надежности на этапах жизненного цикла ИС, которые могут быть включены в программы по обеспечению надежности. Этап составления технического задания. На этом этапе необходимо собрать все имеющиеся данные об аналогичных или близких реализованных системах, а также данные об условиях применения технических систем и требованиях, предъявляемых к ним (функциям, выполняемым рассматриваемой системой). Этап эскизного проектирования. На этапе эскизного проектирования выбирается элементная база, структура и организация разрабатываемой системы. Проводится предварительный расчет надежности, принимается решение о резервировании наименее надежных подсистем, а также решения о способах и организации технического обслуживания (профилактических и ремонтных работ). Исследуется вопрос о целесообразности и способах реализации методов автоматического восстановления и отказоустойчивости в системе. Этапы технического и рабочего проектирования. На этих этапах проверяются и уточняются ранее принятые технические решения. Основой для этого служат данные о надежности, полученные на основании расчетов и результаты экспериментов над моделями, макетами, опытными и промышленными образцами. Разрабатывается программное обеспечение системы и проводится её проверка по тестам (путем имитационного моделирования на модели разрабатываемой ТС). Этап производства. Здесь основным является технический контроль, охватывающий все стадии производственного процесса (входной контроль качества комплектующих изделий, соответствия тех. документациям печатных плат, блоков, устройств, схемных соединений и т.д.) и устранение недостатков в разработке системы. Этап эксплуатации. На этом этапе важными являются контроль и обеспечение условий окружающей среды, квалификация и состав обслуживающего персонала, организация и проведение технического обслуживания и ремонтов в предусмотренном порядке. В период эксплуатации продолжается сбор сведений об отказах аппаратуры и программного обеспечения. Эти сведения передаются разработчикам с целью устранения причин отказов и уточнения исходных данных для расчета надежности. 2. Дайте определение понятия «отказоустойчивость». Отказоустойчивость — свойство технической системы сохранять свою работоспособность после отказа одного или нескольких составных компонентов. Отказоустойчивость определяется количеством любых последовательных единичных отказов компонентов, после которого сохраняется работоспособность системы в целом. Базовый уровень отказоустойчивости подразумевает защиту от отказа одного любого элемента — исключение единой точки отказа. Основной способ повышения отказоустойчивости — избыточность. Наиболее эффективный метод избыточности — аппаратная избыточность, которая достигается путем резервирования. В ряде приложений отказоустойчивость путем резервирования является обязательным требованием, предъявляемым государственными надзорными органами к техническим системам. Отказоустойчивость следует отличать от отказобезопасности — способности системы при отказе некоторых частей переходить в режим работы, не представляющий опасности для людей, окружающей среды или материальных ценностей. Однако в реальных системах эти два требования могут выступать совместно. Отказоустойчивость связана со следующими техническими характеристиками систем: коэффициент готовности, который показывает, какую долю времени от общего времени службы система находится в рабочем состоянии; надёжность системы, которая определяется, например, как вероятность отказа в единицу времени. 3. Каковы причины отказов ИС? Важными понятиями в теории надежности и практике эксплуатации технических систем, в том числе вычислительных, являются повреждения и отказы. Понятия «повреждения» и «отказ» относятся к событиям, а не к состояниям, которые были рассмотрены ранее. Определим терминологию, связанную с отказами. Отказ {failure) — событие, при наступлении которого объект не способен функционировать так, как это требуется согласно документации на него. Иначе говоря, это потеря способности изделия выполнить требуемую функцию. Отказ является событием, которое приводит к состоянию неисправности (к нарушению работоспособности) объекта. Ошибка {error) — событие несоответствия между вычисленным, наблюдаемым или измеренным значением или состоянием и истинным, заданным или теоретически правильным значением или состоянием. Критерий отказа {failure criterion) — заранее оговоренные признаки нарушения работоспособного состояния, по которым принимают решение о факте наступления отказа. Типичные критерии отказов: • прекращение выполнения объектом заданных функций (отказ функционирования); • снижение качества функционирования по одному или нескольким параметрам (производительность, мощность, точность и др.) за пределы допускаемого уровня (параметрический отказ); • искажения информации на выходе объектов, имеющих в своем составе ЭВМ или другие цифровые устройства; • внешние проявления, связанные с наступлением или предпосылками наступления неработоспособного состояния (шум, вибрации, перегрев и др.). Полный отказ (complete failure) — отказ, характеризующийся потерей способности изделия выполнять все требуемые функции. При полном отказе система теряет работоспособность. Частичный отказ {partialfailure) — отказ, характеризующийся потерей способности изделия выполнять некоторые, не все требуемые функции. Он является событием, которое приводит к состоянию частичной неисправности. Например, коммутатор ЛВС может функционировать при повреждении некоторых его портов. Персональный компьютер может работать при нарушениях, снижающих скорость вращения вентилятора. Аналого-цифровой преобразователь может использоваться при ошибочности наименее значимых разрядов. Близким к понятию «частичный отказ» является понятие «повреждение». Повреждение {damage) — событие, заключающееся в нарушении исправного состояния объекта при сохранении работоспособного состояния. Если при повреждении сохраняется работоспособное состояние системы (объекта), то сохраняется «приемлемая для пользователя неполная способность изделия выполнить требуемую функцию». Независимый отказ {primary failure) — отказ, не вызванный прямо или косвенно другим отказом или неисправностью. Зависимый отказ (secondary failure) — отказ, вызванный другим отказом. Последствия отказа {failure effect) — важность, значимость отказа в пределах или вне пределов изделия. Систематический отказ {systematicfailure) — отказ, однозначно вызванный определенной причиной, которая может быть устранена только модификацией проекта или производственного процесса, правил эксплуатации и документации. Он может быть воспроизведен путем преднамеренного создания тех же самых условий, например, с целью определения причины отказа. Систематический отказ является результатом систематической неисправности. Сбой {interruption) — самоустраняющийся отказ или однократный отказ, устраняемый незначительным вмешательством оператора. После сбоя восстановление работоспособного состояния объекта может быть обеспечено без ремонта, например, путем повтора вычислений, повтора передачи пакетов в сети, перезагрузки оператором ЭВМ, отключения и последующего включения сетевого адаптера или модема, выключения электропитания персонального компьютера с его последующим включением. Характерным примером сбоя служит возобновление работы устаревшего телевизора после удара рукой по его корпусу. Причина отказа {failure cause) — обстоятельства в ходе разработки, производства или использования, которые привели к отказу. Механизм отказа {failure mechanism) — физический или химический процесс, который приводит к отказу. Ошибка человека {human error) — действие человека, приведшее к непреднамеренному результату. Отказ вследствие изнашивания {wear-outfailure) — отказ, вероятность возникновения которого возрастает с течением времени из-за накапливаемых ухудшений, вызванных прилагаемыми при использовании нагрузками. Отказ вследствие старения {ageing failure) — отказ, вероятность возникновения которого увеличивается из-за накапливающихся ухудшений с течением календарного времени. Отказы по общей причине {common cause failures) — отказы различных изделий или их составных частей, происходящие из-за одного события, если эти отказы не являются следствиями друг друга. Отказы общего вида {common mode failures) — отказы различных изделий или их составных частей, характеризующиеся одним и тем же видом отказа. Они могут иметь различные причины, в том числе быть отказами по общей причине. Проявление скрытой неисправности {manifestation of a latent fault) — отказ, который указывает на существование скрытой неисправности. Критичность отказа {failure criticality) — степень тяжести последствий отказа в соответствии с установленными критериями оценки и категориями. При классификации отказов по критичности выделяются катастрофический, критический, некритический. Классификация устанавливается нормативно-технической и (или) конструкторской (проектной) документацией по согласованию с заказчиком на основании технико-экономических соображений и требований безопасности. Критический отказ (critical failure) — отказ, который может привести к тяжелым последствиям: для здоровья людей, значительному материальному ущербу или неприемлемым экологическим или экономическим последствиям. Для ИВС ответственного назначения в ряде случаев к критическим отказам могут быть отнесены отказы, вызывающие потерю невосполнимых данных, которая приводит к значительным экономическим потерям. Для управляющих систем реального времени к критическим отказам могут быть отнесены отказы, приводящие к невозможности формирования управляющих воздействий в требуемые сроки. Причинами отказа могут быть просчеты, допущенные при проектировании, дефекты производства, нарушения правил и норм эксплуатации, повреждения, а также естественные процессы изнашивания и старения. Признаки отказа или повреждения оказывают непосредственные или косвенные воздействия на органы чувств наблюдателя (оператора) с помощью явлений, характерных для неработоспособного состояния объекта или процессов, с ними связанных. Характер отказа или повреждения определяют конкретные изменения, происшедшие в объекте. К последствиям отказа или повреждения относятся явления и события, возникшие после отказа или повреждения и находящиеся в непосредственной причинной связи с ним. По проявлению могут быть отказы: • функционирования (выполнение основных функций объектом прекращается: например, отказ процессора); • параметрические (некоторые параметры объекта изменяются в недопустимых пределах: например, точность, время решения задачи). По своей природе отказы могут быть: • случайные, обусловленные непредусмотренными перегрузками, дефектами материала, ошибками персонала или сбоями системы управления и т.и.; 4. Какая часть ИС является наиболее слабой в смысле отказоустойчивости? Наиболее "слабой" в смысле отказоустойчивости частью компьютерных систем всегда являлись жесткие диски, поскольку они, чуть ли не единственные из составляющих компьютера, имеют механические части. Данные записанные на жесткий диск доступны только пока доступен жесткий диск, и вопрос заключается не в том, откажет ли этот диск когда-нибудь, а в том, когда он откажет 5. Какие технологии используются для защиты от отказов отдельных дисков? Используются технологии RAID, которые применяют дублированные данных, хранимых на дисках. Акроним RAID (Reudant Array of Independed Disks) избыточный массив независимых дисков, впервые был использован в 1988 году исследователями из института Беркли Паттерсоном (Patterson), Гибсоном (Gibson) и Кацем (Katz). Они описали конфигурацию массива из нескольких недорогих дисков, обеспечивающих высокие показатели по отказоустойчивости и производительности. RAID обеспечивает метод доступа к нескольким жестким дискам, как если бы имелся один большой диск (SLED - single large expensive disk), распределяя информацию и доступ к ней по нескольким дискам, обеспечивая снижение риска потери данных, в случае отказа одного из винчестеров, и увеличивая скорость доступа к ним 6. Что такое репликация данных? Репликация — одна из техник масштабирования баз данных. Состоит эта техника в том, что данные с одного сервера базы данных постоянно копируются (реплицируются) на один или несколько других (называемые репликами). Для приложения появляется возможность использовать не один сервер для обработки всех запросов, а несколько. Таким образом появляется возможность распределить нагрузку с одного сервера на несколько. Существует два основных подхода при работе с репликацией данных: Репликация Master-Slave; Репликация Master-Master. 7. В чем состоят достоинства и недостатки синхронной репликации? Преимущество зеркалирования очевидно - высокая надежность. Недостатками является отсутствие увеличения производительности и высокая цена за счет полного дублирования дисков (при двух дисках процент их использования составляет 50%). 8. Какую репликацию называют Асинхронной? Асинхронной называют репликацию, которая осуществляется не в тот же момент, когда осуществляется запись оригинального блока данных, а в «удобное время». Это позволяет преодолеть вышеописанный недостаток синхронной репликации, поскольку процесс записи данных и процесс их переноса на «реплику» разделены и не связаны больше. 9. Какие информационные системы относят к системам высокой готовности? Предполагается, что конфигурация таких систем обеспечивает ее быстрое восстановление после обнаружения неисправности, для чего в ряде мест используются избыточные аппаратные и программные средства. Длительность задержки, в течение которой программа, отдельной компонент или система простаивает, может находиться в диапазоне от нескольких секунд до нескольких часов, но более часто в диапазоне от 2 до 20 минут. 10. Какова роль кластеров в повышении надежности ИС? Основное назначение кластера, ориентированного на максимальную надежность, состоит в обеспечении высокого уровня доступности (иначе - уровня готовности) и удобства администрирования по сравнению с разрозненным набором компьютеров или серверов. Кластеры должны быть нечувствительны к одиночным отказам компонентов (как аппаратных, так и программных); в общем случае при отказе какого-либо узла сетевые сервисы или приложения автоматически переносятся на другие узлы. При восстановлении работоспособности отказавшего узла приложения могут быть перенесены на него обратно. 11. Назовите современные методы кластеризации. Современные методы кластеризации, уменьшают расходы и улучшают готовность, обеспечивая максимальную эффективность работы центров обработки данных: Ассиметричная кластеризация Симметричная Кластеризация N+1 12. В чем состоят преимущества кластеризации N+1? низкие затраты: В традиционном кластере активный/пассивный для обеспечения этого уровня готовности потребовалось бы 8 серверов. Используя кластер N+1, мы уменьшим число серверов до 5 при том же уровне готовности. В реальных ценах это выражается следующим образом - если каждый сервер стоит 5000 евро (без учета обслуживания), то, купив на 3 сервера меньше, вы сэкономите 15000 евро нет ухудшения производительности: В кластере N+1 всегда есть выделенный сервер, готовый взять на себя нагрузку вышедшей из строя системы. Это означает, что на каждом сервере выполняется только одно 14. Изобразите зависимости изменения надежности программных и аппаратных средств ИС от времени. 13. В чем состоят особенности программного обеспечения как объекта анализа надежности? Надежность программного обеспечения - это свойство обеспечивать получение в соответствии с заданным алгоритмом правильных результатов в течении определенного интервала времени. Отказ программного обеспечения - состояние комплекса программ, связанное с нарушением работоспособности комплекса программ и прекращением дальнейшего функционирования из-за ошибок. 15. Дайте определение понятия «надежность программного обеспечения» в соответствии со стандартом ISO 9126:1991. Набор атрибутов, относящихся к способности программного обеспечения сохранять свой уровень качества функционирования при установленных условиях за установленный период времени. Примечания 1. Износ или старение программного обеспечения не происходит. Ограничения надежности проявляются из-за ошибок в требованиях, проекте и реализации. Отказы из-за этих ошибок зависят от способа использования программного обеспечения и ранее выбранных версий программ. 2. В определении ИСО 8402 "надежность - способность элемента выполнять требуемую функцию". В настоящем стандарте функциональная возможность является только одной из характеристик качества программного обеспечения. Поэтому определение надежности расширено до "сохранения своего уровня качества функционирования" вместо "выполнения требуемой функции". 16. Приведите зависимости стоимости исправления ошибок и вероятности правильно исправить ошибки ПО от времени.
17. Назовите основные причины ошибок программного обеспечения. Основные причины возникновения ошибок: Несовершенство программного обеспечения Несовершенство операционной системы Отсутствие нужных ресурсов Ошибки в реестре Вирусы, троянские кони и «черви» Ограничения операционной системы Использование устаревшего оборудования Неверные настройки операционной системы Ошибки драйверов Разгон компьютера. 18. Каковы источники ошибок (угрозы надежности) программного обеспечения? Первый тип — уязвимости, вызванные дефектами (ошибки, проблемы) проектирования и программирования системы Второй тип — уязвимости, вызванные дефектами конфигурирования и управления системой и ее окружением. 19. Перечислите общие признаки программных и аппаратных отказов аппаратный сбой — временный выход из строя компонента микроконтроллера с последующим возвращением к нормальному режиму работы; аппаратный отказ — выход из строя компонента микроконтроллера и невозможность его дальнейшей работы без замены компонентов или резервирования; отсутствие робастности — характеризует не устойчивость системы к входным данным, не определенным техническим заданием; ошибки программного обеспечения (ПО) — непреднамеренное отклонение программы от заданного исполнения вследствие внутренних и внешних факторов (ошибки компиляторов, программистов, влияние аппаратных отказов и сбоев). |