Учебнометодическое пособие Саратов 2008 2 Содержание содержание 2 теоретическая справка 4
Скачать 0.74 Mb.
|
– 1 – Факультет нелинейных процессов Кафедра электроники, колебаний и волн А.Е. Филатова, А.Е. Храмов, А.А. Короновский АНАЛИЗ И ДИАГНОСТИКА ОТКРЫТЫХ СИСТЕМ Учебно-методическое пособие Саратов – 2008 – 2 – Содержание СОДЕРЖАНИЕ 2 ТЕОРЕТИЧЕСКАЯ СПРАВКА 4 I. СТАТИСТИЧЕСКИЙ АНАЛИЗ 4 Характеристики и свойства случайного процесса 7 Основные понятия 7 Моменты случайной величины 9 Первый момент случайного процесса 11 Вторые моменты случайного процесса 12 Автокорреляционная функция 13 Классификация случайных процессов 16 Стационарность случайного процесса 16 Эргодичность случайного процесса 17 Гауссов шум 17 Литература 18 II. СПЕКТРАЛЬНЫЙ АНАЛИЗ 19 Преобразование Фурье 19 Оконное преобразование Фурье 21 Литература 21 III. НЕПРЕРЫВНЫЙ ВЕЙВЛЕТНЫЙ АНАЛИЗ 23 Литература 29 IV. КРАТКОЕ ОПИСАНИЕ ЭКСПЕРИМЕНТАЛЬНЫХ СИГНАЛОВ 31 Литература 35 ОБЩИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ ПРАКТИКУМА 36 – 3 – ЗАДАНИЕ 1: ГЕНЕРАЦИЯ МОДЕЛЬНЫХ СИГНАЛОВ 37 Сигналы для исследования: 37 ЗАДАНИЕ 2: СТАТИСТИЧЕСКИЙ И КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ПРЕДЛОЖЕННЫХ СИГНАЛОВ 41 ЗАДАНИЕ 3: СПЕКТРАЛЬНЫЙ АНАЛИЗ 42 ЗАДАНИЕ 4: ВЕЙВЛЕТНЫЙ АНАЛИЗ ВРЕМЕННЫХ РЯДОВ 43 – 4 – Теоретическая справка I. Статистический анализ Прикладная статистика (статистический анализ) — наука о методах обработки статистических данных. Методы прикладной статистики активно применяются в технических исследованиях, экономике, теории и практике управления (менеджмента), социологии, медицине, геологии, истории и т. д. С результатами наблюдений, измерений, испытаний, опытов, с их анализом имеют дело специалисты во всех отраслях практической деятельности, почти во всех областях теоретических исследований. Первая публикация по статистике – это «Книга чисел» в Библии, в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведенной под руководством Моисея и Аарона. Впервые термин «статистика» мы находим в художественной литературе — в «Гамлете» Шекспира (1602 г., акт 5, сцена 2). Смысл этого слова у Шекспира — знать, придворные. По-видимому, оно происходит от латинского слова status, что в оригинале означает «состояние» или «политическое состояние». В течение следующих 400 лет термин «статистика» понимали и понимают по- разному. В работе [1] собрано более 200 определений этого термина, некоторые из которых приводятся ниже. Вначале под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение. Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика — это бюджет вещей». Тем самым статистические методы были признаны полезными не только для административного управления, но и для применения на уровне отдельного предприятия. Согласно формулировке 1833 г., «цель статистики заключается в представлении фактов в наиболее сжатой форме». Приведем еще два высказывания. Статистика состоит в в наблюдении явлений, которые могут быть подсчитаны или выражены посредством чисел (1895). Статистика — это – 5 – численное представление фактов из любой области исследования в их взаимосвязи (1909). В ХХ в. статистику часто рассматривают, прежде всего, как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных (1925). В 1954 г. академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трех разделов: 1) сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей; 2) статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения; 3) разработка приемов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики». Прикладная статистика и математическая статистика – это две разные научные дисциплины. Различие четко проявляется и при преподавании. Курс математической статистики состоит в основном из доказательств теорем, как и соответствующие учебные пособия. В курсах прикладной статистики основное – методология анализа данных и алгоритмы расчетов, а теоремы приводятся как обоснования этих алгоритмов, доказательства же, как правило, опускаются (их можно найти в научной литературе). В настоящем пособии мы следуем второму пути, т. е. изучаем прикладную статистику. Термин «статистика» употребляют еще в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценивания характеристик и параметров распределений и проверки гипотез. Теперь кратко остановимся на понятии статистической методологии – системе приёмов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях исследуемых явлений. Статистическое исследование состоит из трёх стадий: 1. Статистическое наблюдение; 2. Первичная обработка, сводка и группировка результатов наблюдения; – 6 – 3. Анализ полученных сводных материалов. Прохождение каждой стадии исследования связано с использованием специальных методов, объясняемых содержанием выполняемой работы. 1. Статистическое наблюдение – научно организованный сбор сведений об изучаемых процессах или явлениях. Вообще вопрос о том, правильно ли собраны данные является весьма принципиальным. Отметим, что при выполнении практикума студенту необходимо обратить особенное внимание на факт правильности расчета данных, используемых на дальнейших стадиях исследования. Полученные данные являются исходным материалом для выполнения последующих этапов статистического исследования. 2. Статистический анализ. В его процессе исследуется структура, динамика и взаимосвязи общественных явлений и процессов. Выделяют следующие основные этапы анализа: 2.1. Констатация фактов и их оценка; 2.2. Установление характерных черт и причин явления; 2.3. Сопоставление явления с другими явлениями; 2.4. Формулирование гипотез, выводов и предположений; 2.5. Статистическая проверка выдвинутых гипотез с помощью специальных статистических показателей. Точность статистического наблюдения – это степень соответствия величины какого-либо показателя, определенной по материалам статистического наблюдения, действительной его величине. Расхождение между расчетным и действительным значениями изучаемых величин называется ошибкой наблюдения. В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности. Ошибки регистрации – это отклонения между значением показателя, полученного в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок может быть при сплошном и несплошном наблюдениях. Ошибки регистрации бывают случайные и систематические. Случайные ошибки регистрации – это результат действия различных факторов (например, переставлены цифры, перепутаны соседние стоки или графы и т.д.). Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению показателя по каждой единице – 7 – наблюдения и поэтому величина показателя по совокупности в целом будет включать накопленную ошибку (например, различные округления). В отличие от ошибок регистрации ошибки репрезентативности характерны только для несплошного наблюдения. Отклонение значения показателя обследованной совокупности и его величины по исходной совокупности называется ошибкой репрезентативности. Ошибки репрезентативности также бывают случайные и систематические. Случайные ошибки репрезентативности возникают, если отобранная совокупность неполно воспроизводит всю совокупность в целом. Систематические ошибки репрезентативности появляются вследствие нарушения принципов отбора единиц из исходной совокупности, которые должны быть подвергнуты наблюдению. Характеристики и свойства случайного процесса Основные понятия Случайная величина – одно из основных понятий теории вероятностей. Случайная величина – это измеримая функция, заданная на каком-либо вероятностном пространстве. Наряду со случайными событиями, как фактами в схеме испытаний, характеризующими ее качественно, результаты опытов можно описать количественно. Это и ведет к понятию случайной величины в теории вероятностей. Фактически, всегда результаты опытов со схемой можно представить количественно с помощью одной или нескольких числовых величин. Так, в конечных схемах описаний вместо самих элементарных исходов можно рассматривать их номиналы (идентификаторы). Например, при бросании монеты «решка» — это 0, а «герб» — это 1; при бросании игральной кости результаты — суть номера граней от 1 до 6 и т. п. В бесконечных схемах (дискретных или непрерывных) уже изначально элементарные исходы удобно описывать количественно. Например, номера градаций типов несчастных случаев при анализе ДТП; время безотказной работы прибора при контроле качества и т. п. Числовые значения, описывающие результаты опытов, могут характеризовать не обязательно отдельные элементарные исходы в схеме испытаний, но и соответствовать каким-то более сложным событиям. С одной стороны, с одной схемой испытаний и с отдельными событиями в ней одновременно может быть связано сразу несколько числовых величин, которые требуется анализировать совместно. Например, координаты (абсцисса, ордината) какого-то разрыва снаряда при стрельбе по наземной цели; метрические размеры (длина, ширина и т. д.) детали при контроле качества; результаты медобследования (температура, давление, пульс и пр.) при диагностике больного; данные переписи населения (по возрасту, полу, достатку и пр.). Поскольку значения числовых характеристик схем испытания соответствуют в схеме некоторым случайным событиям (с их определенными вероятностями), то и сами эти значения являются случайными (с теми же вероятностями). Поэтому такие числовые характеристики и принято называть случайными величинами. При этом расклад вероятностей по значениям случайной величины называется законом распределения случайной величины. На схеме испытаний может быть определена как отдельная случайная величина (одномерная/скалярная), так и целая система одномерных взаимосвязанных случайных величин (многомерная/векторная). Перечень возможных значений (спектр) каждой одномерной случайной величины может быть как дискретным (конечным/бесконечным), так и непрерывным, а также комбинированным — в зависимости от характера распределения вероятностной массы материальных точек схем испытаний по значениям случайной величины. Случайный процесс (случайная функция) – семейство случайных величин, индексированных некоторым параметром, чаще всего играющим роль времени или пространства. Определение случайного процесса. Пусть задано вероятностное пространство (Ω, F, P). Параметризованное семейство { } случайных величин T t t X ∈ , : ) ( ℜ → Ω • t X T t ∈ , где T – произвольное множество, называется случайной функцией. Случайный процесс описывается статистическими характеристиками, называемыми моментами. Кроме того, важнейшими характеристиками случайного процесса являются его стационарность и эргодичность, а также спектр мощности. – 8 – Вероятность (вероятностная мера) – мера достоверности случайного события. Оценкой вероятности события может служить частота его наступления в длительной серии независимых повторений случайного эксперимента. Математически вероятность задаётся аксиоматикой Колмогорова как мера на вероятностном пространстве, причем мера всего пространства равна единице. При этом случайные события определяются как измеримые подмножества этого пространства. Определение. Пусть дано вероятностное пространство (Ω, F, P), и на нём определена случайная величина X с распределением . Тогда функцией распределения случайной величины X называется функция X P [ ] 1 , 0 : → R F X , задаваемая формулой: ( ] ( ) x P x X P x F X X , ) ( ) ( ∞ − ≡ ≤ = Простейшие свойства F X не убывает на всей числовой прямой. F X непрерывна справа. 0 ) ( lim = −∞ → x F X x 1 ) ( lim = ∞ → x F X x Одномерная плотность распределения вероятности W(x, t) определяет вероятность } ) ( { ) , ( dx x t x P dx t x W + ≤ ≤ = ξ того, что случайная величина ξ (t)лежит в интервале {x ≤ ξ (t) ≤ x+dx}. Моменты случайной величины Момент случайной величины – числовая характеристика распределения данной случайной величины. Если дана случайная величина X, определённая на некотором вероятностном пространстве, то: • k-м начальным моментом случайной величины X, где N k ∈ ,называется величина [ ] k k X E v = , если математическое ожидание в правой части этого равенства определено; [ ] ∗ E – 9 – • k-м центра́льным моментом случайной величины X называется величина ( ) [ ] k k EX X E − = μ , • k-м факториальным моментом случайной величины X называется величина ( ) ( ) [ 1 1 ] + − − = k X X X E k K μ , если математическое ожидание в правой части этого равенства определено. Замечания • Если определены моменты k-го порядка, то определены и все моменты низших порядков k k < ′ ≤ 1 • В силу линейности математического ожидания центральные моменты могут быть выражены через начальные, и наоборот. Например: 0 1 = μ , 2 1 2 2 v v − = μ , 3 1 2 1 3 3 2 3 v v v v + − = μ , и т. д. Геометрический смысл некоторых моментов равняется математическому ожиданию случайной величины и показывает относительное расположение распределения на числовой прямой. 1 v 2 μ равняется дисперсии распределения ( ) 2 2 σ μ = и показывает разброс распределения вокруг среднего значения. 3 μ , будучи соответствующим образом нормализован, является числовой характеристикой симметрии распределения. Более точно, выражение 3 3 σ μ называется коэффициентом асимметрии. 4 μ контролирует, насколько ярко выражена вершина распределения в окрестности среднего. Величина 3 4 4 − σ μ называется коэффициентом эксцесса распределения X. Вычисление моментов – 10 – Моменты могут быть вычислены напрямую через определение путём интегрирования соответствующих степеней случайной величины. В частности, для абсолютно непрерывного распределения с плотностью f(x) , имеем: dx x f x v k k ∫ ∞ ∞ − = ) ( , если ∞ < = ∫ ∞ ∞ − dx x f x v k k ) ( , а для дискретного распределения с функцией вероятности p(x) : ∑ = x k k x p x v ) ( , если ∞ < = ∑ x k k x p x v ) ( Ниже более подробно рассмотрим понятия и смысл нескольких моментов низких порядков случайного процесса. Первый момент случайного процесса Математическое ожидание – понятие среднего значения случайной величины в теории вероятносте, среднее значение – числовая характеристика множества чисел или функций; – некоторое число, заключённое между наименьшим и наибольшим из их значений. В зарубежной литературе обозначается через EX , в русской MX . В статистике часто используют обозначение μ Средним значением, математическим ожиданием случайного процесса или его первым моментом называется интеграл ∫ ∞ ∞ − = dx t x W t ) , ( ) ( ξ Основные формулы для математического ожидания Если F X (x) – функция распределения случайной величины, то её математическое ожидание задаётся интегралом Лебега — Стилтьеса: ∫ ∞ ∞ − = ) (x xdF MX X – 11 – Математическое ожидание дискретного распределения Если X – дискретная случайная величина, имеющая распределение , 1, то прямо из определения интеграла Лебега следует, что i i p x X P = = ) ( 1 = ∑ ∞ = i i p ∑ ∞ = = 1 i i i p x MX |