Математика. Лекция 1 Множества и отображения
Скачать 6.9 Mb.
|
Свойства коэффициента корреляции: 1. 2. Если = 1, то зависимость между признаками Х и У является функциональной 3. Если = 0, то признаки Х и У не связаны линейной корреляционной зависимостью, но зависимость может иметь криволинейный характер. С увеличением связь между признаками Х и У становится теснее. При - зависимость между признаками слабая, при - средняя, при - сильная. Если положителен, то связь между признаками прямая, если отрицателен – обратная. Коэффициент корреляции вычисляется по формуле Простейшим визуальным способом выявить наличие взаимосвязи между количественными переменными является построение диаграммы рассеяния. Это график, на котором по горизонтальной оси (X) откладывается одна переменная, по вертикальной (Y) другая. Каждому объекту на диаграмме соответствует точка, координаты которой равняются значениям пары выбранных для анализа переменных. Выборочной линией регрессии Y на X называется график функции Пример Если при x 1 =2 величина Y приняла значения y 1 =5, y 2 =6, y 3 =10, то условное среднее y x =(5+6+10)/3. Выборочным уравнением регрессии Y на X называют уравнение вида y x =f(x). Пусть в результате n независимых опытов получены n пар чисел (x 1 ,y 1 ), (x 2 ,y 2 ),…, (x n ,y n ). Так как различные значения признака х и соответствующие им значения признака у наблюдались по одному разу, то нет надобности группировать данные и использовать понятие условной средней. Представим одну из величин как функцию другой. Для простоты ограничимся приближенным представлением величины Y как линейной функции величины X. Будем искать выборочное уравнение прямой линии регрессии Y на X вида: Угловой коэффициент ρ yx прямой линии регрессии Y на X называют выборочным коэффициентом регрессии. , Параметры ρ xy и b подбираются так, чтобы точки (x 1 ,y 1 ), (x 2 ,y 2 ),…, (x n ,y n ), построенные по данным наблюдений, на плоскости xOy лежали как можно ближе к прямой То есть сумма квадратов отклонений (Y i – y i ) должна быть минимальной. Здесь Y i - вычисленная по уравнению ордината, соответствующая x i , а y i – наблюдаемая ордината, соответствующая x i . В этом состоит сущность метода наименьших квадрато Лекция № 8 В результате 7 независимых измерений некоторой величины х, выполненных с од.точностью, получены опытные данные, приведённые в таблице. Предполагая, что результаты подчинены нормальному закону распределения вероятностей оценить истинное значение величины Х при помощи доверит.интеграла, γ=0,95. Х1 Х2 Х3 Х4 Х5 Х6 Х7 7,6 7,3 8,1 7,7 7,5 7,8 8 1. Находим выборочную дисперсию: 𝑥 в = 1 7 𝑥 𝑖 = 1 7 7,6 + 7,3 + 8,1 + 7,7 + 7,5 + 7,8 + 8 = 7,71 7 𝑖=1 𝐷 в = 1 7 𝑥 𝑖 2 = 0,0771 2. Найдём исправленную выборочную дисперсию: 𝑆 𝑥 2 = 𝑛 𝑛 − 1 𝐷 в = 0,09 3. Найдём исправленное выборочное среднеквадратичное отклонение: 𝑆 = 𝑆 𝑥 2 = 0,3 4. При n=7 и γ=0,95 находим по таблице: 𝑡 γ = 𝑡 0,95 − 7 = 2,45 5. Искомый интервал для истинного значения математического ожидания а физ. вел-ны Х находим по формуле: 𝑥 в − 𝑡 γ 𝑆 𝑛 = 7,71 − 0,28 = 7,43 𝑥 в + 𝑡 γ 𝑆 𝑛 = 7,71 + 0,28 = 7,99 7,34 Пример. Отдел технического контроля проверил n партий однотипных изделий и установил, что число Х нестандартных изделий в одной партии имеет эмпирическое распределение, приведённое в таблице. В одной строке 𝑥 𝑖 – количество нестандартных изделий в одной партии, а в другой строке количество 𝑛 𝑖 партий, содержащих 𝑥 𝑖 нестандартных изделий. Требуется при уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х (число нестандартных изделий в одной партии) распределена по закону Пуассона 1. Находим выборочнуюсреднюю: 𝑥 в = 𝑛 𝑖 𝑥 𝑖 𝑛 𝑖=1 𝑛 = 1 200 0,116 + 1 ∗ 56 + 2 ∗ 22 + 3 ∗ 4 + 4 ∗ 2 = 0,6 2. Следовательно, закон Пуассона 𝑃 𝑛 𝑖 = 𝑃 𝑖,𝑛 = 𝜆 𝑖 𝑒 − λ 𝑖! 𝑃 200 𝑖 = 𝑃 𝑖,200 = 0,6 𝑖 𝑒 − 0,6 𝑖! 𝑃 0 = 𝑃 200 0 = 0,6 0 𝑒 − 0,6 0,1 = 𝑒 −0,6 = 0,9488 𝑃 1 = 𝑃 200 1 = 0,6 1 𝑒 − 0,6 1! = 0,32928 𝑃 2 = 𝑃 200 2 = 0,6 2 𝑒 − 0,6 2! = 0,0987 𝑃 3 = 𝑃 200 3 = 0,6 3 𝑒 − 0,6 3! = 0,0025635 5. Составим расчётную таблицу с учётом объединения малочисленных частот. Результаты запишем i 𝑛 𝑖 𝑖 𝑖 𝑛 𝑖 − 𝑛 𝑖 _ (𝑛 𝑖 − 𝑛 𝑖 _) 2 (𝑛 𝑖 − 𝑛 𝑖 _) 2 𝑛 𝑖 0 116 109,76 6,24 38,9376 0,3548 1 56 65,86 -9,86 97,2156 1,4762 2 22 19,76 2,24 51,0176 0,2519 3 6 4,56 4,44 2,0736 0,4557 Х набл 2 = 2,54 Х набл 2 < Х 2 Нет оснований отвергнуть гипотезу по закону Пуассона Лекция №9 Проверка гипотезы о нормальном распределении генеральной совокупности по закону Пирсона Пример. Используя принцип Пирсона при уравнении значимости α=0,05, проверить согласуется ли гипотеза о нормальном распределении генеральной совокупности Х с эмпирическим распределением. Выборка объема n=200. X i 5 7 9 11 13 15 17 19 21 n 15 26 25 30 26 21 24 20 13 Найдем: I. Выборочное среднее x B = 1 200 𝑥 𝑖 𝑛 𝑖 9 𝑖=1 = 12,63 Выборочная дисперсия Д B = 1 200 𝑥 𝑖 2 𝑛 𝑖 9 𝑖=1 = x B 2 =22,043 Среднее квадратичное отклонение σ B = Д В = 4,695 II. Вычислим теоретические частоты, шагh=2,n=200 Используя формулу 𝑝 𝑖 ′ = 𝑛 σ B ϕ (U i ) U i = 𝑥 𝑖 − x B σ B , ϕ (n) = 1 2𝜋 𝑒 (−𝜙2 2 ) - значения функции приведены в таблице во всех учебниках по т/м. 𝑛 𝑖 ′ = 200∗2 4.695 𝜑 (Ui) = 85, 2 𝜑 (Ui) Составим расчетную таблицу i n i x i U i = 𝑥 𝑖 − x B σ B 𝜑 (Ui) 𝑛 𝑖 ′ n i − 𝑛 𝑖 ′ (n i − 𝑛 𝑖 ′ ) 2 𝑛 𝑖 − 𝑛 𝑖 ′ 2 𝑛 𝑖 ′ 1 15 5 -1,62 0,1074 9,1 5,9 34,81 3,8 2 26 7 -1,20 0,1942 16,5 9,5 95,25 5,5 3 25 9 -0,77 0,2966 25,3 -0,3 0,09 0,0 4 30 11 -0,35 0,3752 32,0 -2,0 4,00 0,1 5 26 13 0,08 0,3972 33,9 -7,9 62,41 1,8 6 21 15 0,51 0,3503 29,8 -8,8 78,44 2,6 7 24 17 0,93 0,2589 22,0 2,0 4,00 2,0 8 20 19 1,36 0,1582 13,5 6,5 42,25 3,1 9 13 21 1,78 0,0818 7,0 6,0 36,00 5,1 =200 χ набл 2 = 22,2 Наименьшее наблюдаемое значение критерия Пирсона χ набл 2 = 22,2 По теореме критических точек распределения χ 2 (приложение) по уравнению значений α=0,05 и числу степеней свободыk= s-1-r, где r–число параметров, оцениваемых по выборке Нормальное распределение определяется 2 параметрами: 1. Мат. Ожидаем a 2. Средним квадратичным отклонением σ Таким образом, r = 2 (выборочное среднее и выборочное среднее квадратичное отклонение), s = 9 (число гр. выборки). K=9-1-2=6 И находим критическую точку правосторонней критической области χ крит 2 (0,05; 6) = 12,6 Сравним с наблюдаемой критической точкой. Так как χ набл 2 > χ крит 2 , то гипотеза о нормальном распределении ген. совокупности отвергается. Другими словами, эмпирические и теоретические частоты различаются значительно. |