Лабораторная работа №1 «Моделирование случайных чисел с заданным законом распределения». Лабораторная работа 1 Моделирование случайных чисел с заданным законом распределения
Скачать 3.56 Mb.
|
: , Y s X s Y X Y X n 1 r 0 0 n 1 i y i B где X и Y - выборочные средние для выборок X и Y, а X s 0 и Y s 0 - соответствующие несмещенные выборочные средние 95 квадратические отклонения. r B является точечной оценкой коэффициента корреляции случайных величин и Разумеется, из того, что найденный по выборке 0 r B не следует, что коэффициент корреляции генеральной совокупности 0 r . В связи с этим проверяют гипотезу о равенстве нулю коэффициента корреляции генеральной совокупности (гипотезу о значимости выборочного коэффициента корреляции): Н 0 = {r = 0} против альтернативной гипотезы Н 1 = {r 0}. Если гипотеза Н 0 будет принята, что это будет означать, что выборочный коэффициент корреляции незначим, а величины и некоррелированы, если же будет принята Н 1 , то что выборочный коэффициент корреляции значим, а величины и коррелированы. Предположим, что двумерная генеральная совокупность ( , ) распределена нормально. Тогда, если при проверки гипотезы о значимости выборочного коэффициента корреляции мы получим, что и некорре- лированы, то мы имеем право сделать вывод, что они независимы. Вычисляем значение следующей статистики: B B n r 1 2 n r T ˆ Теорема 6.2 В случае справедливости гипотезы Н 0 при n n T ˆ , где случайная величина ξ имеет распределение Стьюдента с n - 2 степенями свободы. Построим критерий для проверки гипотезы о значимости выборочного коэффициента корреляции: , H , H Y , X 1 0 если если 2 n , 2 / q 1 n 2 n , 2 / q 1 n t T ˆ t T ˆ , где 2 n , 2 / q 1 t - квантиль распределения Стьюдента уровня 1 - q/2 (см. Приложение Б, таблица 2). 96 6.3 Линейная регрессия Пусть наблюдаемая случайная величина зависит от случайной величины ξ. Обозначим через f( x ) , функцию задающую зависимость среднего значения от значений x f x / M Уравнение y = f(x) называется уравнением регрессии. Проведем n экспериментов, в результате которых случайная величина примет последовательно значения n 2 1 X , , X , X , и получим соответствующие значения случайной величины : n 2 1 Y , , Y , Y . Обозначим разницу между Y i , и ее математическим ожиданием i i i i i X f Y X / M Y Обычно предполагают, что i - независимы и распределены нормально с параметрами 0, σ 2 Требуется по значениям n 1 X , , , X и n 1 Y , , Y оценить как можно точнее функцию f (x). Сначала заранее определяют вид функции f (x). Будем предполагать, что f (x) - линейная функция f (x) = ax + b. Оценки неизвестных параметров а и b находят с помощью метода максимального правдоподобия или метода наименьших квадратов, суть которого мы рассмотрим несколько позже. Эти оценки выглядят следующим образом: rM M b , r a Прямая 97 M x r M y называется прямой среднеквадратической регрессии на Величина 2 2 r 1 называется остаточной дисперсией на . Она определяет величину ошибки приближенного равенства b a . Если 1 ± = г , то ошибка равна нулю, а величины и связаны линейной функциональной зависимостью. Теперь, заменяя М( ), М( ), ( ), ( ) и r на их точечные оценки, получаем уравнение выборочной прямой среднеквадратической регрессии на : X x X s Y s r Y y 0 0 B Аналогично получается уравнение выборочной прямой среднеквадратической регрессии на : Y y Y s X s r X x 0 0 B 6.4 Задание к лабораторной работе а) В файле ind-V.txt (V - это номер вашего варианта) в виде матрицы задана выборка (X, Y) из двухмерного распределения. Первый столбец матрицы - значения X, второй столбец - соответствующие значения Y. Проверить гипотезу о независимости случайных величин, представленных выборками X и Y c уровнем значимости q. б) В файле cor-V.txt (V - это номер вашего варианта) находятся выборка (X, Y) из двумерного нормального распределения случайной величины ( , ) . Первый столбец матрицы - значения X, второй столбец - соответствующие значения Y. Найти выборочный коэффициент корреляции. С уровнем значимости q проверить гипотезу о значимости выборочного 98 коэффициента корреляции. Являются ли величины и независимыми? На плоскости Oxy нанести элементы выборки (X, Y) и построить прямую среднеквадратической регрессии на , определить остаточную дисперсию на . Сделать вывод о правомерности описания зависимости ( ) линейной функцией. Варианты заданий 1. а) 0.02 = q ; б) 0.05 = q 2. а) 0.01 = q ; б) 0.04 = q 3. а) 0.04 = q ; б) 0.03 = q 4. а) 0.05 = q ; б) 0.02 = q 5. а) 0.03 = q ; б) 0.02 = q 6. а) 0.01 = q ; б) 0.05 = q 7. а) 0.04 = q ; б) 0.03 = q 8. а) 0.02 = q ; б) 0.04 = q 9. а) 0.05 = q ; б) 0.03 = q 10. а) 0.01 = q ; б) 0.05 = q 11. а) 0.02 = q ; б) 0.04 = q 12. а) 0.04 = q ; б) 0.02 = q 13. а) 0.03 = q ; б) 0.05 = q 14. а) 0.01 = q ; б) 0.03 = q 15. а) 0.02 = q ; б) 0.04 = q 16. а) 0.05 = q ; б) 0.02 = q 17. а) 0.01 = q ; б) 0.05 = q 18. а) 0.04 = q ; б) 0.03 = q 19. а) 0.02 = q ; б) 0.02 = q 20. а) 0.03 = q ; б) 0.02 = q 99 Лабораторная работа №7. Дисперсионный анализ Дисперсионный анализ - это статистический метод, предназначенный для выявления влияния отдельных факторов на результат эксперимента. Суть метода заключается в том, что общая вариация результирующего показателя расчленяется на части, соответствующие совместному и раздельному влиянию различных качественных факторов, и остаточную вариацию, аккумулирующую влияние неучтенных факторов. Статистическое изучение этих частей позволяет делать выводы о том, действительно ли тот или иной качественный фактор оказывает влияние на результирующий показатель. Дисперсионный анализ основан на следующих допущениях: 1) наблюдения результирующего фактора ξ - это нормально распределенная случайная величина с центром распределения m 1 b , , b M , где m 1 b , , b - это m независимых управляющих качественных факторов; 2) дисперсия единичного наблюдения, обусловленная случайными ошибками, постоянна во всех опытах и не зависит от m 1 b , , b По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный дисперсионный анализ. 7.1 Однофакторный дисперсионный анализ Как следует из названия, данным методом исследуется влияние на результирующий признак одного качественного показателя. Пусть в результате эксперимента получено r групп выборочных значений результирующего признака r , , 1 i , n , , 1 j X i ij , соответствующих r значениям качественного фактора; i n - это количество наблюдений для i -го значения качественного фактора r 1 i i n n Пусть r) , 1, = (i a i - групповые средние, а r 1 i i a r 1 a - общее (генеральное) среднее. 100 Будем проверять гипотезу a} = a = = {a = Н r 1 0 о том, что качественный фактор не влияет на результирующий признак против альтернативной гипотезы Н 1 = {Н 0 неверна}. Определим общее и групповые выборочные средние (соответственно X и i X ): r 1 i n 1 j n 1 j ji i i ji i i X n 1 X , X n 1 X Как известно, выборочные групповые средние являются несмещенными и состоятельными оценками средних i a . Представим полную сумму квадратов отклонений результирующего признака от общего среднего в виду двух сумм квадратов отклонений: r 1 i n 1 j r 1 i r 1 i n 1 j 2 1 2 i ji 2 i i 2 ji i i Q Q X X X X n X X Q Сумма 1 Q представляет собой сумму квадратов отклонений групповых средних значений от общего среднего значения ("сумма квадратов между группами"), т.е. вариацию, обусловленную качественным фактором, а сумма 2 Q является суммой квадратов отклонения каждой величины от соответствующего группового среднего значения ("сумма квадратов внутри групп"), т.е. остаточную вариацию, обусловленную случайными отклонениями от групповых средних. Теорема 7.1 В случае справедливости гипотезы 0 Н величина r n / Q 1 r / Q F 2 1 имеет распределение Фишера c r - n 1, - r степенями свободы. Отсюда, для проверки гипотезы 0 Н при уровне значимости q получаем следующий критерий: 101 , H , H X 1 0 если случае противном в F F , r n , 1 r , q 1 На практике для вычисления сумм 1 Q , 2 Q , Q бывает удобнее пользоваться формулами r 1 i 2 r 1 i n 1 j ji i 2 n 1 j ji 1 n X n X Q i i , r 1 i n 1 j r 1 i i 2 n 1 j ji 2 ji 2 i i n X X Q , r 1 i n 1 j 2 r 1 i n 1 j ji 2 ji i i n X X Q Приведем пример. Предположим, на экспертную оценку отправлено 15 видов товара. Каждого вида товара оправлялось по 20 образцов. Оценив каждый образец, эксперт должен был дать среднюю оценку каждому виду товара. Экспертиза проводилась двумя экспертами. Необходимо выяснить, насколько субъективной была эта экспертиза. Экспертные оценки приведены в следующей таблице: Средние оценки экспертов по каждому виду товара Виды товара 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1-й эксперт 4 3,2 4,6 3,8 3,4 3,2 3,5 4,6 3,7 4,1 5 3,3 4 5 4,9 2-й эксперт 3,9 3,9 4,1 4,3 1,9 3,2 2,3 5 4,9 2,7 4,1 5 3,6 4 2,5 На рисунке 7.1 приведен текст программы в среде Mathcad, проверяющей гипотезу о том, что личность эксперта не влияет на оценку товаров. По результатам статистического анализа эта гипотеза была принята. 102 Рисунок 7.1. Проверка гипотезы об отсутствии влияния одного качественного фактора на результирующий показатель 7.2 Двухфакторный дисперсионный анализ В данном случае исследуется наличие или отсутствие влияния на результирующий признак двух качественных показателей. Пусть рассматривается два фактора - A и B. Фактор A может принимать r значений }) A , , {A = (A r 1 а фактор B - s значений }) B , , {B = (B s 1 В результате эксперимента получены выборочные значения результирующего признака s , 1, = k r, , 1, = i , n , 1, = j , Xj ik ik ; ik n - это количество наблюдений при i-м значения качественного фактора A и k-м значении качественного фактора r 1 i s 1 k ik n n B 103 По указанной выборке будем проверять справедливость следующих гипотез: A H - о том, что качественный фактор A не влияет на результирующий признак, B H - о том, что фактор B не влияет на результирующий признак, AB H - о том, что взаимодействие факторов A и B не влияет на результирующий признак. Для этого вводим общее и групповое выборочные средние: ik il n 1 j jik ik ik s 1 k r 1 i n 1 j jik X n 1 X , X n 1 X Вычисляем значения Q, Q 1 , Q 2 , Q 3 , Q 4 по формулам: s 1 k r 1 i n 1 j s 1 k 2 s 1 k ik r 1 i ik 1 2 jik ik X X s 1 n Q , X X Q , s 1 k 2 r 1 i ik r 1 i ik 2 , X X r 1 n Q (7.1) , X X r 1 X s 1 X n Q 2 s 1 k r 1 i s 1 k r 1 i ik ik ik ik 3 s 1 k r 1 i n 1 j 2 ik jik 4 ik X X Q Проверку гипотез проводим по следующему критерию: а) Если rs n , 1 r , q 1 4 1 F rs n Q 1 r / Q , то гипотеза A H отвергается; б) Если rs n , 1 s , q 1 4 2 F rs n Q 1 s / Q ,то гипотеза B H отвергается; в) Если rs n , 1 s 1 r , q 1 4 3 F rs n / Q 1 s 1 r / Q , то гипотеза AB H отвергается (см. Приложение Б, таблица 4). 104 7.3 Задание к лабораторной работе Исследовать влияние на результирующий показатель: а) одного качественного фактора, б) двух качественных факторов. Уровень значимости для проверки гипотез взять равным 0.05 = q Указание: Под буквой б) данные необходимо считывать из текстового файла. Данные в файле располагаются в виде матрицы следующим образом: в 1-м столбце данные соответствуют значениям факторов ) B , (A 1 1 , во 2-м столбце - значениям ) B , (A 1 2 , в 3-м - ) B , (A 2 1 , в 4-м - ) B , (A 2 2 Соответственно, чтобы можно было воспользоваться формулами (7.1), необходимо правильно считать данные из файла, как это сделано, например, в программе, текст которой приведен на рисунке 7.2. Рисунок 7.2. Пример считывания данных из файла Если вы считали данные подобным образом, то в дальнейшем, чтобы обратиться к элементу ik Xj , пользуйтесь записью j k i, ) (X 7.4 Варианты заданий 1. а) Исследовать влияние посещения секций и кружков во внеклассное время на успеваемость школьников. Качественный фактор - количество часов, проводимых школьниками на дополнительных занятиях. Результирующий признак - средние баллы учеников по совокупности предметов за год. Согласно значениям качественного фактора ученики были поделены на 3 группы (по 16, 12 и 10 человек соответственно). Данные о средних баллах школьников приведены в таблице: б) Исследовать влияние на скорость прорастания семян томатов следующих факторов: температуры воздуха (фактор A) и влажности 105 воздуха (фактор B). Значения фактора 1 A = A : A - температура воздуха ниже 22 o , 2 A = A - температура воздуха выше 22°. Значения фактора 1 В = B : B - влажность воздуха ниже 90 процентов, 2 B = B - влажность воздуха выше 90 процентов. Время прорастания семян (в часах) при различных значениях факторов приведено в файле disp- 1.txt. Количество часов Т, проводимое на дополнительных занятиях Средний балл за год X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i X 16i T=0 3,74 3,35 4,48 5,00 3,93 3,88 3,40 4,10 4,21 3,81 4,64 4,58 3,99 3,72 2,97 3,70 0 T>3 2,55 4,03 3,48 3,46 3,74 3,35 3,87 3,26 4,65 2,34 2. а) Исследовать влияние поведения цены за барель нефти на курс акций некоторого предприятия. Результирующий признак - цена акции предприятия. Согласно значениям качественного фактора (поведения цены на нефть) данные были поделены на 3 группы (по 15, 14 и 13 значений соответственно). Данные о курсе акций предприятия приведены в следующей таблице: Поведение цены на нефть Курс акции X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i цена растет 106,12 97,22 99,55 100,07 99,13 98,98 98,13 102,12 99,55 105,00 100,18 101,60 96,35 99,35 100,60 цена стабильна 97,96 102,12 102,07 103,75 98,46 100,92 98,84 99,50 103,10 103,64 96,82 100,98 95,11 98,55 цена падает 100,58 97,99 101,65 101,45 100,41 99,83 99,04 100,81 96,69 100,46 100,73 101,11 101,22 б) Исследовать влияние на успеваемость студентов по физике следующих факторов: посещаемости лекционных занятий (фактор A) и активности при работе на практических занятиях (фактор B).Значения фактора 1 A = A : A - посещаемость ниже 60 процентов, 2 A = A - посещаемость ниже 60 процентов. Значения фактора 1 В = B : B - низкая активность, 2 B = B - высокая активность. Средние баллы студентов по физике за 4 семестра при различных значениях факторов приведены в файле disp-2.txt. 3. а) Исследовать влияние на урожайность огурцов уровня влажности воздуха в теплице. Результирующий признак - количество килограммов огурцов, собранных с одного куста за сезон. Согласно значениям качественного фактора данные были поделены на 3 группы (по 16, 14 и 15 значений соответственно). Данные об урожайности огурцов приведены в таблице 106 Влажность воздуха Урожай с одного куста огурцов X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i X 16i низкая 19,84 18,64 19,90 22,47 20,72 21,45 24,50 21,95 17,92 22,05 20,75 20,52 20,04 19,12 20,27 23,99 средняя 18,20 19,96 23,91 18,51 23,05 17,24 20,69 19,34 17,64 17,81 20,57 24,69 16,08 17,03 высокая 20,05 20,74 21,82 20,39 18,33 22,59 18,53 21,82 19,74 23,85 20,90 18,71 17,68 18,22 21,25 б) Исследовать влияние на размер выпускаемой на заводе детали следующих факторов: станка, на котором производится деталь (фактор A) и рабочего, изготавливающего деталь (фактор B). Значения фактора 1 A = A : A - 1-й станок, 2 A = A - 2-й станок. Значения фактора 1 В = B : B - 1 -й рабочий, 2 B = B - 2-й рабочий. Размеры получаемых деталей (в миллиметрах) при различных значениях факторов приведены в файле disp-3.txt. Сезон Количество потребленной энергии X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i зима 255,95 295,30 324,45 292,69 278,12 291,27 290,55 305,73 330,64 269,81, 329,45 283,01 298,33 314,13 327,66 лето 319,14 274,65 325,24 288,73 309,48 326,89 320,48 314,63 293,57 314,86 275,53 329,28 287,35 304,11 межсезонье 301,13 331,65 330,68 318,07 335,80 338,58 332,63 307,37 343,26 308,51 352,80 315,01 334,53 280,54 364,32 4. а) Исследовать влияние фактора сезонности на среднее за сезон количество потребляемой энергии семьей из 3-х человек. Согласно значениям качественного фактора данные были поделены на 3 группы (по 15, 14 и 15 значений соответственно). Данные о количестве потребленной энергии (в кВт) приведены в таблице б) Исследовать влияние на всхожесть семян следующих факторов: свежести семян (фактор A) и освещенности теплицы (фактор B). Значения фактора 1 A = A : A - свежие семена (прошлого урожая), 2 A = A - не свежие семена. Значения фактора 1 В = B : B - хорошая освещенность, 2 B = B - плохая освещенность. Доли взошедших семян из каждой пачки приведены в файле disp-4.txt. 5 а) Исследовать влияние уровня кислотности почвы на урожайность свеклы. Согласно значениям качественного фактора данные были поделены на 3 группы (по 13, 14 и 15 значений соответственно). Данные о среднем урожае свеклы с 1 Га земли для каждого хозяйства приведены в таблице 107 б) Исследовать влияние на заболеваемость гриппом и ОРЗ следующих факторов: количества времени, выделяемых человеком на сон (фактор A) и регулярность занятий спортом (фактор B). Значения фактора 1 A = A : A - сон менее 8 часов в сутки, 2 A = A - сон более 8 часов. Значения фактора 1 В = B : B - занятие спортом не реже 1 раза в неделю, 2 B = B - реже 1 раза в неделю. Исследования проводились в нескольких городах. Данные о том, сколько раз в среднем болеет за год житель каждого города приведены в файле disp-5.txt. 6 а) Исследовать влияние времени суток на количество вызовов скорой помощи. Анализ проводился в 15 городах с примерно одинаковой численностью населения в течение года. Данные о среднем количестве вызовов бригад скорой помощи в каждом городе приведены в таблице Время суток Среднее число вызовов скорой помощи за указанный период X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 8.00- 16.00 62,98 89,72 86,03 95,21 91,80 88,17 73,01 81,72 85,98 81,28 91,88 91,29 70,46 49,99 85,75 16.00- 24.00 94,45 95,84 91,08 82,14 97,79 100,08 96,74 103,86 105,55 112,58 81,53 125,17 110,20 99,24 95,50 0.00-8.00 132,64 133,18 132,43 141,26 135,21 127,13 133,41 134,68 146,26 133,27 133,86 145,24 132,56 155,29 137,19 б) Исследовать влияние на количество крупных ДТП (с участием более 2-х машин или с наличием пострадавших) следующий факторов: плотности транспортного потока (фактор A) и наличие гололеда (фактор B). Значения фактора 1 A = A : A - плотный транспортный поток, 2 A = A - свободное движение. Значения фактора 1 В = B : B - наличие гололеда, 2 B = B - отсутствие гололеда. Исследования проводились в нескольких городах. Данные о среднем количестве крупных ДТП в час приведены в файле disp- 6.txt. 7 а) Исследовать влияние прослушиваемой водителем музыки на скорость движения автомобиля по незагруженной транспортом трассе. Согласно значениям качественного фактора Вид почвы Средняя урожайность свеклы в 1 Га (в Цт.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i кислая 546,10 594,95 570,20 605,79 565,66 601,77 592,77 598,43 576,24 600,90 579,93 603,81 572,39 щелочная 592,60 615,74 589,76 583,63 584,38 619,75 581,59 577,47 611,24 586,72 609,74 611,95 609,35 602,63 607,07 нормальная 629,24 621,44 611,20 612,20 617,45 630,55 650,25 616,24 625,16 625,03 649,04 641,62 573,71 626,92 108 данные были поделены на 3 группы (по 10, 14 и 15 значений соответственно). Данные о среднем скорости водителей приведены в таблице б) Исследовать влияние на посещаемость человеком кинотеатров следующих факторов: возраста (фактор A) и активности человека как читателя художественной литературы (фактор B). Значения фактора 1 A = A : A - возраст от 18 до 30 лет, 2 A = A - от 31 года. Значения фактора 1 В = B : B - количество прочитанных за год книг 0-3, 2 B = B - более 3-х. Опрос проводился в нескольких кинотеатрах. Данные о том, сколько раз в год в среднем человек посещает кинотеатры, приведены в файле disp-7.txt. 8 а) Исследовать влияние уровня дохода семьи из 4-х человек на количество потребляемого за неделю хлеба. Согласно значениям качественного фактора данные были поделены на 3 группы (по 10, 15 и 11 значений соответственно). Данные о среднем потреблении хлеба (в кг) за неделю приведены в таблице Уровень дохода семьи Среднее количество потребляемого за неделю хлеба (в кг.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i низкий 2,79 3,44 2,72 2,55 2,57 3,55 2,49 2,37 3,31 2,63 средний 3,06 3,02 2,81 2,67 3,05 2,98 2,43 3,30 3,26 3,42 3,31 3,21 2,78 2,86 3,24 высокий 3,30 3,08 2,79 2,82 2,97 3,33 3,88 2,93 3,18 3,18 3,75 б) Исследовать влияние на объем входящего интернет-трафика следующих факторов: отношения пользователя к компьютерным играм (фактор A) и наличия в домашней сети пользователя бесплатных ресурсов (фактор B). Значения фактора 1 A = A : A - пользователь увлекается компьютерными играми, 2 A = A - не увлекается. Значения фактора 1 В = B : B - большой объем бесплатных ресурсов в домашней сети, 2 B = B - бесплатных ресурсов не имеется, либо их мало. Данные о среднем входящем интернет- трафике (в Мб.) приведены в файле disp-8.txt. Вид музыки Средняя скорость автомобиля на трассе X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i классическая 74,75 82,83 88,62 82,04 84,69 93,39 90,19 92,05 76,44 76,95 популярная 100,69 92,44 106,97 98,18 93,56 92,77 94,83 105,58 97,55 100,90 112,62 92,94 100,02 111,08 108,93 рок 104,81 105,32 107,65 109,92 107,38 98,16 88,85 119,11 114,72 93,44 106,44 121,97 101,80 84,69 90,89 109 9 а) Исследовать влияние возраста покупателя на количество покупаемых в магазине глазированных сырков. Согласно значениям качественного фактора данные были поделены на 3 группы (по 12, 15 и 11 значений соответственно). Данные о среднем количестве покупаемых сырков за одно посещение магазина приведены в таблице Возраст покупателя Среднее количество покупаемых за 1 раз глазированных сырков X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i до 25 1,26 1,37 0,99 1,14 1,08 1,21 0,76 0,65 2,52 0,86 0,36 1,38 25-45 3,40 3,07 2,50 2,54 2,56 3,14 2,80 3,65 2,31 3,19 3,22 3,88 2,68 3,28 3,77 старше 45 0,59 2,15 0,98 1,73 0,97 0,88 1,71 0,54 1,44 1,71 2,23 б) Исследовать влияние на склонность к сердечно-сосудистым заболеваниям у людей старше 50 лет следующих факторов: пола пациента (фактор A) и курения (фактор B). Значения фактора 1 A = A : A - пациент - женщина, 2 A = A - пациент - мужчина. Значения фактора 1 В = B : B - пациент курит, 2 B = B - пациент не курит. Данные о среднем количестве инфарктов на 100 человек старше 50 лет приведены в файле disp-9.txt. 10 а) Исследовать влияние климата на количество потребляемых мясных продуктов. Анализ проводился в нескольких регионах. Согласно значениям качественного фактора данные были поделены на 3 группы (по 13, 15 и 9 значений соответственно). Данные о среднем количестве потребляемых в неделю мясных продуктов (в кг.) жителями каждого региона приведены в таблице Климатические условия Среднее количество мяса, употребляемого жителем региона за неделю (в кг.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i северные регионы 0,46 0,52 0,86 0,91 0,54 0,64 0,67 0,74 0,69 0,61 0,65 0,53 0,76 средняя полоса 0,41 0,33 0,41 0,28 0,39 0,36 0,40 0,67 0,39 0,33 0,56 0,61 0,18 0,59 0,23 южные регионы 0,09 0,22 0,27 0,40 0,27 0,06 0,30 0,36 0,42 б) Исследовать влияние на спрос на фотоуслуги следующих факторов: дня недели(фактор A) и времени года (фактор B). Значения фактора 1 A = A : A - рабочий день, 2 A = A - выходной. Значения фактора B : 1 B = B - теплое время года, 2 B = B - холодное время года. Данные о среднем количестве отпечатываемых за день фотографий по нескольким фотолабораториям приведены в файле disp-10.txt. 11 а) Исследовать влияние возраста на продолжительность 110 разговоров по мобильному телефону. Согласно значениям качественного фактора данные были поделены на 3 группы (по 15, 15 и 14 значений соответственно). Данные о средней продолжительности телефонных разговоров в день (в минутах) приведены в таблице Возраст абонента Средняя продолжительность телефонных разговоров в день (в мин.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 16-25 лет 4,91 4,64 4,67 5,05 5,10 4,82 5,33 5,12 5,26 5,10 4,75 5,20 4,77 4,99 4,94 25-45 лет 3,78 4,14 4,02 4,10 4,21 3,99 4,11 4,30 3,67 3,90 4,04 3,95 4,04 4,13 4,05 45-60 лет 1,17 0,81 0,94 1,23 1,00 1,04 0,91 1,23 1,33 0,65 1,38 1,13 1,51 1,03 б) Исследовать влияние на количество потребляемой человеком минеральной воды следующих факторов: образа жизни (фактор A) и пола (фактор B). Значения фактора 1 A = A : A - занимается спортом, 2 A = A - не занимается спортом. Значения фактора 1 В = B : B - мужчина, 2 B = B - женщина. Данные о среднем количестве выпиваемой за неделю минеральной воды (в литрах) приведены в файле disp-11.txt. 12 а) Исследовать объективность судей, оценивавших спортсменов на некотором соревновании. Перед судьями выступало 15 спортсменов, совершивших по 10 подходов. Данные о средних баллах спортсменов (по 6-ти бальной шкале) приведены в таблице эксперт Средние баллы спортсменов X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 1-й 3,9 4,5 4,0 4,7 3,8 4,4 4,7 4,0 3,8 4,3 4,5 4,5 4,5 4,1 4,0 2-й 4,8 3,9 4,4 4,7 4,5 3,9 4,1 4,7 4,8 4,6 4,2 3,8 4,7 4,8 3,6 3-й 5,2 3,9 5,1 4,1 4,7 4,0 4,6 4,9 4,5 4,5 5,1 4,9 4,4 4,4 4,9 б) Исследовать влияние на заболеваемость ОРЗ следующих факторов: как человек провел летний отпуск (фактор A) и принимает ли он витаминные комплексы (фактор B). Значения фактора 1 A = A : A - совершил длительный выезд на природу/отдыхал на курорте, 2 A = A - провел отпуск дома. Значения фактора 1 В = B : B - принимает витаминные комплексы, 2 B = B - не принимает. Данные о среднем количестве перенесенных за год ОРЗ приведены в файле disp-12.txt. 13 а) Исследовать влияние "возраста" йогурта на содержание 111 в нем молочнокислых бактерий. Согласно значениям качественного фактора данные были поделены на 3 группы (по 15, 13 и 13 значений соответственно). Данные о среднем содержании молочнокислых бактерий в 1 г. йогурта (в 10 6 КОЕ) приведены в таблице Возраст йогурта Содержание молочнокислых бактерий (в 10 6 КОЕ) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 1/3 от срока годности 22,04 21,99 22,08 21,92 22,10 21,92 21,98 22,21 21,99 22,11 21,94 22,09 22,02 22,05 22,00 2/3 от срока годности 16,09 15,94 15,89 16,14 16,16 15,93 16,09 15,95 15,95 16,09 15,89 16,06 15,94 конец срока годности 9,98 10,10 9,93 10,10 9,68 9,88 10,02 10,08 10,09 10,12 10,05 9,96 10,31 б) Исследовать влияние на срок службы стиральных машин следующих факторов: жесткости воды (фактор A) и используемое число оборотов центрифуги (фактор B). Значения фактора 1 A = A : A - жесткая вода, 2 A = A - ph нейтральная или мягкая вода. Значения фактора 1 В = B : B - 1000 оборотов, 2 B = B - 800 оборотов. Данные о средней продолжительности работы стиральных машин некоторой марки (в часах) приведены в файле disp-13.txt. 14. а) Исследовать влияние вида применяемых удобрений на содержание калия в фасоли. Согласно значениям качественного фактора данные были поделены на 3 группы (по 12, 11 и 13 значений соответственно). Данные о среднем калия в фасоли (в мг. на 100 г.) приведены в таблице б) Исследовать влияние на количество детей у женщин следующих факторов: места проживания (фактор A) и наличия высшего образования (фактор B). Значения фактора 1 A = A : A - сельская местность, 2 A = A - город. Значения фактора 1 В = B : B - есть высшее образование, 2 B = B - высшего образования нет. Данные были собраны по 30 сельским пунктам и 30 городам. Данные о среднем количестве детей у женщин 40 лет приведены в файле disp- 14.txt. 14 а) Исследовать влияние года обучения студента в ВУЗе на Вид удобрения Среднее содержание калия в фасоли (в мг. на 100 г.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i 1 1062,1 1059,3 1059,7 1061,3 1060,3 1060,6 1058,3 1059,7 1059,1 1060,8 1060,8 1059,0 2 1062,9 1061,9 1059,2 1060,7 1060,1 1061,1 1059,7 1060,1 1058,4 1061,5 1057,9 3 1059,7 1059,2 1059,0 1058,8 1059,8 1058,5 1061,4 1058,5 1059,3 1059,7 1061,3 1060,2 1059,6 112 посещаемость им лекционных занятий. Согласно значениям качественного фактора данные были поделены на 3 группы - (по 15, 14 и 13 значений соответственно). Данные посещаемости лекционных занятий студентами каждой специальности (в процентах) приведены в таблице Год обучения Средняя посещаемость лекционных занятий (в %) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 1-й 76,32 67,52 70,51 75,23 68,72 66,11 72,25 66,93 72,51 66,23 75,77 73,84 67,83 68,68 66,66 2-й – 3-й 63,06 61,53 58,18 61,09 61,24 63,21 62,58 55,92 56,45 58,92 66,67 63,11 63,02 62,15 4-й – 5-й 51,82 49,86 48,87 51,81 54,51 58,69 48,14 52,42 53,48 53,23 57,99 54,53 55,78 б) Исследовать влияние на курс акций некоторого предприятия следующих факторов: поведения курса акций предприятия A (фактор A) и поведения курса акций предприятия Б (фактор B). Значения фактора 1 A = A : A - курс растет, 2 A = A - курс падает. Значения фактора 1 В = B : B - курс растет, 2 B = B - курс падает. Данные о цене акции изучаемого предприятия приведены в файле disp-15.txt. 15 а) Исследовать влияние сорта яблок на содержание в них железа. Согласно значениям качественного фактора данные были поделены на 3 группы - (по 15, 13 и 15 значений соответственно). Данные о содержание железа в яблоках (в мг. на 100 г.) приведены в таблице Сорт яблок Содержание железа в разных сортах яблок (в мг. на 100 г.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i сорт «А» 2,51 2,51 2,50 2,50 2,50 2,50 2,50 2,49 2,53 2,50 2,49 2,51 2,50 2,49 2,49 сорт «Б» 2,46 2,45 2,44 2,44 2,44 2,45 2,45 2,46 2,44 2,45 2,45 2,47 2,44 сорт «С» 2,38 2,41 2,39 2,40 2,39 2,40 2,38 2,40 2,40 2,40 2,41 2,39 2,40 2,40 2,40 б) Исследовать влияние на урожайность пшеницы следующих факторов: количества осадков за сезон (фактор A) и давность содержания земли "под паром"(фактор В). Значения фактора 1 A = A : A - количество осадков выше нормы, 2 A = A - количество осадком ниже нормы. Значения фактора 1 В = B : B - в прошлом году земля находилась "под паром", 2 B = B - не находилась. Данные об урожайности пшеницы (в ц. с Га) приведены в файле disp-16.txt. 16 а) Исследовать влияние возраста покупателя на то, сколько денег он тратит на покупку мясной продукции в магазине. Согласно значениям качественного фактора данные были поделены 113 на 3 группы (по 12, 15 и 13 значений соответственно). Данные о среднем количестве средств, потраченных покупателями магазина на мясную продукцию за 1 посещение, приведены в таблице Возраст Средние затраты покупателей на мясную продукцию за 1 посещение (в руб) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 18-25 159 158 139 146 166 150 147 145 154 155 149 151 25-40 145 162 177 151 168 159 149 167 163 151 141 150 147 156 150 cтарше40 74 89 88 77 62 87 53 78 66 72 74 78 83 б) Исследовать влияние на успеваемость школьников по биологии следующих факторов: участия в олимпиадах (фактор A) и прохождения летней практики на школьном приусадебном участке(фактор В). Значения фактора 1 A = A : A - принимал участие в олимпиадах, 2 A = A не принимал. Значения фактора 1 В = B : B - проходил практику на приусадебном участке, 2 B = B - не проходил. Данные средней оценке школьников за 2 года приведены в файле disp-17.txt. 17 а) Исследовать объективность экспертов, оценивавших качество "Докторской" колбасы от разных производителей. На экспертизу было представлено по 10 образцов колбасы от 15 производителей. Данные о средних баллах, выставленных экспертами каждому производителю (по 10-ти бальной шкале), приведены в таблице Эксперт Средние оценки, выставленные «Докторской» колбасе от 15 пользователей X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i 1-й 7,0 6,4 7,4 6,3 6,0 7,7 5,4 6,5 6,4 6,7 7,6 7,7 6,2 5,8 6,4 2-й 5,9 7,7 7,1 7,5 8,1 7,0 7,6 8,5 5,4 6,5 7,2 6,8 7,2 7,7 7,2 3-й 8,5 4,1 7,3 6,6 7,6 8,1 6,7 8,1 5,1 9,2 8,5 7,1 7,1 5,4 5,7 б) Исследовать влияние на формирование цены на товар "C" следующих факторов: изменение спроса на товар "А" (фактор A) и изменение спроса на товар "В" (фактор В). Значения фактора 1 A = A : A - спрос растет, 2 A = A - спрос падает. Значения фактора 1 В = B : B - спрос растет, 2 B = B - спрос падает. Данные о средней цене на товар "С" по городу (в руб.) приведены в файле disp-18.txt. 18 а) Исследовать влияние сорта томатов на содержание в нем витамина С. Согласно значениям качественного фактора данные были поделены на 3 группы (по 15, 14 и 13 значений соответственно). Данные о среднем содержании витамина С в томатах (в мг. на 100 г.) приведены в таблице 114 б) Исследовать влияние на склонность к инфекционным заболеваниям у детей следующих факторов: пола ребенка (фактор A) и употребления витаминных комплексов (фактор В). Значения фактора 1 A = A : A - девочка, 2 A = A - мальчик. Значения фактора 1 В = B : B - ребенок принимает витаминные комплексы, 2 B = B - не принимает. Данные о среднем количестве перенесенных ребенком инфекционных заболеваний за год приведены в файле disp-19.txt. 19 а) Исследовать влияние поведения атмосферного давления на количество вызовов скорой помощи. Анализ проводился в 15 городах с примерно одинаковой численностью населения в течение года. Данные о среднем количестве вызовов бригад скорой помощи (в день) в каждом городе приведены в таблице атм.давление Среднее число вызовов скорой помощи в день X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i падает 97,2 97,9 95,5 91,1 98,9 100,0 98,4 101,9 102,8 106,3 90,8 112,6 105,1 99,6 97,8 стабильно 86,5 76,7 88,7 84,9 80,8 82,5 79,2 82,5 90,9 84,3 89,6 89,5 82,3 78,0 79,5 растет 102,2 94,6 98,5 95,8 95,7 100,5 101,6 97,6 106,4 96,1 106,3 98,0 95,6 97,7 102,7 б) Исследовать влияние на продолжительность исходящих звонков с сотового телефона следующих факторов: пола абонента(фактор A) и количество отправляемых абонентом смс в день (фактор В). Значения фактора 1 A = A : A - женский пол, 2 A = A - мужской пол. Значения фактора 1 В = B : B - абонент отправляет до 5 смс в день, 2 B = B - больше 5 смс в день. Данные о средней продолжительности одного разговора абонента по исходящей связи приведены в файле disp-20.txt. Сорт томатов Содержание витамина С в томатах (в мг. на 100 г.) X 1i X 2i X 3i X 4i X 5i X 6i X 7i X 8i X 9i X 10i X 11i X 12i X 13i X 14i X 15i сорт «А» 34,93 34,81 35,54 34,04 35,34 34,87 34,99 35,30 34,38 34,74 35,03 34,82 35,21 34,14 35,56 сорт «В» 34,06 35,42 34,73 35,72 34,60 35,60 35,35 35,51 34,90 35,58 35,00 35,66 34,79 34,76 сорт «С» 35,34 35,06 34,31 34,98 35,17 35,73 35,13 34,73 35,10 35,41 35,26 34,31 35,14 |