Главная страница

ОТС сборник задач. Общая теория статистики


Скачать 3.61 Mb.
НазваниеОбщая теория статистики
АнкорОТС сборник задач.doc
Дата26.04.2017
Размер3.61 Mb.
Формат файлаdoc
Имя файлаОТС сборник задач.doc
ТипСборник задач
#5517
страница29 из 34
1   ...   26   27   28   29   30   31   32   33   34

Тема 13. Непараметрические методы проверки

гипотез и тесноты связи



ЗАДАЧА 358

По предприятию имеются следующие данные:


Группы

рабочих

Число рабочих в группе

выполнивших и

перевыполнивших норму

выработки

не выполнивших

норму выработки

всего


Прошедшие техническое

обучение

Не прошедшие

технического обучения


115
15


20
50


135
65

Итого

130

70

200




  1. Проверьте существенность связи между выполнением норм выработки и технической подготовкой рабочих, используя критерий «хи-квадрат» с уровнем значимости 0,01.

  2. Установите степень тесноты этой связи, используя коэффициент: а) ассоциации; б) контингенции.



ЗАДАЧА 359

Имеются следующие данные выборочного обследования населения региона по двум признакам:


Тип поселения

Образование


высшее и среднее

начальное и ниже

итого

Городское


10,76

45,34

56,10

Сельское

5,10

109,40

114,50

Итого

15,86

154,74

170,60




  1. Проверьте существенность связи между типом поселения и уровнем образования населения, используя критерий «хи–квадрат» с уровнем значимости 0,05.

  2. Установите степень тесноты связи, используя коэффициент: а) ассоциации; б) контингенции; в) Чупрова.

ЗАДАЧА 360

Получено выборочное распределение отношения респондентов к покупке товара «А» в зависимости от пола:


Отношение к покупке

Мужчины

Женщины


Купили

Не купили


35

10


15

30


Проверьте существенность связи пола респондентов и отношения к покупке товара « А » и определите степень тесноты этой связи.


ЗАДАЧА 361

По региону имеются данные о наличии в 100 колхозах подсобных предприятий и садовых насаждений:


Наличие подсобных

предприятий

Садовые насаждения

есть

нет

итого

Нет

Есть

32

20

14

34

46

54

Итого

52

48

100


Охарактеризуйте связь наличия подсобных предприятий и садовых насаждений в колхозах (предварительно проверьте соответствие расположения значений одного альтернативного признака значениям другого).

ЗАДАЧА 362

В результате обследования населения района получены данные:


Семейное

положение

Число лиц

имеющих сбережения

не имеющих сбережений

всего

Одинокие

Семейные

120

600

80

200

200

800

Итого

720

280

1000


Охарактеризуйте связь между семейным положением и наличием сбережений.

ЗАДАЧА 363

Определите коэффициенты взаимной сопряженности (ассоциации, контингенции, Чупрова) между числом детей в семье и образованием отца по данным о числе семей:

Уровень образования отца


Число детей в семье

один ребенок

два и более

Среднее и незаконченное среднее
Высшее и незаконченное высшее

100
30

150
20


Исследуйте существенность связи.
ЗАДАЧА 364

Определите коэффициент взаимной сопряженности Чупрова между степенью удобренности и урожайности пшеницы по следующим данным:


Урожайность

Степень удобренности

низкая

средняя

высокая

Итого

Низкая

Средняя

Высокая

5

18

2

14

86

20

1

16

8

20

120

30

Итого

25

120

25

170


Проверьте существенность связи, используя критерий « хи–квадрат» с уровнем значимости 0,05.
ЗАДАЧА 365

Рассчитайте коэффициенты взаимной сопряженности Чупрова и Крамера по данным об уровне образования и распределения населения по регионам (в порядке развития промышленности). Проверьте существенность связи с помощью критерия «хи-квадрат» при уровне значимости 0,10:



Регионы


Уровень образования

высшее

среднее специальное

среднее полное

среднее неполное

итого

Первый

Второй

Третий

Четвертый

Пятый

82

38

71

44

34

29

45

180

59

46

85

81

77

87

66

73

24

73

30

30

269

188

301

220

176

Итого


269

259

396

230

1154


ЗАДАЧА 366

Вычислите коэффициенты корреляции рангов Спирмена, Кэндела между стоимостью основных производственных фондов и фондоотдачей на основе следующих данных (ден. ед.):


№ предприятия

1

2

3

4

5

6

7

8

9

10

Стоимость ОПФ

10,0

13,0

15,2

19,3

22,6

26,6

27,0

30,0

34,0

36,6

Фондоотдача

0,80

0,82

0,81

0,85

0,83

0,88

0,87

0,91

0,95

0,98




  1. Проверьте их значимость с помощью одностороннего критерия с уровнем значимости 0,05.

2. Определите коэффициент корреляции Фехнера.

ЗАДАЧА 367

По десяти городам области известны следующие данные о численности жителей (тыс. чел.) и числе автомобилей на 1000 жителей:


Население

60

70

80

90

100

130

150

250

310

520

Автомобили

8

10

14

10

15

13

14

15

16

15




  1. Вычислите: а) коэффициент корреляции Спирмена; б) коэффициент корреляции Фехнера.

  2. Проверьте значимость коэффициента Спирмена с помощью односторонне

го критерия с уровнем значимости 0,01.

ЗАДАЧА 368

Имеются следующие данные по 10 промтоварным магазинам (ден. ед.):

Товарооборот


670

560

580

630

610

650

520

500

560

470

Издержки

обращения


35


27


30


40


36


31


28


30


24


70


Рассчитайте ранговые коэффициенты корреляции и проверьте их значимость с помощью двухстороннего t – критерия с уровнем значимости 0,05.


ЗАДАЧА 369

Определите с помощью коэффициента конкордации тесноту связи между выполнением норм выработки рабочими за месяц, их возрастом, стажем работы и удовлетворенностью работой по следующим выборочным данным:



Рабочие

Выполнение норм выработки, %

Возраст,

лет

Стаж

работы, лет

Удовлетворенность работой

1

2

3

4

5

6

110

95

100

120

105

102

40

21

25

45

40

30

18

1

2

6

5

4

Удовлетворен

Скорее неудовлетворен

Удовлетворен

Удовлетворен

Скорее удовлетворен

Безразлично

Рабочие

Выполнение норм выработки, %

Возраст,

лет

Стаж

работы, лет

Удовлетворенность работой

7

8

9

10

11

90

97

102

95

100

26

24

25

32

36

3

1

2

4

8

Скорее неудовлетворен

Безразлично

Скорее удовлетворен

Неудовлетворен

Безразлично


Проверьте нулевую гипотезу об отсутствии связи между признаками по критерию «хи-квадрат» с уровнем значимости 0,05.
ЗАДАЧА 370

Получены мнения трех экспертов о важности пяти факторных признаков, характеризующих потенциальные возможности деятельности правоохранительных органов:


Факторные признаки

Ранги, установленные экспертами

первым

вторым

третьим

Х 1 - финансовая обеспеченность

Х 2 - материальная база

Х 3 - специальная техническая оснащенность

Х 4 - компьютеризация

Х 5 - кадровая обеспеченность

2

4

3

5

1

3

5

2

4

1

2

4

1

5

3


Охарактеризуйте согласованность мнений экспертов, вычислив коэффициент конкордации и оценив его значимость по критерию «хи- квадрат» с уровнем значимости 0,01. Сделайте выводы.
ЗАДАЧА 371

Имеются данные ранжирования трех факторных признаков, характеризующих потенциальные возможности и результаты функционирования вузов двумя экспертами:


Факторные признаки

Ранги, установленные экспертами

первым

вторым

Материальная и финансовая

обеспеченность

Успеваемость студентов

Результативность НИР


1

2,5

2,5


1

2

3


Оцените согласованность мнений экспертов с помощью коэффициента конкордации и проверьте его существенность с уровнем значимости 0,05. Сделайте выводы.


Тема 14. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ИНФОРМАЦИИ

В СРЕДЕ WINDOWS
Система STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Система состоит из следующих основных компонент:

• многофункциональной системы для работы с данными;

• мощной графической системы для визуализации данных и результатов статистического анализа;

набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;

• специального инструментария для подготовки отчетов;

• встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе.

STATISTICA работает с четырьмя различными типами документов, которые соответствуют основным структурным компонентам системы. Это:

• электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования;

• электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа;

• график — документ в специальном графическом формате для визуализации и графического представления численной информации;

• отчет — документ в формате RTF (Расширенный текстовой формат) для вывода текстовой и графической информации.

В соответствии со стандартами среды Windows каждый тип документа выводится в своем собственном окне в рабочей области системы STATISTICA. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа.

Статистический анализ данных может быть проведен пользователем в одном из следующих режимов.

• Интерактивный режим работы. В этом случае взаимодействие с системой осуществляется при помощи последовательного выбора различных команд из меню. Этот способ работы применяется обычно на этапе предварительного анализа данных.

• Использование макрокоманд. В STATISTICA имеется возможность записи последовательности команд в одну макрокоманду. При этом можно записывать как последовательности нажатий клавиш на клавиатуре, так и движения мыши. Это удобное средство позволяет автоматизировать выполнение часто повторяющихся шагов статистического анализа.

• При помощи встроенного командного языка системы STATISTICA (язык SCL — STATISTICA Command Language) пользователь имеет возможность выполнять статистическую обработку данных в пакетном режиме. Кроме того, имеется возможность установить соответствие между этой программой и ярлыком на рабочем пространстве Windows и запускать ее как обычное Windows приложение.

• При помощи встроенного языка STATISTICA BASIC пользователь может написать свои собственные процедуры обработки данных. Это мощный язык, ориентированный на структуру данных системы STATISTICA, содержит большое количество специальных математических и статистических функций (например, операции работы с матрицами — всевозможные разложения матриц, нахождения собственных векторов и собственных значений и др., вычисление всевозможных статистических распределений и т. д.).

Статистическая обработка данных в системе STATISTICA обычно состоит из следующих основных шагов:

• ввод исходных данных в электронную таблицу системы STATISTICA;

• предварительные преобразования данных перед непосредственным применением конкретного статистического метода;

• визуализация данных при помощи того или иного типа графиков;

• статистический .анализ при помощи некоторого статистического метода; подбор модели и задание необходимых параметров в статистических процедурах;

• вывод численных, текстовых и графических результатов, как на рабочее пространство системы, так и в файл с отчетом;

• анализ результатов.

Данные в STATISTICA организованы в виде электронной таблицы — Spreadsheet. Они могут содержать как численную, так и текстовую информацию. Данные в электронной таблице могут иметь различные форматы, например, даты времени, денежный и научный форматы и др. Электронные таблицы в STATISTICA поддерживают различные типы операций с данными, такие как: операции с использованием буфера обмена Windows; операции с выделенными блоками значений (аналогично MS® Excel®), в том числе и с использованием метода Drag-and-Drop — "Перетащить и опустить"; автозаполнение блоков и т. д.

Ввести данные в электронную таблицу можно одним из следующих способов.

• Непосредственно ввести их в электронную таблицу с клавиатуры;

• Вычислить новые данные на основе уже введенных данных при помощи формул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных математических и статистических функций, допускается использование логических операторов. Для задания сложных процедур преобразования данных можно воспользоваться встроенным языком STATISTICA BASIC;

• Воспользоваться данными, подготовленными в другом приложении.

Для более сложных процедур обработки исходных данных в STATISTICA существует ряд специализированных инструментов. Это, прежде всего:

• специализированный модуль Data Managment — Управление данными, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);

• встроенный язык STATISTICA BASIC, который непосредственно ориентирован на структуру данных системы STATISTICA и при помощи которого можно самостоятельно написать сложные процедуры задания и преобразования исходных данных;

STATISTICA Megafile Manager — Менеджер мегафайлов — специальная система управления базами данных для обработки больших массивов данных и данных, которые содержат длинные текстовые значения. В Менеджер мегафайлов включены также простейшие средства статистической обработки данных. Он может быть использован для предварительной обработки данных перед их вводом в электронную таблицу системы STATISTICA.

Система STATISTICA обладает широкими графическими возможностями. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах; координат, специализированные статистические графики — гистограммы, матричные, категоризованные графики и др.).

В систему STATISTICA включено большое количество инструментов настройки всех компонент графиков. Имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графика. Настроенные атрибуты могут быть сохранены в специальном файле и потом применяться к другим графикам. Доступ ко всем основным командам настройки реализован при помощи контекстных меню, которые появляются при нажатии на правую кнопку мыши, общего меню и из панели инструментов графика.

Графические средства системы STATISTICA доступны в любом статистическом модуле и на любом шаге статистического анализа. Они могут быть использованы в целях:

• визуализации численных и текстовых значений непосредственно из электронной таблицы с исходными данными STATISTICA или таблицы Scrollsheet с результатами анализа;

• вывода результатов статистического анализа в виде последовательности (очереди) графиков.

Визуализация данных является важным этапом статистического анализа. В систему STATISTICA включены удобные инструментальные средства для проведения интерактивного графического анализа данных. При помощи так называемой Кисти, включенной в STATISTICA, вы можете выделить какие-либо точки на построенном графике (например, выбросы значений переменной) и провести дальнейший статистический анализ без значений, которые соответствуют этим точкам. Эти точки могут быть помечены специальным образом, им может быть присвоена метка. Численные значения, соответствующие выделенным точкам на графике, могут быть отмечены в специальной электронной таблице, которая связана с графиком и просмотрены в специальном Редакторе данных графика.

STATISTICA содержит удобные инструменты для размещения нескольких графиков и других документов в одном окне. При помощи этих средств можно легко компоновать сложную графическую, текстовую и численную информацию. Более того, STATISTICA полностью поддерживает технологию OLE — Связывание и внедрение объектов (как в режиме сервера, так и в режиме клиента), при помощи которой вы можете внедрять и связывать документы из различных приложений в графический документ STATISTICA и наоборот — вставлять графики из STATISTICA в другие Windows приложения. Графический документ в STATISTICA может быть сохранен как:

• графический документ в специальном графическом формате системы STATISTICA (расширение файла *.stg), который может быть открыт позже и использован в процессе анализа;

• в графическом растровом формате (расширение файла *.Ьтр, *.рсх);

• в графическом формате Windows метафайла (*.wmf).

Статистические процедуры системы STATISTICA сгруппированы в нескольких специализированных статистических модулях. В каждом модуле вы можете выполнить определенный способ обработки, не обращаясь к процедурам из других модулей.
1   ...   26   27   28   29   30   31   32   33   34


написать администратору сайта