ОТС сборник задач. Общая теория статистики
Скачать 3.61 Mb.
|
Тема 13. Непараметрические методы проверкигипотез и тесноты связиЗАДАЧА 358 По предприятию имеются следующие данные:
ЗАДАЧА 359 Имеются следующие данные выборочного обследования населения региона по двум признакам:
ЗАДАЧА 360 Получено выборочное распределение отношения респондентов к покупке товара «А» в зависимости от пола:
Проверьте существенность связи пола респондентов и отношения к покупке товара « А » и определите степень тесноты этой связи. ЗАДАЧА 361 По региону имеются данные о наличии в 100 колхозах подсобных предприятий и садовых насаждений:
Охарактеризуйте связь наличия подсобных предприятий и садовых насаждений в колхозах (предварительно проверьте соответствие расположения значений одного альтернативного признака значениям другого). ЗАДАЧА 362 В результате обследования населения района получены данные:
Охарактеризуйте связь между семейным положением и наличием сбережений. ЗАДАЧА 363 Определите коэффициенты взаимной сопряженности (ассоциации, контингенции, Чупрова) между числом детей в семье и образованием отца по данным о числе семей:
Исследуйте существенность связи. ЗАДАЧА 364 Определите коэффициент взаимной сопряженности Чупрова между степенью удобренности и урожайности пшеницы по следующим данным:
Проверьте существенность связи, используя критерий « хи–квадрат» с уровнем значимости 0,05. ЗАДАЧА 365 Рассчитайте коэффициенты взаимной сопряженности Чупрова и Крамера по данным об уровне образования и распределения населения по регионам (в порядке развития промышленности). Проверьте существенность связи с помощью критерия «хи-квадрат» при уровне значимости 0,10:
ЗАДАЧА 366 Вычислите коэффициенты корреляции рангов Спирмена, Кэндела между стоимостью основных производственных фондов и фондоотдачей на основе следующих данных (ден. ед.):
2. Определите коэффициент корреляции Фехнера. ЗАДАЧА 367 По десяти городам области известны следующие данные о численности жителей (тыс. чел.) и числе автомобилей на 1000 жителей:
го критерия с уровнем значимости 0,01. ЗАДАЧА 368 Имеются следующие данные по 10 промтоварным магазинам (ден. ед.):
Рассчитайте ранговые коэффициенты корреляции и проверьте их значимость с помощью двухстороннего t – критерия с уровнем значимости 0,05. ЗАДАЧА 369 Определите с помощью коэффициента конкордации тесноту связи между выполнением норм выработки рабочими за месяц, их возрастом, стажем работы и удовлетворенностью работой по следующим выборочным данным:
Проверьте нулевую гипотезу об отсутствии связи между признаками по критерию «хи-квадрат» с уровнем значимости 0,05. ЗАДАЧА 370 Получены мнения трех экспертов о важности пяти факторных признаков, характеризующих потенциальные возможности деятельности правоохранительных органов:
Охарактеризуйте согласованность мнений экспертов, вычислив коэффициент конкордации и оценив его значимость по критерию «хи- квадрат» с уровнем значимости 0,01. Сделайте выводы. ЗАДАЧА 371 Имеются данные ранжирования трех факторных признаков, характеризующих потенциальные возможности и результаты функционирования вузов двумя экспертами:
Оцените согласованность мнений экспертов с помощью коэффициента конкордации и проверьте его существенность с уровнем значимости 0,05. Сделайте выводы. Тема 14. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ИНФОРМАЦИИ В СРЕДЕ WINDOWS Система STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Система состоит из следующих основных компонент: • многофункциональной системы для работы с данными; • мощной графической системы для визуализации данных и результатов статистического анализа; • набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур; • специального инструментария для подготовки отчетов; • встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе. STATISTICA работает с четырьмя различными типами документов, которые соответствуют основным структурным компонентам системы. Это: • электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования; • электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа; • график — документ в специальном графическом формате для визуализации и графического представления численной информации; • отчет — документ в формате RTF (Расширенный текстовой формат) для вывода текстовой и графической информации. В соответствии со стандартами среды Windows каждый тип документа выводится в своем собственном окне в рабочей области системы STATISTICA. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа. Статистический анализ данных может быть проведен пользователем в одном из следующих режимов. • Интерактивный режим работы. В этом случае взаимодействие с системой осуществляется при помощи последовательного выбора различных команд из меню. Этот способ работы применяется обычно на этапе предварительного анализа данных. • Использование макрокоманд. В STATISTICA имеется возможность записи последовательности команд в одну макрокоманду. При этом можно записывать как последовательности нажатий клавиш на клавиатуре, так и движения мыши. Это удобное средство позволяет автоматизировать выполнение часто повторяющихся шагов статистического анализа. • При помощи встроенного командного языка системы STATISTICA (язык SCL — STATISTICA Command Language) пользователь имеет возможность выполнять статистическую обработку данных в пакетном режиме. Кроме того, имеется возможность установить соответствие между этой программой и ярлыком на рабочем пространстве Windows и запускать ее как обычное Windows приложение. • При помощи встроенного языка STATISTICA BASIC пользователь может написать свои собственные процедуры обработки данных. Это мощный язык, ориентированный на структуру данных системы STATISTICA, содержит большое количество специальных математических и статистических функций (например, операции работы с матрицами — всевозможные разложения матриц, нахождения собственных векторов и собственных значений и др., вычисление всевозможных статистических распределений и т. д.). Статистическая обработка данных в системе STATISTICA обычно состоит из следующих основных шагов: • ввод исходных данных в электронную таблицу системы STATISTICA; • предварительные преобразования данных перед непосредственным применением конкретного статистического метода; • визуализация данных при помощи того или иного типа графиков; • статистический .анализ при помощи некоторого статистического метода; подбор модели и задание необходимых параметров в статистических процедурах; • вывод численных, текстовых и графических результатов, как на рабочее пространство системы, так и в файл с отчетом; • анализ результатов. Данные в STATISTICA организованы в виде электронной таблицы — Spreadsheet. Они могут содержать как численную, так и текстовую информацию. Данные в электронной таблице могут иметь различные форматы, например, даты времени, денежный и научный форматы и др. Электронные таблицы в STATISTICA поддерживают различные типы операций с данными, такие как: операции с использованием буфера обмена Windows; операции с выделенными блоками значений (аналогично MS® Excel®), в том числе и с использованием метода Drag-and-Drop — "Перетащить и опустить"; автозаполнение блоков и т. д. Ввести данные в электронную таблицу можно одним из следующих способов. • Непосредственно ввести их в электронную таблицу с клавиатуры; • Вычислить новые данные на основе уже введенных данных при помощи формул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных математических и статистических функций, допускается использование логических операторов. Для задания сложных процедур преобразования данных можно воспользоваться встроенным языком STATISTICA BASIC; • Воспользоваться данными, подготовленными в другом приложении. Для более сложных процедур обработки исходных данных в STATISTICA существует ряд специализированных инструментов. Это, прежде всего: • специализированный модуль Data Managment — Управление данными, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.); • встроенный язык STATISTICA BASIC, который непосредственно ориентирован на структуру данных системы STATISTICA и при помощи которого можно самостоятельно написать сложные процедуры задания и преобразования исходных данных; • STATISTICA Megafile Manager — Менеджер мегафайлов — специальная система управления базами данных для обработки больших массивов данных и данных, которые содержат длинные текстовые значения. В Менеджер мегафайлов включены также простейшие средства статистической обработки данных. Он может быть использован для предварительной обработки данных перед их вводом в электронную таблицу системы STATISTICA. Система STATISTICA обладает широкими графическими возможностями. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах; координат, специализированные статистические графики — гистограммы, матричные, категоризованные графики и др.). В систему STATISTICA включено большое количество инструментов настройки всех компонент графиков. Имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графика. Настроенные атрибуты могут быть сохранены в специальном файле и потом применяться к другим графикам. Доступ ко всем основным командам настройки реализован при помощи контекстных меню, которые появляются при нажатии на правую кнопку мыши, общего меню и из панели инструментов графика. Графические средства системы STATISTICA доступны в любом статистическом модуле и на любом шаге статистического анализа. Они могут быть использованы в целях: • визуализации численных и текстовых значений непосредственно из электронной таблицы с исходными данными STATISTICA или таблицы Scrollsheet с результатами анализа; • вывода результатов статистического анализа в виде последовательности (очереди) графиков. Визуализация данных является важным этапом статистического анализа. В систему STATISTICA включены удобные инструментальные средства для проведения интерактивного графического анализа данных. При помощи так называемой Кисти, включенной в STATISTICA, вы можете выделить какие-либо точки на построенном графике (например, выбросы значений переменной) и провести дальнейший статистический анализ без значений, которые соответствуют этим точкам. Эти точки могут быть помечены специальным образом, им может быть присвоена метка. Численные значения, соответствующие выделенным точкам на графике, могут быть отмечены в специальной электронной таблице, которая связана с графиком и просмотрены в специальном Редакторе данных графика. STATISTICA содержит удобные инструменты для размещения нескольких графиков и других документов в одном окне. При помощи этих средств можно легко компоновать сложную графическую, текстовую и численную информацию. Более того, STATISTICA полностью поддерживает технологию OLE — Связывание и внедрение объектов (как в режиме сервера, так и в режиме клиента), при помощи которой вы можете внедрять и связывать документы из различных приложений в графический документ STATISTICA и наоборот — вставлять графики из STATISTICA в другие Windows приложения. Графический документ в STATISTICA может быть сохранен как: • графический документ в специальном графическом формате системы STATISTICA (расширение файла *.stg), который может быть открыт позже и использован в процессе анализа; • в графическом растровом формате (расширение файла *.Ьтр, *.рсх); • в графическом формате Windows метафайла (*.wmf). Статистические процедуры системы STATISTICA сгруппированы в нескольких специализированных статистических модулях. В каждом модуле вы можете выполнить определенный способ обработки, не обращаясь к процедурам из других модулей. |