МЕТОДЫ ПЛАНИРОВАНИЯ. Металлургия Екатеринбург 2015
Скачать 7.01 Mb.
|
СРОТКЛ (число1; число ...) СТАНДОТ- КЛОН.В Оценивает стандартное отклонение по выборке. СТАНДОТКЛОН.В (число1;[число2];…) Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 244 П род о л жени е таблицы. 2 СТАНДОТ- КЛОН.Г Вычисляет стандартное отклонение по генеральной совокупности, заданной аргументами. При этом логические значения и текст игнорируются. СТАНДОТКЛОН.Г (число1;[число2];…) СТАНДОТ- КЛОНА Оценивает стандартное отклонение по выборке. СТАНДОТКЛОНА (значение1;[значение2];…)" СТАНДОТ- КЛОНПА Вычисляет стандартное отклонение по генеральной совокупности, заданной аргументами, которые могут включать текст и логические значения. СТАНДОТКЛОНПА (значение1;[значение2];…) СТЬЮ- ДЕНТ.ОБР Возвращает левостороннее обратное распределение Стьюдента. СТЬЮДЕНТ.ОБР (вероятность;степени_свободы) СТЬЮ- ДЕНТ.ОБР.2Х Возвращает двустороннее обратное распределение Стьюдента. СТЬЮДЕНТ.ОБР.2Х (вероятность;степени_свободы) СТЬЮ- ДЕНТ.РАСП Возвращает левостороннее распределение Стьюдента. СТЬЮДЕНТ.РАСП (x;степени_свободы;интегральная) СТЬЮ- ДЕНТ.РАСП.2Х Возвращает двустороннее распределение Стьюдента. СТЬЮДЕНТ.РАСП.2Х (x;степени_свободы) СТЬЮ- ДЕНТ.РАСП.ПХ Возвращает правостороннее распределение Стьюдента. СТЬЮДЕНТ.РАСП.ПХ (x;степени_свободы) СТЬЮ- ДЕНТ.ТЕСТ Возвращает вероятность, соответствующую тесту Стьюдента. Функция СТЬЮДЕНТ.ТЕСТ позволяет определить вероятность того, что две выборки взяты из генеральных совокупностей, которые имеют одно и тоже среднее. СТЬЮДЕНТ.ТЕСТ (массив1;массив2;хвосты;тип) ТЕНДЕНЦИЯ Определяет предсказанные значения в соответствии с линейным трендом для заданного массива (методом наименьших квадратов) ТЕНДЕНЦИЯ (известные_значения_y; известные значения новые_значения_x; конст) ФИШЕР Возвращает преобразование Фишера для аргумента x ФИШЕР (x) ФИШЕРОБР Возвращает обратное преобразование Фишера ФИШЕРОБР (y) ЧАСТОТА Вычисляет частоту появления значений в интервале значений и возвращает массив цифр ЧАСТОТА (массив_данных; массив_карманов) ЭКСЦЕСС Возвращает эксцесс множества данных ЭКСЦЕСС (число1; число ...) ХИ2.ОБР Возвращает значение, обратное левосторонней вероятности распределения хи-квадрат. ХИ2.ОБР (вероятность;степени_свободы) Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 245 П род о л жени е таблицы. 2 ХИ2.ОБР.ПХ Возвращает значение, обратное правосторонней вероятности распределения хи-квадрат. ХИ2.ОБР.ПХ (вероятность;степени_свободы) ХИ2.РАСП Возвращает распределение хи-квадрат. ХИ2.РАСП (x;степени_свободы;интегральная) ХИ2.РАСП.ПХ Возвращает правостороннюю вероятность распределения хи-квадрат. ХИ2.РАСП.ПХ (x;степени_свободы) ХИ2.ТЕСТ Возвращает критерий независимости. Функция ХИ2.ТЕСТ возвращает значение статистики для распределения хи-квадрат (χ2) и соответствующее число степеней свободы. Критерий χ2 можно использовать для определения того, подтверждается ли гипотеза экспериментом. ХИ2.ТЕСТ (фактический_интервал;ожидаемый_интервал) F.ОБР Возвращает значение, обратное распределению вероятности. F.ОБР (вероятность;степени_свободы1;степени_свободы2) F.ОБР.ПХ Возвращает значение, обратное (правостороннему) распределению вероятности. F.ОБР.ПХ (вероятность;степени_свободы1;степени_свободы 2) F.РАСП Возвращает распределение вероятности. F.РАСП (x;степени_свободы1;степени_свободы2; интегральная) F.РАСП.ПХ Возвращает правый хвост распределения вероятности для двух наборов данных. F.РАСП.ПХ (x;степени_свободы1;степени_свободы2) ТЕСТ Возвращает результат теста, двустороннюю вероятность того, что разница между дисперсиями аргументов "массив" и "массив" несущественна. F.ТЕСТ (массив1;массив2) 7.3. Краткое описание системы STATISTICA STATISTICA — это универсальная компьютерная интегрированная система, предназначенная для статистического анализа и визуализации данных, а также разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике и бизнесе. Отличительной чертой системы STATISTICA является то, что в ней реализован так называемый графически-ориентированный подход к анализу данных. Смысл Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 246 подхода состоит в том, чтобы получать всестороннее визуальное представление данных на всех этапах статистической обработки и на основе этого представления выбирать следующий шаг анализа. Детальное рассмотрение примеров поможет читателю овладеть основными приемами работы в этой системе и успешно использовать ее в своей инженерной практике. Среди возможностей пакета отметим те задачи, с решением которых приходится сталкиваться в своей практической деятельности инженеру-металлургу: описательные статистики, анализ многомерных таблиц, подгонка распределений, многомерная регрессия, нелинейная регрессия, дисперсионный и ковариационный анализ. Для отображения результатов статистической обработки используются разнообразные графики гистограммы, диаграммы рассеяния, круговые диаграммы, вероятностные графики, графики поверхностей и многие другие. Помимо общих статистических и графических средств, в системе имеются специализированные модули, например, для решения инженерно-технических ив частности, промышленных задач карты контроля качества, анализ процессов и планирование эксперимента. Работа со всеми модулями происходит в рамках единого программного пакета, для которого можно выбирать один из нескольких предложенных интерфейсов пользователя. С помощью реализованных в системе STATISTICA мощных языков программирования и языка макрокоманд, снабженных специальными средствами поддержки, пользователь может создать законченные статистические модули (процедуры) и встраивать их враз- личные другие приложения или вычислительные среды. Программа использует стандартный интерфейс электронных таблиц. Предусмотрены возможность обмена данными со всеми популярными СУБД (в том числе си, работа с удаленными базами данных, поддержка технологий OLE, DDE и ODBC. Встроенные графический и текстовый редакторы позволяют публиковать полученные материалы на страницах. 7.3.1. Общая структура системы Система STATISTICA состоит из следующих основных компонент Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА многофункциональной системы для работы сданными, которая включает в себя электронные таблицы (Spreadsheet) для ввода и задания исходных данных, а также специальных таблиц) для вывода численных результатов анализа. Для сложной (специализированной) обработки данных в STATISTICA имеется модульУправление данными Для статистической обработки чрезвычайно больших массивов данных имеется специальный инструментМенеджер мегафайлов, который может быть использован и для предварительной обработки данных перед вводом их непосредственно в электронную таблицу STATISTICA; мощной графической системы для визуализации данных и результатов статистического анализа набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур. В любом конкретном модуле можно выполнить определенный способ статистической обработки, не обращаясь к процедурам из других модулей. Каждый модуль является полноценным WINDOWS приложением. Поэтому пользователь имеет возможность одновременной работы как с одним, таки сне- сколькими модулями. Переключаться между ними можно как между обычными WINDOWS приложениями, например, при помощи комбинации клавиш [ALT]+[TAB] или выбирая их на панели задач. Все основные операции при работе сданными и графические возможности доступны в любом статистическом модуле и на любом шаге анализа специального инструментария для подготовки отчетов. При помощи текстового редактора, встроенного в систему, можно готовить полноценные отчеты. В STATISTICA также имеется возможность автоматического создания отчетов встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе. Все структурные компоненты STATISTICA настолько тесно интегрированы между собой, что разделение на различные компоненты во многом условно и является полезным лишь для изучения системы с методической точки зрения. Система STАТISТIСА работает с четырьмя различными типами Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 248 документов, которые соответствуют основным структурным компонентам системы электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа график — документ в специальном графическом формате для визуализации графического представления численной информации отчет — документ в формате Т (Расширенный текстовой формат для вывода текстовой и графической информации. В соответствии со стандартами среды WINDOWS каждый тип документа выводится в своем собственном окне в рабочей области системы STАТISТIСА. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа. Имеется несколько различных способов работы с системой STАТISТIСА. 7.3.2. Возможные способы взаимодействия с системой Статистический анализ данных может быть проведен пользователем водном из следующих режимов. Интерактивный режим работы. В этом случае взаимодействие с системой осуществляется при помощи последовательного выбора различных команд изменю. Этот способ работы применяется обычно на этапе предварительного анализа данных. Интерактивный режим работы с системой удобен на этапе выбора математической модели явления и метода статистического анализа. После того как выбор сделан, рекомендуется использовать для автоматизации выполнения рутинных задач обработки специальные макрокоманды различных типов и встроенные в систему языки (SCL и STATISTICA BASIC). Использование макрокоманд В системе STATISTICA имеется возможность записи последовательности команд в одну макрокоманду. При этом можно записывать как последовательности нажатий клавиш на клавиатуре, таки движения мыши. Это удобное средство позволяет автоматизировать выполнение часто повторяющихся шагов статистического анализа. Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 249 При помощи встроенного командного языка системы STATISTICA (язык SCL – STATISTICA Command Language) пользователь имеет возможность выполнять статистическую обработку данных в пакетном режиме. При помощи встроенного процедурного языка STATISTICA BASIC пользователь может написать свои собственные процедуры обработки данных. Это мощный язык, ориентированный на структуру данных системы STATISTICA, содержит большое количество специальных математических и статистических функций (например, вычисление всевозможных статистических распределений и т.д.). 7.3.3. Ввод данных Данные в STATISTICA организованы в виде электронной таблицы Они могут содержать как численную, таки текстовую информацию. Данные в электронной таблице могут иметь различные форматы (например, даты, времени и др. Электронные таблицы в STATISTICA поддерживают различные типы операций сданными, такие как операции с использованием буфера обмена WINDOWS, операции с выделенными блоками значений аналогично MS Excel). Ввести данные в электронную таблицу можно одним из следующих способов. Непосредственно ввести их в электронную таблицу с клавиатуры. Для автоматизации ручного ввода данных в STATISTICA имеются развитые инструментальные средства. Вычислить новые данные на основе уже введенных данных при помощи формул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных статистических функций, допускается использование логических операторов. Воспользоваться данными, подготовленными в другом приложении. При этом доступны следующие способы ввода данных из других приложений STATISTICA: операции копирования данных через буфер обмена WINDOWS; импорт данных из наиболее популярных приложений, напри- Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 250 мер электронных таблиц, систем управления базами данных и др использование механизма динамической связи DDE между данными в STATISTICA и другим WINDOWS приложением. В этом случае все изменения данных, внесенные позднее вис- точник (WINDOWS приложение, будут автоматически (динамически) отражены в файле исходных данных для системы STATISTICA. На любом этапе ввода данных система STATISTICA позволяет быстро вычислить основные статистические характеристики данных, отобразить их графически и перейти к статистическому анализу. 7.3.4. Вывод численных и текстовых результатов анализа Численные результаты статистического анализа в системе STATISTICA выводятся в виде специальных электронных таблиц, которые называются таблицами вывода результатов — Scrollsheet. Таблицы могут содержать любую информацию (как численную, таки текстовую) размером от короткой строчки до нескольких мегабайтов. STATISTICA содержит большое количество инструментов для просмотра результатов статистического анализа и их визуализации. Они включают в себя стандартные операции по редактированию таблицы (вставка, удаление, операции над блоками автозапол- нение блоков и др, операции просмотра (подвижные границы столбцов, разделение прокрутки в таблице и др, доступ к основным статистиками графическим возможностям системы STATISTICA. При выводе целого ряда результатов (например, корреляционной матрицы) STATISTICA отмечает значимые коэффициенты корреляции цветом. Пользователь имеет возможность выделить при помощи цвета необходимые значения в таблице Scrollsheet. Если пользователю необходимо провести детальный статистический анализ промежуточных результатов, то можно сохранить таблицу Scrollsheet в формате файла STATISTICA и далее работать с ним, как с обычными данными. Кроме вывода результатов анализа в виде отдельных окон с графиками и таблицами Scrollsheet, в системе имеется возможность Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 251 создания отчета, в окно которого может быть выведена вся эта информация — это документ (в формате RTF), который может содержать любую текстовую или графическую информацию. В STATISTICA имеется возможность автоматического создания отчета, так называемого автоотчета. При этом любая таблица Scrollsheet или график могут автоматически быть направлены в отчет. 7.3.5. Статистические процедуры системы STATISTICA Статистические процедуры системы STATISTICA, как уже было отмечено, сгруппированы в нескольких специализированных статистических модулях (рис. 7.3). Рис. 7.3. Основные статистические модули системы STATISTICA В каждом модуле можно выполнить определенный способ обработки, не обращаясь к процедурам из других модулей. Ниже приводится краткое описание отдельных статистических модулей, знакомство с которыми поможет инженеру-исследователю в его практике для профессиональной обработки, анализа и представ Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 252 ления результатов эксперимента (промышленного, лабораторного, вычислительного и др. Модуль Основные статистики и таблицы (Basic Statistics/Tables) включает в себя следующие группы статистических процедур Описательные статистики (Descriptive statistics). Группа производит вычисление практически всех описательных статистик, среднее арифметическое, выборочную дисперсию, стандартное отклонение, медиану, моду, максимальное и минимальное значения, размах, доверительные интервалы для среднего и многие другие описательные статистики. Здесь же предусмотрен широкий выбор критериев для тестирования нормальности распределения. Практически все описательные статистики могут быть вычислены для данных, разделенных на группы с помощью одной или нескольких группирующих переменных. Имеется возможность интерактивного удаления выбросов на графике, выделение и маркировка необходимых подмножеств на графике, сглаживание данных и другие возможности. Корреляционные матрицы (Correlation matrices). Данная группа включает большое количество средств, позволяющих исследовать зависимости между переменными путем вычисления практически всех общих мер зависимости (коэффициентов корреляции. критерии для зависимых и независимых выборок (t-test for independent and dependent samples). Эта группа процедур позволяет осуществить проверку истинности статистических гипотез относительно наблюдаемых случайных величин путем выполнения специальных тестов. Таблицы частот (Frequency tables). Группа позволяют строить таблицы частот и гистограммы выбранных переменных. При этом значения переменных можно разбивать на классы и группировать произвольным образом. Калькулятор вероятностных распределений (Probability calculator). Данная группа позволяет вычислить характеристики многих стандартных вероятностных распределений нормального, хи-квадрат, Стьюдента, распределения и др. Модуль Множественная регрессия (Multiple regression) включает в себя исчерпывающий набор средств множественной линейной Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 253 и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др) регрессий, позволяющих вычислять неизвестные коэффициенты в заранее заданных пользователем регрессионных моделях. Модуль Нелинейное оценивание (Nonlinear estimation) дает возможность оценить практически любые определенные пользователем нелинейные модели, осуществить подгонку к наблюдаемым данным кривой, по существу, любого типа. Важным преимуществом данного модуля, в отличие от других программ нелинейного оцени- вания, является то, что в нем не накладывается ограничения на размер обрабатываемого файла данных. Оценки коэффициентов нелинейной модели могут быть построены с помощью оценок метода наименьших квадратов, метода максимального правдоподобия или заданной пользователем функции потерь. Пользователь может выбрать одну из нескольких вычислительных процедур квазиньюто- новский метод, симплекс-метод и др. Кроме того, пользователь может сам определить любой тип нелинейной модели, набрав соответствующее уравнение в редакторе системы. Модуль Дисперсионный анализ (ANOVA/MANOVA) дает возможность оценить степень воздействия различных факторов на измеряемые данные и выделить среди них наиболее значимые (существенные. Для проверки основных предположений дисперсионного анализа имеется широкий выбор статистических процедур, в частности критерии Фишера, Кохрена, Бартлета и др. Модуль Факторный анализ (Factor analysis) позволяет проводить факторный анализ, основная цель которого заключается в том, чтобы выделить скрытые общие факторы, те. воздействующие на все параметры объекта, а не на какой-то один параметр или группу. Выделяемые общие факторы определяют связи между наблюдаемыми параметрами объекта. Модуль Непараметрическая статистика и подгонка распределения (Nonparametrics/Distribution) дает возможность сравнить распределение наблюдаемых величин с большим количеством различных теоретических распределений. Имеется возможность подо Глава 7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИНЖЕНЕРНОГО ЭКСПЕРИМЕНТА 254 гнать к данным нормальное, логнормальное, экспоненциальное, хи-квадрат, пуассоновское и др. распределения. Точность подгонки оценивается с помощью различных критериев (хи-квадрат, Колмогорова Смирнова и др. Модуль Анализ временных рядов и прогнозирование (Time Series/Forecasting) позволяет строить модель, описывающую ряд данных, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых доданного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье-анализ ряда и т.д. Модуль также включает процедуры автокорреляционного анализа. Возможности системы STATISTICA далеко не исчерпываются перечисленными выше модулями. Кроме них, система содержит ряд модулей, предназначенных для более детального статистического анализа данных и необходимость в которых на практике возникает крайне редко. |