Главная страница

Методичка к индивидуальному заданию. Широкое внедрение методов математической статистики в теорию и практику конструирования и производства радио и электронной аппаратуры требует от конструкторов и технологов освоения этих методов и умения их применения


Скачать 1.66 Mb.
НазваниеШирокое внедрение методов математической статистики в теорию и практику конструирования и производства радио и электронной аппаратуры требует от конструкторов и технологов освоения этих методов и умения их применения
Дата05.04.2022
Размер1.66 Mb.
Формат файлаdoc
Имя файлаМетодичка к индивидуальному заданию.doc
ТипДокументы
#444146
страница1 из 13
  1   2   3   4   5   6   7   8   9   ...   13



ПРЕДИСЛОВИЕ



Широкое внедрение методов математической статистики в теорию и практику конструирования и производства радио- и электронной аппаратуры требует от конструкторов и технологов освоения этих методов и умения их применения. При этом очень важным является выполнение этапа статистической обработки опытных данных, полученных в результате проведения эксперимента, испытаний изделий и наблюдений за технологическими процессами. Такую обработку можно проводить на ЭВМ и без нее. Но прежде чем использовать ЭВМ, необходимо изучить "механизм" статистической обработки, что можно осуществить только при безмашинной обработке опытных данных. Кроме того, при этом часто удается получить необходимые результаты более оперативно. Естественно, что начальную подготовку по статистической обработке опытных данных будущие инженеры должны получить еще при обучении в институте во время выполнения курсовых и лабораторных работ.

Для этой цели предназначается настоящее учебное пособие, которое оказалось необходимым, несмотря на большое количество литературы, посвященной рассматриваемому вопросу. Представляется целесообразным иметь студенту под рукой краткое пособие, в котором порядок обработки был бы четко систематизирован, проанализирован на примерах, приведены различные способы обработки и имелись бы для необходимых случаев ссылки на литературу.

В пособии рассматривается статистическая обработка опытных данных, относящихся, как правило, к классу непрерывных случайных величин, которые можно описать одномерной функцией распределения.

В пособии не рассматриваются вопросы организации и проведения эксперимента, обработки результатов при малом числе опытов и не приводятся таблицы, необходимые при обработке, а даются ссылки на литературные источники с целью обеспечения возможности читателю расширить свой кругозор.

Пособие не претендует на полноту рассмотрения вопросов статистической обработки опытных данных, но во многих практических случаях приведенный объем действий оказывается вполне достаточным.

Предполагается, что читатель знаком с основами теории вероятностей и математической статистики.

1. ВВЕДЕНИЕ
Прежде чем проводить статистическую обработку опытных данных, необходимо уточнить, какова цель обработки. Это позволит установить минимальный объем действий обработчика. Целями статистической обработки опытных данных могут быть: нахождение закона распределения исследуемой случайной величины, определение числовых характеристик распределения, построение рядов распределения и(или) эмпирических кривых распределений, определение степени связи между исследуемыми случайными величинами и т.д. Достижение поставленных целей зависит от объема выборки. Так, числовые характеристики можно определять для любого количества статистических данных, начиная обычно с десяти. Но для определения закона распределения выборка должна содержать не менее 50 измерений и чем больше, тем лучше. Но в любом случае выборка должна быть случайной, а исследуемая совокупность однородной. Кроме того, должно быть известно, что для наблюдений случайной величины применялись средства измерения с ценой деления, не превышающей 1/5 предполагаемой величины среднего квадратического отклонения исследуемого распределения [1].

При обработке данных эксперимента следует всегда стараться проверить условия применимости (например, нормальности или независимости) статистических процедур. Если это не представляется возможным, то тогда к полученным результатам должно быть осторожное, условное отношение, что, к сожалению, не всегда имеет место.

Статистическая обработка опытных данных рассматривается на ряде примеров. В качестве основного примера взят несколько видоизмененный пример, приведенный в [2].

Необходимо, наконец, отметить, что при пользовании указанной в ссылках литературой следует разобраться, что понимается под тем или иным термином (определением) и какая величина обозначена данной буквой или индексом. Так, одно и то же значение вероятности в таблицах одних источников обозначается через Р, а в других это значение соответствует разности 1-Р. Аналогично, при определении доверительных интервалов одно и то же значение критерия в одних таблицах соответствует уровню значимости , а в других 1-.

В заключение отметим, что приведенный классический метод обработки данных имеет три основных недостатка:

- потеря информации при группировке данных;

- неоднозначность выбора теоретической функции распределения;

- неопределенность при проверке гипотез.

2. ПОРЯДОК СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ОПЫТНЫХ ДАННЫХ
При статистической обработке используются графический и аналитический методы отдельно или в совокупности. Графический метод состоит в определении закона распределения и некоторых его параметров с помощью вероятностных (координатных) сеток (вероятностных бумаг). Аналитический метод состоит в вычислении теоретической кривой распределения и ее параметров.

Порядок обработки зависит от выбранного метода. Графический метод обработки содержит следующие этапы:

построение дискретного ряда распределения;

определение закона распределения по вероятностной бумаге (сетке);

проверка соответствия эмпирического распределения теоретическому по критериям согласия;

определение параметров распределения по вероятностной бумаге (сетке).

В необходимых случаях при этом методе обработки могут быть построены интервальный ряд и эмпирические кривые распределения, определены доверительные границы и интервалы.

Аналитический метод обработки содержит следующие этапы:

построение интервального ряда и эмпирических кривых распределения;

определение числовых характеристик (статистик) эмпирического распределения;

приближенное определение доверительных границ и интервалов;

выбор теоретического распределения;

определение оценок параметров теоретического распределения;

расчет теоретических кривых распределения (дифференциальной и интегральной)

проверка согласия;

уточнение доверительных интервалов.

В процессе обработки могут выполняться также следующие этапы:

исключение грубых ошибок наблюдений;

проверка однородности выборок;

определение коэффициента корреляции и т.п.

Таким образом, в общем случае можно рекомендовать следующий порядок обработки:

исключение грубых ошибок наблюдений;

построение ряда (рядов) распределения;

построение эмпирических кривых распределения;

определение доверительных границ;

выбор теоретического распределения;

проверка правильности выбора теоретического распределения с помощью вероятностных бумаг (сеток) и критериев согласия;

определение числовых характеристик (статистик) эмпирического распределения;

приближенное определение доверительных интервалов для оценок параметров распределения;

определение оценок параметров теоретического распределения;

расчет теоретических кривых распределения;

проверка правильности выбора теоретического распределения с помощью критериев согласия;

уточнение доверительных интервалов;

определение коэффициента корреляции.

В зависимости от цели обработки и выбранного метода выполняются только необходимые этапы приведенного порядка обработки.

Для исключения ошибок и удобства вычислений обработка опытных данных проводится путем обязательного заполнения соответствующих таблиц на всех расчетных этапах.

3. ФОРМЫ ПРЕДСТАВЛЕНИЯ ПЕРВИЧНЫХ ДАННЫХ
Первичные данные, полученные в результате проведения наблюдений, опытов, испытаний и т.д., могут быть представлены в виде простого статистического ряда или в виде вариационного ряда.

Простой статистический ряд представляет собой совокупность (ряд) значений признака (наблюдаемой случайной величины), расположенных в порядке их получения. Обычно это рабочая таблица, в которую заносятся опытные данные (табл.1).Приведенная таблица содержит выборку, полученную при наблюдениях за какой-то случайной величиной.
Таблица 1

№№

Параметр

№№

Параметр

№№

Параметр

№№

Параметр

№№

Параметр

1

850

41

820

81

845

121

820

161

840

2

825

42

835

82

865

122

820

162

815

3

830

43

815

83

870

123

825

163

820

4

825

44

835

84

855

124

820

164

835

5

830

45

840

85

845

125

815

165

840

6

860

46

825

86

825

126

850

166

850

7

855

47

825

87

815

127

850

167

865

8

840

48

845

88

835

128

825

168

870

9

845

49

830

89

850

129

820

169

835

10

830

50

830

90

800

130

835

170

850

11

840

51

835

91

810

131

855

171

845

12

845

52

830

92

835

132

840

172

825

13

835

53

840

93

825

133

835

173

850

14

855

54

840

94

830

134

860

174

845

15

820

55

830

95

835

135

840

175

830

16

850

56

825

96

845

136

840

176

820

17

845

57

805

97

840

137

820

177

810

18

860

58

810

98

810

138

835

178

860

19

840

59

830

99

805

139

835

179

870

20

850

60

855

100

815

140

805

180

835

21

860

61

835

101

840

141

810

181

840

22

805

62

850

102

855

142

845

182

825

23

865

63

845

103

850

143

820

183

850

24

845

64

830

104

840

144

830

184

865

25

830

65

830

105

830

145

855

185

870

26

825

66

855

106

835

146

845

186

815

27

820

67

845

107

850

147

820

187

815

28

860

68

845

108

825

148

830

188

830

29

855

69

855

109

815

149

855

189

830

30

855

70

835

110

825

150

835

190

840

31

865

71

835

111

810

151

835

191

845

32

870

72

840

112

800

152

845

192

860

33

845

73

840

113

835

153

805

193

850

34

830

74

820

114

850

154

825

194

820

35

870

75

840

115

855

155

830

195

870

36

850

76

830

116

840

156

820

196

840

37

840

77

855

117

850

157

830

197

835

38

845

78

860

118

845

158

830

198

830

39

855

79

835

119

820

159

825

199

840

40

865

80

820

120

840

160

820

200

850



Вариационный ряд - это ряд данных, расположенных в порядке возрастания варьирующего признака. При этом одинаковые значения признака не исключаются, а записываются друг за другом. Вариационный ряд может быть представлен в виде таблицы




1

2

3

4

5

...

197

198

199

200

Параметр

800

800

805

805

805

...

870

870

870

870


или построчной записи
800 800 805 805 805

805 805 810 ... ...

...........................

... 870 870 870 870
Приведенный вариационный ряд получен путем обработки данных табл.1. Однако в большинстве случаев первичные данные представляются в виде простого статистического ряда и обычно не имеет смысла строить по ним вариационный ряд.

При проведении некоторых видов испытаний регистрируемые первичные данные сразу образуют вариационный ряд. Например, такая запись имеет место в случае испытаний на надежность, когда регистрируются времена исправной работы изделий в партии. Это время записывается в порядке его возрастания, причем одинаковые значения времен работы нескольких изделий повторяются друг за другом.

4. ИСКЛЮЧЕНИЕ ГРУБЫХ ОШИБОК НАБЛЮДЕНИЙ
Для исключения грубых ошибок наблюдений, искажающих статистические характеристики распределения, необходимо провести оценку резко выделяющихся членов выборки. Для этого используются различные методы. Конечно, прежде всего следует быть уверенным, что резко выделяющиеся члены выборки не являются результатом ошибки, нарушения условий эксперимента. Если такой уверенности нет, то грубые ошибки сразу следует исключить из дальнейшего анализа.

Разработанные методы для оценки резко выделяющихся членов выборки применимы, если известно распределение, которому подчиняются наблюдаемые случайные величины. Их применение при других распределениях может привести к серьезным ошибкам [3]. Это часто не указывается в литературе, где приводятся такие методы. Большинство методов разработано для случаев, когда исследуемые величины подчиняются нормальному распределению. Эти методы (часто они носят название критериев), как правило, требуют предварительного вычисления среднего значения и среднего квадратического отклонения исследуемой величины. Во всех методах рассчитываемая величина сравнивается с критическим значением этой величины, найденным из соответствующих таблиц при выбранном проценте риска. После чего принимается решение о том, является ли резко выделяющееся значение случайной величины грубой ошибкой и его следует отбросить или оно не подлежит исключению из выборки.

Рассмотрим методы (критерии), которые применяются при нормальном распределении исследуемой случайной величины. В литературе приводятся следующие методы (критерии): критерий, основанный на теореме Р.Фишера[4], критерий типа r [4], упрощенные критерии [4], метод Грэббса [5], метод Романовского [5], метод исключения при известной  [6], оценка анормальности результатов измерений при известной генеральной дисперсии [3], метод исключения при неизвестной [6], оценка анормальности результатов измерений при неизвестной генеральной дисперсии [3]. Следует отметить, что в [5] и [6] не указано, что перечисленные методы применимы только при нормальном распределении.

Критерий, основанный на теореме Фишера [4], приведен в одной из работ В.Н.Романовского. В нем рассматривается неравенство

,

где n - число членов выборки;

- резко выделяющийся член выборки;

- среднее значение исследуемой величины, подсчитанное при исключенном резко выделяющемся члене выборки ;


  1   2   3   4   5   6   7   8   9   ...   13


написать администратору сайта