Главная страница
Навигация по странице:

  • Варианты заданий к практическому занятию №3

  • Практическое занятие 3. Ошибки выборки 1 Ошибки регистрации и ошибки репрезентативности


    Скачать 81.05 Kb.
    НазваниеПрактическое занятие 3. Ошибки выборки 1 Ошибки регистрации и ошибки репрезентативности
    Дата27.10.2022
    Размер81.05 Kb.
    Формат файлаdocx
    Имя файлаPraktika_3.docx
    ТипЗанятие
    #758744

    Практическое занятие №3. Ошибки выборки

    3.1 Ошибки регистрации и ошибки репрезентативности


    В результате статистической обработки данных могут возникнуть ошибки наблюдения, получаемые вследствие расхождения между величиной какого-либо показателя, найденного при статистическом наблюдении данных и действительными его размерами. Их еще называют выбросами. Это данные среди исходных результатов измерений (или данные, занесенные в таблицу и полученные из результатов измерений), которые настолько отклоняются от сопоставимых данных, внесенных в ту же самую таблицу, что признаются несовместимыми.

    В зависимости от причин возникновения различаю ошибки регистрации и ошибки репрезентативности.

    Ошибки регистрации возникают в результате неправильного установления фактов или ошибочной записи в процессе наблюдения. Они бывают случайными и систематическими. Случайные ошибки регистрации могут быть допущены как в опрашиваемыми в их ответах, так и регистраторами. Систематические ошибки могут быть и преднамеренными, и непреднамеренными. Преднамеренные ошибки – сознательные, тенденциозные искажения действительного положения дел. Непреднамеренные ошибки могут быть вызваны различными случайными причинами (небрежность, невнимательность).

    Ошибки репрезентативности (представительности) возникают в результате неполного обследования и в случае, если обследуемая совокупность недостаточно полно воспроизводит генеральную совокупность. Они могут быть случайными и систематическими.

    Ошибки репрезентативности присущи выборочному наблюдению и возникают в связи с тем, что выборочная совокупность не полностью воспроизводит генеральную.

    Выборка является репрезентативной (или представительной), если она достаточно полно представлять изучаемые признаки генеральной совокупности. Условием обеспечения репрезентативности выборки являет­ся, согласно закону больших чисел, соблюдение случайности отбора, т.е. все объекты генеральной совокупности должны иметь равные вероятности попасть в выборку.

    Анализ репрезентативности выборки особенно важен на начальном этапе исследований, когда численность генеральной совокупности неизвестна, но известны некоторые параметры опыта, позволяющие оценить репрезентативность.

    Ошибки выборки – разность между характеристиками выборочной и генеральной совокупностей. Для среднего значения определяют предельную ошибку выборки по формуле

    (3.1)

    где

    (3.2)

    N– объем выборки.

    Грубые ошибки и промахи обнаруживают и исключают из расчетов следующим образом:

    • находят среднее арифметическое результата n-кратного измерения величины хi;

    • определяют среднее квадратическое отклонение S; Если базовый элемент ijсодержит лишь два результата измерений, то внутриэлементное расхождение (аналог стандартного отклонения) равно

    (3.3)

    Таким образом, если во всех базовых элементах содержится по два результата измерений, для простоты вместо стандартных отклонений могут быть использованы абсолютные расхождения;

    • вычисляют вспомогательную величину t(S) (табл. 3.1).

    Таблица 3.1 – Значения вспомогательной величины t(S) в зависимости от числа nповторных измерений (степень достоверности 0,95)

    n

    2

    3

    4

    5

    6

    7

    8

    9

    10

    t(S)

    15,56

    4,97

    3,56

    3,04

    2,78

    2,62

    2,51

    2,43

    2,37


    При |хi - |>t(S) результат измерения хiявляется грубой ошибкой, поэтому его исключают из расчетов и среднее значение вычисляют заново для оставшихся достоверных результатов измерения.

    Ошибки (промахи) могут быть исключены из генеральной совокупности с помощью следующего правила:

    • если некоторое измерение xi внушает сомнение в его принадлежности к генеральной совокупности, в этом случае определяется значение и S генеральной совокупности без сомнительных измерений;

    • используя правило Томпсона (критерий Рошера) вычисляется коэффициент k = (xi )/S.

    Если k больше допустимого значения, то делается вывод о том, что xi не принадлежит к генеральной совокупности.

    Значения допустимых k дано в таблице 3.2.

    Таблица 3.2 – Значения допустимых kв зависимости от числа измерений

    Число измерений

    4

    6

    8

    10

    12

    14

    16

    18

    20

    25

    Значение k

    1,49

    1,94

    2,22

    2,41

    2,55

    2,66

    2,75

    2,82

    2,88

    3,01

    В литературе известны также критерии 3s, Граббса (Смирнова) [ГОСТ Р ИСО 5725-2-2002 Точность (правильность и прецизионность) методов и результатов измерений. Часть 2. Основной метод определения повторяемости и воспроизводимости стандартного метода измерений], Шарлье, Шовенэ, Диксона и др., которые позволяют исключить грубые промахи.

    3.2 Критерий Романовского


    Используя критерий Романовского можно определить грубую погрешность в зависимости от числа измерений и уровня значимости α. Для этого необходимо вычислить расчетное значение Vрасч сомнительного результата по формулам:

    (3.4)

    где Vнб, Vнм – соответственно расчетные значения соответствующие наибольшему (хнб) и наименьшему (хнм) значениям сомнительного результата.

    Для принятых значений числа измерений n и уровня значимости α определяется максимально допустимое значение Vдоп по таблице 3.3, которое сравнивается с расчетным. Если Vдоп<Vрасч, то сомнительные значения (хнб, хнм) являются грубыми погрешностями и должны быть исключены из дальнейших рассмотрений.

    Если Vдоп>Vрасч, то хнб и хнм необходимо оставить в данном ряду измерений и учитывать при обработке результатов измерений.

    Таблица 3.3 – Значение критерия Романовского Vдоп в зависимости от числа измерений и уровня значимости 

    Число измерений n

    Уровень значимости 

    0,1

    0,05

    0,025

    0,01

    3

    1,41

    1,41

    1,41

    1,41

    4

    1,65

    1,69

    1,71

    1,72

    5

    1,79

    1,87

    1,92

    1,96

    6

    1,89

    2,00

    2,07

    2,13

    7

    1,97

    2,09

    2,18

    2,27

    8

    2,04

    2,17

    2,27

    2,37

    9

    2,10

    2,24

    2,35

    2,46

    10

    2,15

    2,29

    2,41

    2,54

    11

    2,19

    2,34

    2,47

    2,61

    12

    2,23

    2,39

    2,52

    2,66

    13

    2,26

    2,43

    2,56

    2,71

    14

    2,30

    2,46

    2,60

    2,76

    15

    2,33

    2,49

    2,64

    2,8

    16

    2,35

    2,52

    2,67

    2,84

    17

    2,38

    2,55

    2,70

    2,87

    18

    2,40

    2,58

    2,73

    2,90

    19

    2,43

    2,60

    2,75

    2,93

    20

    2,45

    2,62

    2,78

    2,96

    21

    2,47

    2,64

    2,8.’

    2,98

    22

    2,49

    2,66

    2,82

    3,01

    23

    2,50

    2,68

    2,84

    3,03

    24

    2,52

    2,7

    2,86

    3,05

    25

    2,54

    2,72

    2,88

    3,07


    Пример 3.1. Проверить результат хнб = 17,15 на соответствие грубой погрешности при  =0,05. Выполнено измерений п = 12; разброс значений составил  = 0,03,

    Решение. Рассчитаем критерий Романовского по формуле (3.4):

    Vрасч = (17,15 – 17,00)/0,03 = 5.

    Для заданных  = 0,05 и п = 12 найти по таблице 3 допустимое значение критерия Романовского Vдоп = 2,39. Сравнивая табличное значение с расчетным, получаем 2,39<5, т.е. Vдоп<Vрасч, следовательно, хнб является грубой погрешностью и должно быть исключено из дальнейших рассмотрений.

    3.3 Статистическая обработка экспериментальных данных. Собственно-случайная выборка (простая случайная)


    Выборочное наблюдение относится к разновидности несплошного наблюдения, цель которого – по отобранной части единиц дать характеристику всей совокупности единиц. Необходимо, чтобы отобранная часть была репрезентативна (т.е. представляла всю совокупность единиц).

    Используя теорему Чебышева П.Л. можно вычислить величину , выражающую среднее квадратическое отклонение выборочной средней от математического ожидания:

    , (3.5)

    которую называют средней ошибкой выборки.

    С учетом выбранного уровня вероятности и соответствующего ему значения t (выбирается по табл. 2.5) предельная ошибка выборки составит:

    , (3.6)

    где tα(N-1) – квантиль распределения Стьюдента для вероятности α и числа степеней свободы f = (N-1).

    С учётом (3.5) и (3.6) можно утверждать, что при заданной вероятности генеральная средняя будет находиться в следующих границах:

    (3.7)

    Пример 3.2. Предположим, в результате выборочного обследования жилищных условий жителей города, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 3.4).

    Таблица 3.4 – Результаты выборочного обследования жилищных условий жителей города

    Общая площадь жилищ, приходящаяся на 1 чел., кв. м.

    До 5,0

    5,0…10,0

    10,0…15,0

    15,0…20,0

    20,0…25,0

    25,0…30,0

    30,0 и более

    Число жителей

    8

    95

    204

    207

    210

    130

    83

    Рассмотрим определение границ генеральной средней, в данном случае – средней площади жилищ в расчёте на 1 чел. в целом по городу, опираясь только на результаты выборочного обследования. Для определения средней ошибки выборки нам необходимо, прежде всего, рассчитать выборочную среднюю величину и дисперсию изучаемого признака (табл. 3.5).

    В случае, когда данные сгруппированы по интервалам, т. е. представлены в виде интервальных рядов распределения, при расчёте средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале.

    Таблица 3.5 – Расчёт средней (полезной) площади жилищ, приходящейся на 1 чел., и дисперсии

    Общая (полезная) площадь жилищ,

    приходящаяся на 1 чел., м2

    Число

    жителей mi

    Середина

    интервала xi

    xi·mi



    До 5,0

    5,0 … 10,0

    10,0 … 15,0

    15,0 … 20,0

    20,0 … 25,0

    25,0 … 30,0

    30,0 и более

    8

    95

    204

    270

    210

    130

    83

    2,5

    7,5

    12,5

    17,5

    22,5

    27,5

    32,5

    20,0

    712,5

    2550,0

    4725,0

    4725,0

    3575,0

    2697,5

    50,0

    5343,75

    31875,0

    82687,5

    106312,5

    98312,5

    87668,75

    Итого:

    1000



    19005,0

    412250,0

    Расчёт ведется по формулам:

    (3.8)

    где xi – середина интервала.

    В нашем примере:



    Дисперсию определим по формуле:

    (3.9)

    Тогда получаем:



    Откуда получаем значение выборочного среднего квадратичного отклонения:

    S = 7,16м2.

    Средняя ошибка выборки составит:



    Определим предельную ошибку выборки с вероятностью 0,954 (t=2):

    .

    Установим границы генеральной средней:

    или .

    Таким образом, на основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,5 до 19,5 м2.
    При расчёте средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:

    , (3.10)

    где Nx – генеральная совокупность. Если предположить, что представленные в таблице 6 данные являются результатом 5%-го бесповторного отбора (следовательно, генеральная совокупность включает 20 000 ед.), т.е. средняя ошибка выборки согласно (3.10) будет несколько меньше:

    .

    Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней. Особенно ощутимо влияние поправки на бесповторность отбора при относительно большом проценте выборки.

    Варианты заданий к практическому занятию №3

    Вариант

    в

    хср

    хнб

    сигма

    n

    1

    0,1

    24

    24,48

    0,12

    3

    2

    0,05

    24

    26,16

    0,12

    4

    3

    0,025

    18

    19,26

    0,09

    5

    4

    0,01

    5

    5,3

    0,09

    6

    5

    0,1

    25

    26,75

    0,11

    7

    6

    0,05

    10

    10,8

    0,1

    8

    7

    0,025

    18

    19,62

    0,11

    9

    8

    0,01

    8

    8,48

    0,09

    10

    9

    0,1

    18

    18,18

    0,13

    11

    10

    0,05

    18

    18,36

    0,1

    20

    11

    0,025

    18

    19,08

    0,1

    21

    12

    0,01

    14

    15,4

    0,09

    22

    13

    0,1

    16

    17,6

    0,09

    23

    14

    0,05

    9

    9,18

    0,11

    24

    15

    0,025

    7

    7,63

    0,12

    25

    16

    0,01

    23

    23,23

    0,09

    3

    17

    0,1

    17

    18,36

    0,11

    4

    18

    0,05

    21

    21,63

    0,1

    5

    19

    0,025

    6

    6,18

    0,11

    6

    20

    0,01

    10

    10,5

    0,12

    7

    21

    0,1

    6

    6,66

    0,11

    8

    22

    0,05

    12

    12,6

    0,09

    9

    23

    0,025

    15

    15,6

    0,09

    10

    24

    0,01

    12

    12,36

    0,12

    11

    25

    0,1

    22

    23,54

    0,11

    20

    26

    0,05

    15

    16,35

    0,13

    21

    27

    0,025

    5

    5,35

    0,08

    22

    28

    0,01

    18

    19,62

    0,11

    23

    29

    0,1

    10

    10,9

    0,11

    24

    30

    0,05

    15

    16,5

    0,1

    25




    Вариант

    Общая площадь на 1 чел, кв. м.

    до 5

    5-10

    10-15

    15-20

    20-25

    25-30

    больше 30

    P

    1

    Число жителей

    100

    98

    121

    61

    12

    180

    72

    0,953

    2

    71

    61

    90

    184

    87

    60

    102

    0,939

    3

    67

    105

    63

    165

    123

    105

    51

    0,931

    4

    57

    41

    188

    124

    127

    85

    30

    0,937

    5

    199

    146

    146

    72

    101

    7

    156

    0,971

    6

    178

    55

    85

    102

    182

    60

    85

    0,974

    7

    45

    136

    136

    37

    62

    31

    33

    0,926

    8

    152

    13

    80

    67

    144

    73

    23

    0,953

    9

    199

    111

    75

    61

    197

    198

    78

    0,962

    10

    66

    6

    12

    61

    171

    123

    178

    0,955

    11

    169

    36

    177

    35

    132

    147

    101

    0,975

    12

    40

    120

    17

    42

    53

    116

    140

    0,967

    13

    38

    158

    107

    194

    26

    204

    166

    0,923

    14

    83

    201

    110

    23

    161

    93

    46

    0,942

    15

    64

    151

    84

    162

    188

    96

    49

    0,958

    16

    115

    20

    183

    198

    84

    190

    109

    0,922

    17

    189

    106

    89

    138

    148

    132

    38

    0,977

    18

    144

    9

    156

    81

    204

    148

    11

    0,979

    19

    31

    150

    202

    125

    182

    62

    119

    0,947

    20

    16

    78

    148

    35

    30

    147

    132

    0,971

    21

    6

    136

    123

    132

    163

    29

    64

    0,97

    22

    99

    160

    159

    165

    29

    64

    196

    0,969

    23

    89

    198

    56

    71

    152

    15

    198

    0,967

    24

    153

    54

    150

    36

    134

    40

    189

    0,95

    25

    112

    161

    66

    65

    182

    28

    146

    0,923

    26

    37

    90

    88

    136

    25

    20

    149

    0,943

    27

    187

    59

    13

    7

    148

    156

    194

    0,922

    28

    84

    118

    159

    200

    62

    127

    7

    0,961

    29

    66

    86

    11

    24

    54

    155

    202

    0,956

    30

    50

    144

    179

    104

    86

    10

    49

    0,968


    написать администратору сайта