Главная страница

Лекция 7. Выборочное наблюдение. Лекции Вопрос Причины применения выборочного наблюдения


Скачать 1.07 Mb.
НазваниеЛекции Вопрос Причины применения выборочного наблюдения
Дата27.05.2022
Размер1.07 Mb.
Формат файлаpdf
Имя файлаЛекция 7. Выборочное наблюдение.pdf
ТипЛекции
#553281

ЛЕКЦИЯ 7. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
МОСТОВЩИКОВА ИРИНА АЛЕКСАНДРОВНА, СТ. ПРЕП. КАФ. «ЭКОНОМИКА И ФИНАНСЫ»
13.04.2022 1

СОДЕРЖАНИЕ ЛЕКЦИИ

Вопрос 1. Причины применения выборочного наблюдения

Вопрос 2. Способы формирования выборки. Виды выборочного наблюдения

Вопрос 3. Ошибки выборочного наблюдения
13.04.2022 2

ВОПРОС 1. ПРИЧИНЫ ПРИМЕНЕНИЯ ВЫБОРОЧНОГО
НАБЛЮДЕНИЯ
13.04.2022 3

ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ: ОПРЕДЕЛЕНИЕ И ПРИЧИНЫ ПРИМЕНЕНИЯ
Выборочное наблюдение
– это
способ изучения
характеристик
(генеральной) совокупности по
характеристикам части единиц этой совокупности, отобранной по специальной процедуре (
выборочной совокупности
).
Выборочное наблюдение позволяет получить с достаточной степенью точности и надежности информацию о характеристиках изучаемой совокупности с минимальными затратами сил и времени.
Пример.
Предвыборные опросы населения с целью выяснения масштабов поддержки того или иного кандидата, различные маркетинговые исследования с целью оценить предпочтения, потребности, возможности или намерения покупателей,
выборочные исследования готовой продукции для оценки качества всей партии и др.
Можно назвать, по крайней мере,
три причины применения выборочного наблюдения
:

экономия ресурсов;

возможность получить более точные результаты;

в некоторых случаях получение данных связано с разрушением или порчей изучаемых объектов.
13.04.2022 4

ПРИЧИНЫ ПРИМЕНЕНИЯ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
Причина 1. Экономия ресурсов
Логика первой причины достаточно очевидна. Понятно, что опросить 300 человек и даже 500 человек значительно легче, дешевле и быстрее,
нежели все население области (например, для определения структуры предпочтений покупателей по продукции определенного вида).
13.04.2022 5

ПРИЧИНЫ ПРИМЕНЕНИЯ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
Причина 2. Возможность получить более точные результаты
Вторая причина не только неочевидна, но на первый взгляд кажется скорее парадоксальной. Действительно, почему точность оценки какой- либо характеристики в совокупности из 500 тысяч человек может оказаться выше при опросе 200 человек, а не всех 500 тысяч, т.е. в варианте сплошного наблюдения? Для ответа на этот вопрос, необходимо ввести понятия ошибка репрезентативности и ошибка регистрации.
Ошибки регистрации
– ошибки, связанные с процессом сбора данных.
Возникают в результате того, что респондент неверно ответил на вопрос регистратора или регистратор неверно записал ответ респондента,
или, если наблюдение документальное, неверно переписал данные из первичных источников и т.п.
Ошибки репрезентативности
– ошибки, связанные с тем, что оценки параметров всей совокупности единиц выполняются на основе частичных,
неполных данных.
Возникают в результате того, что выборочная совокупность в той или иной степени отличается от генеральной, а, следовательно, отличаются и ее характеристики. Разница значений выборочной и генеральной совокупностей и составляет ошибку репрезентативности.
При проведении сплошного наблюдения имеют место только ошибки регистрации
, ошибки репрезентативности отсутствуют по определению.
При проведении выборочного наблюдения возникают как ошибки регистрации, так и ошибки репрезентативности
Суммарная ошибка регистрации и репрезентативности в случае выборочного наблюдения меньше по величине, чем сумма
многочисленных ошибок регистрации в случае сплошного наблюдения.
13.04.2022 6

ПРИЧИНЫ ПРИМЕНЕНИЯ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
Причина 3. В некоторых случаях получение данных связано с разрушением или порчей изучаемых объектов
Некоторые методы проверки качества изделия предполагают его разрушение.
Например:
проверка прочности путем установления усилия, при котором деталь разрушается, или проверка длительности горения электрических лампочек экспериментальным путем. В этом случае сплошное наблюдение просто теряет смысл.
Данные случайного выборочного наблюдения дают возможность с заданной точностью и надежностью определить средние, объемные
и структурные параметры генеральной совокупности.
В таблице 1 представлены принятые в статистике обозначения перечисленных параметров генеральной и выборочной совокупности.
Характеристики
генеральной совокупности
обозначают
греческими буквами
, а
выборочной совокупности – латинскими
. Это позволяет различать одинаковые по содержанию показатели, относящиеся к различным группам единиц, без дополнительных разъяснений.
Таблица 1 – Обозначение характеристик генеральной и выборочной совокупностей
13.04.2022 7
Показатель
Генеральная совокупность
Выборочная совокупность
Размер статистической совокупности
N
(ню)
n
(эн)
Среднее значение признака
µ
(мю)
х
(икс среднее)
Доля единиц совокупности с каким-либо общим признаком
π
(пи)
р
(пэ)
Дисперсия
σ2
(сигма в квадрате)
S2
(эс в квадрате)

ВОПРОС 2. СПОСОБЫ ФОРМИРОВАНИЯ ВЫБОРКИ.
ВИДЫ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
13.04.2022 8

СПОСОБЫ ФОРМИРОВАНИЯ И ВИДЫ ВЫБОРОК
Выборочное наблюдение
– это способ изучения характеристик изучаемой (генеральной) совокупности по характеристикам части единиц совокупности, отобранной по специальной процедуре (выборочной совокупности).
В чем же должна состоять эта специальная процедура, чтобы выборка оказалась репрезентативной, а оценка параметров изучаемой совокупности достаточно точной?
Для того, чтобы применить метод выборочного исследования (выборочных оценок) совершенно обязательным является одно
требование: выбранный способ должен обеспечивать
случайный характер отбора единиц в выборочную совокупность
.
Метод выборочных оценок построен на применении аппарата теории вероятностей, и если характеристики единиц выборочной совокупности не являются случайными величинами, то и математический аппарат метода в этом случае не применим. А выборочные данные, по которым невозможно посчитать, насколько они могут отличаться от интересующих нас параметров генеральной совокупности, теряют всякую ценность.
Поэтому, далее мы будем рассматривать только случайные выборки!
Выборки различают по:

виду изучаемой совокупности;

характеру отбора;

единице отбора;

способу отбора;

порядку отбора;

программе обследования.
13.04.2022 9

СПОСОБЫ ФОРМИРОВАНИЯ И ВИДЫ ВЫБОРОК
1. По виду изучаемой совокупности
В зависимости от того, изучается ли пространственная или временная совокупность выборка может быть сформирована путем:

Отбора в пространстве
(рассматривается совокупность одновременно существующих, распределенных в пространстве единиц, т.е. изучаются разные единицы совокупности в один и тот же момент времени);
Пример:
отбор некоторого количества деталей из партии для проверки точности размеров.

Отбора во времени
(рассматривается совокупность моментов или периодов времени, т.е.
изучение одних и тех же единиц совокупности, но в разные периоды времени).
Пример:
изучение использования рабочего времени (регистрация категории затрат времени рабочего в определенные моменты или периоды: работа, простой из-за отсутствия электроэнергии, простой из-за ожидания материала, поломки инструмента и т.д.)
15.04.2022 10

СПОСОБЫ ФОРМИРОВАНИЯ И ВИДЫ ВЫБОРОК
2. По характеру отбора
выделяют следующие виды выборок:

Собственно случайная выборка.
Выполняется посредством жеребьевки, лотереи, стандартной компьютерной программы генератора случайных чисел либо таблицы случайных чисел.

Случайная механическая выборка.
Процедура отбора: все единицы совокупности ранжируются по признаку, не связанному с изучаемым, и затем с шагом n в выборочную совокупность отбирается каждая n-ная единица. Длина шага определяется в зависимости от необходимого размера выборочной совокупности.
Например,
если из генеральной совокупности размером 1000 единиц необходимо отобрать 200, то следует отбирать каждую 5-ую, если 100 – то каждую
10-ую и т.д. Отбор рекомендуется начинать не с первой единицы: например, отбирать каждую 10, начиная с 3-тьей единицы.

Случайная районированная (стратифицированная, типическая) выборка.
Предполагает пропорциональный отбор единиц из структурных частей (районов, страт, типов единиц) генеральной совокупности.
Например
, при выборочном опросе 120 сотрудников предприятия использование стратифицированного отбора предполагает случайный отбор из каждого подразделения предприятия (цеха, отдела) некоторого числа сотрудников, так, чтобы общее число отобранных было равно 120, а численности отобранных из каждого подразделения были пропорциональны численности этих подразделений.
15.04.2022 11

СПОСОБЫ ФОРМИРОВАНИЯ И ВИДЫ ВЫБОРОК
3. По единице отбора
выделяют следующие виды выборок:

единичная выборка
– отбор выполняется единицами;

серийная выборка
– отбор выполняется сериями.
Пример:
при изучении успеваемости студентов университета в единичную выборку отбирают по одному студенту, в серийную – целыми группами.
4. По способу отбора
выделяют следующие виды выборок:

повторная выборка
(при повторном отборе каждая отобранная на предыдущем шаге единица возвращается в совокупность, из которой производится отбор, и теоретически может быть отобрана в выборочную совокупность еще раз);

бесповторная выборка
(при бесповторном отборе каждая отобранная на предыдущем шаге единица не возвращается в совокупность, из которой производится отбор, и, следовательно, не может быть отобрана в выборочную совокупность еще раз).
15.04.2022 12

СПОСОБЫ ФОРМИРОВАНИЯ И ВИДЫ ВЫБОРОК
5. По порядку отбора
выделяют следующие виды выборок:

одноступенчатые
;

многоступенчатые
Пример.
Если в группу для изучения отбираются ученики из всего множества учащихся в городе – это одноступенчатая выборка, а если – последовательно: сначала, отбирается некоторое количество школ, затем, из этих школ – классы, затем – из отобранных классов ученики, то это – многоступенчатая выборка.
6. По программе обследования
выделяют следующие виды выборок:

однофазовые
;

многофазовые
При однофазовых наблюдениях все единицы выборочной совокупности обследуются по одному и тому же набору признаков,
при многофазовых – по различным. Многофазовые наблюдения используются в случаях, когда по разным оцениваемым в рамках исследования показателям необходимо обеспечить разную степень точности (подробнее в вопросе 4 «Три задачи выборочного наблюдения»).
15.04.2022 13

ВОПРОС 3. ОШИБКИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
13.04.2022 14

ОШИБКИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
При проведении выборочного наблюдения и оценке параметров генеральной совокупности по выборочным данным возникают
ошибки двух видов
:

Ошибки регистрации
– ошибки, связанные с процессом сбора данных.
Ошибки данного вида практически невозможно измерить. Для того чтобы снизить влияние ошибок регистрации на точность оценок, необходимо свести к минимуму возможность этих ошибок за счет серьезной и продуманной подготовки наблюдения.

Ошибки репрезентативности (ошибки выборки)
– ошибки, обусловленные оценкой параметров всей совокупности единиц на основе частичных, неполных данных.
Такие ошибки отражают расхождение между двумя совокупностями – генеральной и выборочной.
!
Ошибка репрезентативности
в выборочной совокупности, сформированной случайным образом, является
случайной
величиной
и
поддается оценке инструментами теории вероятностей
13.04.2022 15

ОШИБКИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ (ПРИМЕР)
Рассмотрим
сущность и методы оценки ошибки репрезентативности
на следующем примере.
Пример.
В таблице 2 представлены результаты сдачи экзамена 2000 студентов, из которых случайным отбором сформированы две выборочные совокупности по 400 человек. Рассчитаем среднюю оценку (показатель средней величины) и долю студентов, сдавших экзамен на «4» и «5» (показатель доли), в генеральной и выборочных совокупностях.
Таблица 2 – Результаты экзаменационной сессии
13.04.2022 16
Оценка
Число студентов
Генеральная совокупность
Выборочная совокупность 1
Выборочная совокупность 2 2
50 8
6 3
750 155 136 4
1000 200 210 5
200 37 48
Итого
2000 400 400

ОШИБКИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ (РЕШЕНИЕ ПРИМЕРА)
1. Расчет средней оценки:

по генеральной совокупности
μ =
2 × 50 + 3 × 750 + 4 × 1000 + 5 × 200 2000
= 3,67

по выборочным совокупностям
𝑥
1
=
2 × 8 + 3 × 155 + 4 × 200 + 5 × 37 400
= 3,65
𝑥
2
=
2 × 6 + 3 × 136 + 4 × 210 + 5 × 48 400
= 3,75
2
. Расчет ошибки выборочных оценок:
∆𝑥
1
= 𝑥
1
− μ = 3,65 − 3,67 = −0,02
∆𝑥
2
= 𝑥
2
− μ = 3,75 − 3,67 = +0,08 13.04.2022 17

ОШИБКИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ (РЕШЕНИЕ ПРИМЕРА)
3. Расчет доли студентов, сдавших экзамен на «4» и «5»:

по генеральной совокупности
π =
1200 2000
= 0,60

по выборочным совокупностям
𝑝
1
=
237 400
= 0,59
𝑝
2
=
258 400
= 0,65
4. Расчет ошибки выборочных оценок:
∆𝑝
1
= 𝑝
1
− π = 0,59 − 0,60 = −0,01
∆𝑝
2
= 𝑝
2
− π = 0,65 − 0,60 = +0,05
Из примера видно, что
выборочная средняя
и
выборочная доля являются переменными величинами
и зависят от того, какие единицы совокупности попали в выборку!
13.04.2022 18

СРЕДНЯЯ ОШИБКА ВЫБОРКИ
Русский математик А.М. Ляпунов доказал, что распределение выборочных средних значений признака (а, следовательно,
и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений стремится к
нормальному закону
. При этом
средняя ошибка выборки (выборочных оценок среднего значения признака)
может быть рассчитана по формуле:
𝑆
𝑥
=
σ
2
𝑛
Значение генеральной дисперсии при проведении выборочных исследований, как правило, неизвестно. Поэтому, для расчета используют оценку генеральной дисперсии:

в случае если объем выборки
(n) больше или равен 100
σ
2
≈ 𝑆
2

в случае если объем выборки
(n) меньше 100
σ
2
≈ 𝑆
2
𝑛
𝑛 − 1 13.04.2022 19

НОРМИРОВАННОЕ ОТКЛОНЕНИЕ И УРАВНЕНИЕ ПЛОТНОСТИ
ВЕРОЯТНОСТИ ЛАПЛАСА-ГАУССА
Ошибка конкретной выборки может существенно отличаться от средней ошибки. Но модуль отношения индивидуальных ошибок к средней ошибке практически не превышает 3, если n>100 (согласно нормальному закону распределения). Это отношение называют
нормированным
отклонением (t):
𝒕 =
𝒙 − 𝝁
𝑺
𝒙
Распределение t при n → ∞ определяется
уравнением Лапласа-Гаусса
𝒇 𝒕 =
𝟏
𝝈 𝟐𝝅
× 𝒆

𝒕
𝟐
𝟐
,
т.к. является нормальным, а определенный интеграл плотности вероятности распределения в пределах (– t; + t) определяет вероятность попадания t в данный интервал.
Таким образом, благодаря русскому математику Александру Михайловичу Ляпунову, немецкому ученому Карлу Фридриху Гауссу и
французскому – Пьеру Симону Лапласу современные исследователи имеют возможность определить, насколько может с заданной
степенью вероятности отклоняться рассчитанная по выборочным данным характеристика от ее реального значения в генеральной
совокупности. Именно такая возможность придает практическую ценность любому выборочному наблюдению
13.04.2022 20

ПРЕДЕЛЬНАЯ ОШИБКА ВЫБОРОЧНОЙ ОЦЕНКИ И ДОВЕРИТЕЛЬНАЯ
ВЕРОЯТНОСТЬ
Максимальную величину отклонения среднего значения признака по выборке от среднего значения признака по генеральной совокупности с определенной степенью вероятности называют
предельной ошибкой выборочной оценки
, а соответствующую вероятность –
доверительной вероятностью
Рассчитать точные значения параметров генеральной совокупности невозможно, поскольку оценка выполняется по неполному множеству единиц. Но для каждой величины возможно определить
интервал
, в который с заданной
доверительной вероятностью
попадает значение этой величины.
Границы
интервала (
доверительного интервала
)
определяются с учетом
предельной ошибки
. Таким образом,
средняя генеральная характеристика
по какому-либо признаку
(например, средний доход или средний возраст покупателей или средний вес или средний размер изготовленных деталей)
рассчитывается с учетом предельной ошибки средней величины (определяется ее доверительный интервал):
𝒙 − ∆𝒙 ≤ 𝝁 ≤ 𝒙 + ∆𝒙,
где 𝑥 – среднее значение признака по выборке;
∆𝑥 – предельная ошибка репрезентативности для средней величины;
𝜇 – среднее значение признака по генеральной совокупности.
13.04.2022 21

ФОРМУЛА ПРЕДЕЛЬНОЙ ОШИБКИ СРЕДНЕЙ ВЕЛИЧИНЫ
Предельная ошибка средней величины
рассчитывается по формуле
:
∆𝒙 = 𝒕 ×
𝝈
𝟐
(𝑵 − 𝒏)
𝒏(𝑵 − 𝟏)
,
где 𝑡 – коэффициент доверия;
𝜎
2
– дисперсия признака в генеральной совокупности;
𝑁 – размер генеральной совокупности;
𝑛 – размер выборочной совокупности;
(𝑁 − 𝑛) / 𝑁 − 1 – коэффициент корректировки на бесповторность (при повторной выборке данный коэффициент равен 1)
Коэффициент доверия
выбирается по таблице
«Значения интеграла вероятностей для нормального распределения»
(вспомогательные таблицы) по заданному значению доверительной вероятности F(t). При отсутствии в таблице точного значения доверительной вероятности коэффициент доверия выбирается по ближайшему большему значению (чтобы гарантировать требуемую надежность оценки) или на основе интерполяции.
Значение генеральной дисперсии принимается примерно равной выборочной дисперсии при n>100, при n<100 значение выборочной дисперсии корректируется умножением на n/(n – 1).
Объемные показатели (например, емкость рынка по какому-либо товару в натуральном выражении или объем денежных средств, которые покупатели готовы потратить на этот товар) определяются умножением генеральной средней величины (с учетом ошибки оценки) на количество единиц в генеральной совокупности.
15.04.2022 22

ПРИМЕР ОЦЕНКИ ПРЕДЕЛЬНОЙ ОШИБКИ ВЫБОРОЧНОЙ СРЕДНЕЙ
Пример.
Для определения скорости расчетов с кредиторами предприятий одной корпорации была проведена случайная выборка 50
платежных документов, по которым средний срок перечисления и получения денег составил 28,2 дня со средним квадратическим отклонением
5,4 дня. Определить средний срок прохождения всех платежей в течение данного года с доверительной вероятностью 0,95.
Исходные данные:
n = 50 документов;
𝑥 = 28,2
S = 5,4
F(t) = 0,95
𝜇 = ?
15.04.2022 23
Решение:
1. По вспомогательной таблице «Значение интеграла вероятностей F(t)» выбираем значение t, соответствующее вероятности F(t)=0,95: t=1,96.
2. Корректируем значение выборочной дисперсии, учитывая, что n<100 (n=50)
𝜎
2
= 5,4 2
×
50 50 − 1
= 29,755.
3. Рассчитываем предельную ошибку
∆𝑥 = 1,96 ×
29,755 50
= ±1,51.
4. Рассчитываем доверительный интервал
28,2 − 1,51 ≤ 𝜇 ≤ 28,2 + 1,51;
26,7 ≤ 𝜇 ≤ 29,7.
Ответ:
С вероятностью 0,95 можно утверждать, что средняя продолжительность расчетов предприятий данного треста с кредиторами не менее 26,7 и не более 29,7 дня.

ФОРМУЛА ПРЕДЕЛЬНОЙ ОШИБКИ ДОЛИ
Структурные параметры генеральной совокупности (доли единиц генеральной совокупности, обладающих каким-либо признаком или удовлетворяющих какому-либо условию, – например, доля покупателей, имеющих автомобиль или доля покупателей с доходом ниже прожиточного минимума) рассчитываются с учетом
предельной ошибки доли
:
𝒑 − ∆𝒑 ≤ 𝝅 ≤ 𝒑 + ∆𝒑,
где 𝑝 – показатель доли в выборочной совокупности;
∆𝑝 – предельная ошибка доли;
𝜋 – показатель доли в генеральной совокупности.
Предельная ошибка доли
рассчитывается по формуле
:
∆𝑝 = 𝑡 ×
𝜎
2
(𝑁 − 𝑛)
𝑛(𝑁 − 1)
,
где 𝑡 – коэффициент доверия;
𝜎
2
– дисперсия признака в генеральной совокупности (𝜎
2
≈ 𝑝 1 − 𝑝 , при 𝑛 ≥ 100; 𝜎
2

𝑝 𝑝−1 ×𝑛
𝑛−1
, при 𝑛 < 100);
𝑁 – размер генеральной совокупности;
𝑛 – размер выборочной совокупности;
(𝑁 − 𝑛) / 𝑁 − 1 – коэффициент корректировки на бесповторность (при повторной выборке данный коэффициент равен 1)
15.04.2022 24

ПРИМЕР ОЦЕНКИ ПРЕДЕЛЬНОЙ ОШИБКИ ВЫБОРОЧНОЙ СРЕДНЕЙ
Пример.
По данным выборочного наблюдения 100 платежных документов предприятий корпорации оказалось, что в 6 случаях сроки расчетов с кредиторами не были выполнены. С вероятностью 0,954 установить доверительный интервал доли платежных документов без нарушения сроков для корпорации в целом.
Исходные данные:
n = 100 документов;
𝑝 = (100-6)/100=0,94
(доля документов без нарушения сроков);
F(t) = 0,954;
π = ?
14.04.2022 25
Решение:
1. По вспомогательной таблице «Значение интеграла вероятностей F(t)» выбираем значение t, соответствующее вероятности F(t)=0,954: t=2,00.
2. Рассчитываем значение выборочной дисперсии для альтернативного признака, т.к. n=100 корректировка дисперсии не требуется: σ
2
≈ 𝑆
2
𝜎
2
= 𝑞 × 𝑝 = 0,94 × 1 − 0,94 .
3. Рассчитываем предельную ошибку
∆𝑝 = 2,00 ×
0,94 × 1 − 0,94 100
= ±0,048.
4. Рассчитываем доверительный интервал
0,940 − 0,048 ≤ π ≤ 0,94 + 0,048;
89,2% ≤ π ≤ 98,8%.
Ответ:
С вероятностью 0,954 можно утверждать, что доля платежей, выполненных в срок, с вероятностью 95,4 % находится в интервале 89,2% ≤ π ≤ 98,8%

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
13.04.2022 26

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
13.04.2022 27
Окончание таблицы «Значение интеграла вероятности F(t)»

ВОПРОС 4. ТРИ ЗАДАЧИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
13.04.2022 28

ЗАДАЧИ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ
14.04.2022 29
Различают три задачи выборочного наблюдения:
Определение объема выборки, необходимого для получения требуемой точности результатов с заданной
вероятностью
Определение предельной ошибки выборки с заданной вероятностью и сравнение ее с допустимой
погрешностью
Определение вероятности того, что ошибка не превысит допустимой погрешности

ЗАДАЧА 1. ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ
15.04.2022 30
Для определения объема выборки, необходимого для получения требуемой точности результатов с заданной вероятностью, достаточно выразить n из формулы предельной ошибки:
∆𝑋 = 𝑡
𝜎
2
𝑛
=> 𝑛 =
𝑡
2
𝜎
2
(∆𝑋)
2
Объем выборки рассчитывается на стадии подготовки выборочного наблюдения, поэтому вместо действительного значения среднего квадратического отклонения (которое пока неизвестно) используется его оценка, которая определятся одним из следующих способов:

по результатам прошлых исследований
;

как 1/3 от средней величины признака
; (𝜎 =
1 3
𝑋);

как 1/6 от размаха вариации признака
; (𝜎 =
1 6
(𝑋
𝑚𝑎𝑥
− 𝑋
𝑚𝑖𝑛
)

для относительных величин принимается равным максимальному значению 0,5
(дисперсия при этом равна 0,25)

ЗАДАЧА 1. ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ (ПРИМЕР)
15.04.2022 31
Пример.
Рассчитать объем выборки, если необходимо, чтобы с вероятностью 0,900 погрешность оценки не превышала следующих значений:

по показателю средний доход 1000 руб.;

по показателю средний возраст 2 года;

по показателю средний стаж 3 года.
Значения СКО по данным прошлого исследования, соответственно 15 тыс. руб., 24,5 года, 38,2 года.
Решение.
1. Рассчитаем объем выборки, который необходим для обеспечения требований точности и надежности оценки по первому показателю. Для этого по значению доверительной вероятности 0,900 находим по таблице (вспомогательная таблица) значение коэффициента доверия t=1,65
(поскольку значение 0,900 в таблице отсутствует, выбираем t по ближайшему большему значению: 0,9011).
𝒏 =
𝟏, 𝟔𝟓
𝟐
× 𝟏𝟓𝟎𝟎𝟎
𝟐
(𝟏𝟎𝟎𝟎)
𝟐
= 𝟔𝟏𝟐, 𝟔 ≈ 𝟔𝟏𝟑
Полученное числовое значение округляем до ближайшего большего целого.
2. Рассчитаем объем выборки, который необходим для обеспечения требований точности и надежности оценки по второму показателю.
𝒏 =
𝟏, 𝟔𝟓
𝟐
× 𝟐𝟒, 𝟓
𝟐
(𝟐)
𝟐
= 𝟒𝟎𝟖, 𝟓 ≈ 𝟒𝟎𝟖.

ЗАДАЧА 1. ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ (ПРИМЕР)
15.04.2022 32
Решение (продолжение).
3. Рассчитаем объем выборки, который необходим для обеспечения требований точности и надежности оценки по третьему показателю
𝒏 =
𝟏, 𝟔𝟓
𝟐
× 𝟑𝟖, 𝟐
𝟐
(𝟑)
𝟐
= 𝟒𝟒𝟏, 𝟒 ≈ 𝟒𝟒𝟐
! Полученное числовое значение округляем до ближайшего большего целого, несмотря на то, что 0,4<0,5, т.к. при любом округлении в меньшую сторону точность оценки при заданной доверительной вероятности окажется меньше, т.е. требование по точности не будет выполнено.
4. Определение объема выборки, который необходим для обеспечения требований точности и надежности оценки по трем показателям одновременно.
Очевидно, требования по трем показателям одновременно обеспечит наибольший из трех размер выборки. Следовательно, n=613.
Примечание.
Если расчетные значения различаются больше чем в 6 раз, то целесообразна многофазовая выборка. Например, если по второму показателю необходим размер выборки n=100, а по третьему n=1000, то о стаже работы следует спрашивать каждого из 1000 респондентов, а о возрасте – только каждого десятого.

ЗАДАЧА 2. ОПРЕДЕЛЕНИЕ ПРЕДЕЛЬНОЙ ОШИБКИ (+ПРИМЕР)
15.04.2022 33
Данная задача решается после проведения выборочного исследования, чтобы определить, какая
предельная ошибка в
действительности
характеризует проведенные оценки. Величина ошибки может отличаться от заложенной в расчете при определении объема выборки, если оценка дисперсии была ошибочной. Расчетная формула:
∆𝑋 = 𝑡
𝜎
2
𝑛
Пример.
На заводе электроламп отобрано для проверки 100 ламп. Средняя продолжительность их горения составила 1420 часов со
СКО =61,03 часа. Вся партия – 50 000 ламп. Доверительная вероятность оценки – 0,954. Рассчитать предельную ошибку и доверительный интервал средней продолжительности горения ламп во всей партии.
Решение.
1. Определяем предельную ошибку:
∆𝑿 = 𝟐, 𝟎𝟎
𝟔𝟏,𝟎𝟑
𝟐
𝟏𝟎𝟎
= ±𝟏𝟐, 𝟐
2. Определяем доверительный интервал:
1407,8 ≤ µ ≤1432,2
Ответ.
С вероятностью 0,954 можно утверждать, что средняя продолжительность горения ламп во всей партии не менее 1407,8 и не более 1432,2 часа.

ЗАДАЧА 3. ОПРЕДЕЛЕНИЕ ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТИ
15.04.2022 34
Задача решается в случае, когда при заданной вероятности действительная предельная ошибка выполненной по выборочным данным оценки оказалась выше, чем планировалась и надо ответить на вопрос:
«С какой степенью вероятности
обеспечивается проектная величина ошибки?»
Для определения доверительной вероятности необходимо
предварительно рассчитать значение коэффициента доверия
, и с его использованием найти по таблице значение вероятности. Расчетная формула выводится все из той же исходной формулы предельной ошибки, связывающей воедино параметры точности, надежности, вариации и объема выборки:
𝒕 =
∆𝒙
𝝈
𝟐
𝒏

ЗАДАЧА 3. ОПРЕДЕЛЕНИЕ ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТИ (ПРИМЕР)
15.04.2022 35
Пример.
Минимальная продолжительность горения лампы по договору поставок – 1410 часов. Средняя продолжительность по выборке – 1420 часов (условия предыдущей задачи). Следовательно, допустимая погрешность – 10 часов. По результатам расчета эта величина составила 12,2 часа. С какой вероятностью условия поставок будут выполнены?
Решение.
1. Определяем значение коэффициента доверия
𝒕 =
𝟏𝟎
𝟔𝟏, 𝟎𝟑
𝟐
𝟏𝟎𝟎
= 𝟏, 𝟔𝟒
2. Определяем по таблице («Значение интеграла вероятностей F(t)») значение доверительной вероятности
t =1,64 F(t) = 0,899.
Ответ.
В интервал от 1410 до 1430 часов продолжительность горения ламп попадает с вероятностью 89,9%.

ВОПРОС 5. МАЛЫЕ ВЫБОРКИ
13.04.2022 36

ЗАДАЧА 3. ОПРЕДЕЛЕНИЕ ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТИ (ПРИМЕР)
15.04.2022 37
Если объем выборки 30 единиц и меньше (такие выборки называют малыми), то распределение выборочных средних значений признака (а, следовательно, и их отклонений от средней ошибки) не описывается нормальным законом. Распределения ошибок выборочных оценок при небольших объемах выборки называют распределениями Стьюдента по имени их исследователя.
Расчет предельной ошибки для случаев, когда n<30 необходимо выполнять по правилам малой выборки.
Предельная ошибка малой выборки рассчитывается по формуле:
∆𝒙 = 𝒕
Ст
𝑺
𝟐
(𝒏 − 𝟏)
где 𝑡
Ст
– коэффициент доверия Стьюдента;
𝑆
2
– выборочная дисперсия признака в малой выборке.
Значение коэффициента доверия Стьюдента выбирается по таблице “Распределения Стьюдента” (вспомогательные таблицы) по двум параметрам – степень значимости (α =1 – F(t)) и число степеней свободы (в данной задаче d.f. = n – 1).

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
15.04.2022 38

ВСПОМОГАТЕЛЬНЫЕ ТАБЛИЦЫ
15.04.2022 39
Окончание таблицы «Распределения Стьюдента (t – распределения)»

ГЛОССАРИЙ
13.04.2022
Малая выборка
– выборка размером меньше 30.
Многоступенчатая выборка
– это выборка, которая формируется за несколько шагов.
Многофазовая выборка
– это выборка, единицы которой обследуются по разному набору признаков.
Однофазовая выборка
– это выборка, все единицы которой обследуются по одному и тому же набору признаков.
Одноступенчатая выборка
– это выборка, которая формируется за один шаг.
Ошибки регистрации
– ошибки, связанные с процессом сбора данных.
Ошибки репрезентативности
– ошибки, связанные с тем, что оценки параметров всей совокупности единиц выполняются на основе частичных, неполных данных.
Случайная механическая выборка
выполняется по следующей процедуре. Все единицы совокупности ранжируется по признаку, не связанному с изучаемым, и затем с шагом n в выборочную совокупность отбирается каждая n-ная единица.
Случайная районированная (стратифицированная, типическая) выборка
предполагает пропорциональный отбор единиц из структурных частей генеральной совокупности.
Собственно случайная выборка
выполняется посредством жеребьевки, лотереи, стандартной компьютерной программы генератора случайных чисел либо таблицы случайных чисел.
40


написать администратору сайта