Главная страница

66 Молчанова Статистика УМК без титула (1). I. Теория статистики


Скачать 1.56 Mb.
НазваниеI. Теория статистики
Анкор66 Молчанова Статистика УМК без титула (1).pdf
Дата06.10.2017
Размер1.56 Mb.
Формат файлаpdf
Имя файла66 Молчанова Статистика УМК без титула (1).pdf
ТипРеферат
#9234
страница17 из 38
1   ...   13   14   15   16   17   18   19   20   ...   38
15. С целью прогнозирования урожая овса в хозяйстве была произведена 10%-я серийная выборка, в которую попали три участка. В результате обследования установлено, что урожайность овса на участках составила 26, 30 и 34 ц/га. С вероятностью 0,954 определите пределы, в которых будет находиться средняя урожайность овса в хозяйстве.
16. При обследовании семейных бюджетов населения города была организована 10%-ная типическая пропорциональная выборка.
Результаты обследования представлены в следующей таблице:
Группы населения по семейному положению
Объем выборки
Доля расходов на оплату жилья, %
Одинокие
Семейные
55 145 9
6 166

С вероятностью 0,683 установите границы доли расходов на оплату жилья населением города.
Тест
1. Как называется статистическая совокупность, из которой
производится отбор?
а) генеральная;
б) выборочная.
2. Доверительный интервал выборочной средней и доли при
малой выборке является односторонним или двусторонним?
а) односторонним;
б) двусторонним.
3. При выборочном обследовании бюджета времени
работающих отбирается каждое пятое предприятие из общего
списка их отрасли, а затем на отобранных предприятиях
отбирается каждый десятый рабочий или служащих. Укажите
способ такого отбора:
а) механический; б) типический;
в) многоступенчатый;
г) многофазный;
д) многомерный.
4. Различия между выборочными оценками и
характеристиками генеральной совокупности называются:
а) ошибками регистрации;
б) ошибками репрезентативности.
5. Ошибка механической выборки вычисляется по формуле:
а) повторной выборки;
б) бесповторной выборки.
6. Определите предельную ошибку выборки с вероятностью 0,9,
если средняя ошибка равна 100:
а) 90; б) 164; в) 200.
7. По данным выборочного обследования 25 фирм (19%-й
отбор) средняя продолжительность оборота дебиторской
задолженности – 72 дня при среднем квадратическом
отклонении 10 дней. Определите предельную ошибку
выборки для средней продолжительности оборота с
вероятностью 0,954.
а) 1,8; б) 2,0; в) 3,6; г) 4,0.
8. При вычислении ошибки типической выборки используют:
а) общую дисперсию;
167
б) среднюю из групповых дисперсий;
в) межгрупповую дисперсию.
9. С вероятностью 0, 954 определить необходимую численность
выборки для оценки среднего размера семьи при условии, что
ошибка выборочной средней не должна превышать 0,5 чел.
при среднем квадратическом отклонении 2,0 чел.
а) 64; б) 45; в) 57.
10. При каком отборе одни и те же единицы подвергаются
обследованию по расширенной программе?
а) при комбинированном;
б) при многоступенчатом;
в) при многофазном; г) при механическом.
11. Определите с вероятностью 0,95 предельную ошибку, если
средняя ошибка равна 30:
а) 28,5; б) 58,8; в) 60,0.
12. В каком случае предельная ошибка доли признака в
генеральной совокупности будет больше (при прочих равных
условиях), если общая дисперсия в 3,5 раза больше
межгрупповой:
а) при отборе 100 единиц;
б) при отборе 25 серий.
13. Что произойдет с предельной ошибкой выборки, если
вероятность, гарантирующую результат, увеличить с 0,683 до
0,954?
а) увеличится на 27%;
б) увеличится в 1,4 раза.
в) увеличится в два раза;
г) уменьшится в два раза;
14. Обследовано 36% продукции предприятия. На сколько
процентов ошибка собственно случайной бесповторной
выборки меньше ошибки повторной выборки?
а) 36; б) 20;
в) 18; г) 6;
д) предсказать результат невозможно.
15. С вероятностью 0,997 определите предельную ошибку
выборки, если известно, что средняя ошибка равна 50.
а) 100; б) 50,997; в) 150; г) 49,85.
16. При прочих равных условиях ошибка выборки будет
меньше при:
168
а) механическом отборе;
б) типическом отборе;
в) серийном отборе.
17. Сколько респондентов необходимо опросить, оценивая
качество гостиничного обслуживания (удовлетворяет, не
удовлетворяет), чтобы предельная ошибка выборки долей с
вероятностью 0,954 при этом не превысила 5%?
а) 400; б) 100;
в) 200; г) 20.
18. Из партии готовой продукции в 1000 шт. в случайном
бесповторном порядке обследовано 100 штук. Доля
забракованных изделий составила 10%. Определите
вероятность того, что допущенная погрешность не превысит
5%
а) t=1,67;
б) t=1,76;
в) t=2,0
19. Для каких способов формирования выборочной
совокупности ошибка выборки определяется по одинаковым
формулам?
а) для собственно-случайного и механического;
б) для собственно–случайного и типического;
в) для механического и типического.
20. По данным выборочного опроса 46% респондентов считают
рекламу основным источником информации о товарном
рынке. Средняя ошибка выборки этого показателя – 2,5%. С
вероятностью 0,954 можно утверждать, что рекламой
пользуются:
а) не менее 43,5% потребителей;
б) не более 48,5%;
в) не менее 41 и не более 51%;
г) не менее 51%.
169

1.9 Статистические методы изучения взаимосвязей
социально-экономических явлений
1.9.1 Причинность, регрессия, корреляция
Исследование объективно существующих зависимостей и взаимосвязей между явлениями и процессами - важнейшая задача теории статистики, которая играет в экономике значительную роль и позволяет глубже понять сложный механизм причинно-следственных отношений между явлениями. Причинно-следственные отношения - это такая связь явлений и процессов, когда изменение одного из них - причины ведет к изменению другого - следствия.
Все социально-экономические явления взаимосвязаны и представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.
Признаки по их значению для изучения взаимосвязи делятся на два класса. Признаки, характеризующие причины и условия связи, называются факторными (х), а признаки, которые характеризуют следствия связи, – результативными (у).
Между признаками х и у возникают разные по природе и характеру связи, а именно: функциональные и стохастические. При
функциональной связикаждому значению признака х соответствует одно определенное значение у. Эта связь проявляется однозначно в каждом отдельном случае. При стохастической связи каждому значению признака х соответствует определенное множество значений у,
образующих так называемое условное распределение.Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условное распределение средней величиной
y
, то образуется разновидность стохастической связи – корреляционная.В случае корреляционной связи каждому значению признака х соответствует среднее значение результативного признака
y
.
Связи между явлениями и их признаками классифицируются:

по степени тесноты;

по направлению;

по аналитическому выражению.
По степени тесноты связи представлены в таблице 1.9.1.
По направлению выделяют:
170


Прямую связь - это такая связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности труда способствует увеличению уровня рентабельности производства.

Обратную связь – это такая связь, при которой значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.
Таблица 1.9.1
Количественные критерии оценки тесноты связи
Величина коэффициента корреляции
Характер связи до ±0,3
практически отсутствует
±0,3 - ±0,5
слабая
±0,5 - ±0,7
умеренная
±0,7 - ±1,0
сильная
По аналитическому выражению выделяют связи:

прямолинейные (или просто линейные);

нелинейные.
Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют
линейной связью вида:
x
a
a
y
x
1 0
+
=
(1.9.1)
Если же связь может быть выражена уравнением какой-либо кривой линии, например, параболы, то такую связь называют нелинейной или криволинейной:
2 2
1 0
x
a
x
a
a
y
x
+
+
=
(1.9.2)
Для выявления наличия связи, ее характера и направления в статистике используются методы:

приведения параллельных данных;

аналитических группировок;

графический;

корреляции.
171

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменение двух величин:
X
1 2
3 4
5 6
7 8
9
Y
5 9
6 10 14 17 15 20 23
Мы видим, что с увеличением величины X величина Y также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой или уравнением параболы второго порядка.
Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного.
Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.
Корреляция - это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению среднего значения другой.
Варианты корреляционной зависимости:
1) парная корреляция - связь между двумя признаками
(результативным и факторным, или двумя факторными).
2) частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.
3) множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.
Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять
«полезность» факторных признаков при построении уравнения множественной регрессии.
172

Регрессия тесно связана с корреляцией: первая оценивает силу
(тесноту) статистической связи, вторая исследует ее форму.
Регрессионный анализ
заключается в определении аналитического выражения связи, в котором изменение одной величины
(называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторов).
Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.
Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.
При построении моделей регрессии должны соблюдаться
следующие требования:
1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.
2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.
3. Все факторные признаки должны иметь количественное (цифровое) выражение.
4. Наличие достаточно большого объема исследуемой выборочной совокупности.
5. Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.
6. Отсутствие количественных ограничений на параметры модели связи.
7. Постоянство территориальной и временной структуры изучаемой совокупности.
Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные явления и процессы.
1.9.2
Парная регрессия на основе метода наименьших
квадратов и метода группировок
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:
прямой
x
a
a
y
x
1 0
+
=
173
гиперболы
х
а
а
у
х
1 1
0
+
=
параболы
2 2
1 0
x
a
x
a
a
y
x
+
+
=
(1.9.3)
показательной функции
х
x
a
a
y
1 0
+
=
полулогарифметической функции
x
a
a
y
x
lg
1 0
+
=
и так далее.
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.
Оценка параметров уравнений регрессии (
1 0
, а
а
и
2
а
- в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (
1 0
, а
а
), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
(
)
min
2

∑ −
=
x
y
y
S
(1.9.4)
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:




=

+


=

+
xy
x
a
x
a
y
x
a
na
2 1
0 1
0
(1.9.5)
где n - объем исследуемой совокупности (число единиц наблюдения).
174

В уравнениях регрессии параметр a
0
показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков; коэффициент регрессии a
1
показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Пример. По данным наблюдения окупаемость затрат на радиоприборы зависит от срока освоения их производства (см. табл.
1.9.2).
Таблица 1.9.2
Зависимость между окупаемостью затрат и сроком освоения
производства приборов

продук- ции
Срок освоения,
лет
(x)
Окупаемость затрат,
тыс. ден. ед.
(y)
2
х
ху
х
у
1 2
3 4
5 6
7 8
9 10 5
4 7
10 1
2 8
12 3
6 10,2 7,5 13,9 12,8 0,6 2,8 13,2 10,1 5,4 12,7 25 16 49 100 1
4 64 144 9
36 51 30 97,3 128 0,6 5,6 105,6 121,2 16,2 76,2 8,104 7,084 10,144 13,204 4,024 5,044 11,164 15,244 6,064 9,124
Итого
58 89,2 448 631,7 89,2
Предположим наличие линейной зависимости между рассматриваемыми признаками. Тогда, система нормальных уравнений для данного примера будет иметь следующий вид:



=
+
=
+
7
,
631 448 58 2
,
89 58 10 1
0 1
0
a
a
a
a
Отсюда: a
0
= 3,004; a
1
= 1,02. Следовательно,
х
у
=3,004 +
1,02x.
На практике исследования часто проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в
175
сводной групповой таблице. При этом анализу подвергаются сгруппированные данные и по факторному (x) и по результативному (y) признакам, то есть уравнения парной регрессии целесообразно строить на основе сгруппированных данных.
1.9.3 Множественная (многофакторная) регрессия
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной)
регрессии:
(
)
k
k
x
x
x
f
у
,
,
,
2 1
,...,
2
,
1

=
(1.9.6)
Построение моделей множественной регрессии включает несколько этапов:
1. Выбор формы связи (уравнения регрессии);
2. Отбор факторных признаков;
3. Обеспечение достаточного объема совокупности.
Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.
Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.
С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.
Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных статистических методов анализа.
Наиболее приемлемым способом отбора факторных признаков является
1   ...   13   14   15   16   17   18   19   20   ...   38


написать администратору сайта