Все формулы по статистике. Семестр 1 2 Группировка статистических данных и ее роль в анализе информации 2 Абсолютные, относительные, средние величины 2
Скачать 0.55 Mb.
|
Содержание Семестр 1 2 Группировка статистических данных и ее роль в анализе информации 2 Абсолютные, относительные, средние величины 2 Относительные величины 2 Средние величины 2 Статистические распределения и их характеристики 3 Показатели вариации (колеблемости) признака 4 Сложение дисперсий 4 Показатель асимметрии 5 Показатель эксцесса (островершинности) 5 Кривые распределения 5 Выборочное наблюдение 6 Формулы ошибок простой случайной выборки 7 Формулы для определения численности простой и случайной выборки 7 Типичная выборка 7 Серийная выборка 8 Малые выборки 8 Корреляционная связь 8 Уравнение регрессии 9 Ряды динамики 9 Показатели динамики 9 Средние показатели динамики 10 Тренды 10 Семестр 2 (Индексы) 11 Семестр 1Группировка статистических данных и ее роль в анализе информацииРавный интервал, величина интервала - , m – число групп Формула Стерджесса (величина интервала) - , n – число наблюдений Абсолютные, относительные, средние величиныОтносительные величиныОтносительные величины (ОВ) динамики характеризуют изменение явления во времени. (Коэффициент роста) Темп роста – с переменной базой - yn– уровень явления за период (например, выпуск продукции по кварталам года) С постоянной базой - , yk – постоянная база сравнения ОВ планового задания - ОВ выполнения плана - ОВ динамики - ОВ структуры характеризуют долю отдельных частей в общем объеме совокупности (удельный вес) - ОВ координации отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на 10 или на 100 единиц другой изучаемой совокупности. ОВ координации - ОВ наглядности (сравнения) отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по 2-м предприятиям) ОВ сравнения - Средние величиныСтепенные средние общего типового расчета: Средняя степенная простая - , - индивидуальное значение признака, по которому рассчитывается средняя, n – объем совокупности (число единиц) Средняя степенная взвешенная - , fi – частота повторения индивидуального признака (=n)
гарм. < геом < арифм < квадрат, x=w/f Гармоническая простая – когда небольшая совокупность и индивидуальные значения не повторяются. Используется, если исчисляем среднюю из обратных величин. Средняя квадратическая – для расчета среднего квадратического отклонения, являющегося показателем вариации признаков Средняя геометрическая простая – для вычисления среднего коэффициента роста (темпа) в рядах динамики, если промежутки, к которым относятся коэффициенты роста, одинаковы. Статистические распределения и их характеристикиМода – значение признака, которое наиболее часто встречается в совокупности , - нижняя граница модального интервала (интервал с наибольшей частотой), - величина интервала, - частота в модальном интервале. Медиана – значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части. - положение медианы , - нижняя граница медианного интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала. Квартель , , Дециль , (от 1/10 до 9/10) Показатели вариации (колеблемости) признакаСреднее линейное отклонение – на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. -для несгруппированных данных (первичного ряда): -для вариационного ряда: Среднее квадратическое отклонение - для несгруппированных данных: - для вариационного ряда: Дисперсия - для несгруппированных данных: - для вариационного ряда: Коэффициент вариации (используется для характеристики однородности совокупности по исследуемому признаку) - до 17% – совокупность совершенно однородна, 17%-33% - достаточно однородна, >33% - неоднородна. Сложение дисперсийВеличина общей дисперсии () характеризует вариацию признака под влиянием всех факторов, формирующих уровень признака у единиц данной совокупности , - общая средняя арифметическая для всей совокупности Межгрупповая дисперсия () отражает систематическую вариацию, т. е. различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного в основу группировки ,- средняя в каждой группе, - число единиц в каждой группе Средняя внутригрупповая дисперсия () характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов, и не зависит от условия (признака-фактора), положенного в основу группировки. , где - дисперсия по отдельной группе или Равенство: Корреляционное отношение , >0,5 – связь между групповым фактором и результирующим признаком – тесная, <0,5 – связь слабая Показатель асимметрии, - центральный момент третьего порядка Средняя квадратическая ошибка: , n – число наблюдений Если , асимметрия существенна и распределение признака в генеральной совокупности не является симметричным. Если , асимметрия несущественна, ее наличие объясняется влиянием случайных обстоятельств. - правосторонняя асимметрия, - левосторонняя асимметрия. Показатель эксцесса (островершинности), - центральный момент четвертого порядка >0 – высоковершинное, < 0 – низковершинное (= -2 – предел) Средняя квадратическая ошибка: n – число наблюдений Кривые распределенияКривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде, называется кривой распределения. Плотность распределения (расчет теоретических частот) , - нормированное отклонение , - определяется по таблице (приложение 1) Критерий согласия К. Пирсона (для проверки близости теоретического и эмпирического распределений, для проверки соответствия эмпирического распределения закону нормального распределения) f – эмпирические частоты в интервале, f’ – теоретические частоты в интервале Критерий согласия Романовского , m – число групп, m-3 – число степеней свободы при исчислении частот нормального распределения Если к<3, то можно принять гипотезу о нормальном характере эмпирического распределения Критерий Колмогорова , D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами, n – сумма эмпирических частот Распределение Пуассона (теоретические частоты) , n – общее число независимых испытаний, λ – среднее число появления редкого события в n одинаковых независимых испытаниях, m – частота данного события, е=2,71828 Выборочное наблюдениеN – объем генеральной совокупности n – объем выборочной совокупности (число единиц, попавших в выборку) - генеральная средняя (среднее значение признака в генеральной совокупности) - выборочная средняя р – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности) w – выборочная доля - генеральная дисперсия - выборочная дисперсия - среднее квадратическое отклонение признака в генеральной совокупности S – среднее квадратическое отклонение признака в выборочной совокупности. Неравенство Чебышеба При неограниченном числе наблюдений, независящих друг от друга из генеральной совокупности с вероятностью сколь угодно близкой к 1, можно утверждать, что расхождение между выборочной и генеральной средней будет сколь угодно малой величиной . Теорема Ляпунова Дает количественную оценку ошибки. При неограниченном объеме из генеральной совокупности с Р расхождения выборочной и генеральной средней равна интегралу Лапласа , - нормированная функция Лапласа (интеграл Лапласа) Р – гарантированная вероятность t – коэффициент доверия, зависящий от Р
- предельная ошибка выборки , - стандартная среднеквадратическая ошибка , - предельная (максимально возможная) ошибка средней, t – коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки , - предельная (максимально возможная) ошибка доли Средняя ошибка (n>30) при случайной повторной выборке: , При случайной бесповторной выборке: , Формулы ошибок простой случайной выборки
Доверительные интервалы для генеральной средней – Доверительные интервалы для генеральной доли – Доверительная вероятность – функция от t, вероятность находится по приложению3 Формулы для определения численности простой и случайной выборки
Типичная выборкаПрименяется в тех случаях, когда из генеральной совокупности можно выделить однокачественные группы единиц (или однородные), затем из каждой группы случайно отобрать определенное число единиц в выборку. Стандартная среднеквадратическая ошибка: Повторный отбор - , - средняя из внутригрупповых Бесповторный отбор - Отбор единиц при типичной выборке из каждой типичной группы: 1.Равное число единиц , - число единиц, отобранных из i-ой типичной группы, n – общий объем, R – число групп 2.Пропорциональный отбор , - доля i-ой группы в общем объеме генеральной совокупности 3.Отбор единиц с учетом вариации случайного признака Серийная выборкаВместо случайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд). Внутри отобранных серий производится сплошное наблюдение. Средняя стандартная ошибка: Повторный отбор - , , m – число отобранных серий, - средний уровень признака в серии, - средний уровень признака для всей выборочной совокупности Бесповторный отбор - , M – общее число серий Малые выборкиВыборки, при которых наблюдением охватывается небольшое число единиц (n<30) Средняя ошибка малой выборки , Вероятность того, что генеральная средняя находится в определенных границах, определяется по формуле , - значение функции Стьюдента (приложение 4) Корреляционная связьДля оценки однородности совокупности – коэффициент вариации по факторным признакам , совокупность однородна, если ≤ 33% Линейный коэффициент корреляции Несгруппированные данные Сгруппированные данные - Оценка существенности линейного коэффициента корреляции при большом объеме выборки , . Если это отношение больше значения t-критерия Стьюдента (приложение 6, k=n-2, вероятность – 1-α) при недостаточно большом объеме выборки , Корреляционное отношение , , где , ,
Коэффициент ассоциации Коэффициент контингенции Уравнение регрессииЛинейная Гиперболичская Параболическая Показательная Для проверки возможности использования линейной функции определяется разность , если она <0,1 то можно применить линейную функцию. ,m – число групп. Если < F-критерия, то можно. (Значение F-критерия определяется по таблице (приложение 5) α=0,05, число степеней свободы числителя (k1 = m-2) и знаменателя (k2 =n-m)) Достоверность уравнения корреляционной зависимости , - средняя квадратическая ошибка, y – фактические значения результативного признака, - значения результативного признака, рассчитанные по уравнению регрессии, l – число параметров в уравнении регрессии. Если это отношение не превышает 10-15%, то уравнение хорошо отображает изучаемую взаимосвязь. Ряды динамикиПоказатели динамики
Средние показатели динамики
ТрендыЛинейный Пусть =0, тогда если количество уровней в ряду динамики нечетное, то временные даты (t) будут (-2, -1, 0, 1, 2). Если четное, то (-5, -3, -1, 1, 3, 5) Семестр 2 (Индексы)Индекс – относительная величина, характеризующая изменение уровней сложных социально-экономических показателей во времени, в пространстве или по сравнению с планом. Индивидуальный индекс физического объема выпуска продукции Индивидуальный индекс цен Индивидуальный индекс затрат на выпуск продукции Индивидуальный индекс стоимости продукции Агрегатный индекс физического объема продукции (Относительное изменение физического объема продукции в отчетном периоде по сравнению с базисным) - характеризует абсолютное изменение физического объема в относительном выражении без влияния ценового фактора. Средний взвешенный арифметический индекс физического объема продукции , iq – индивидуальный индекс по каждому виду продукции Средний взвешенный гармонический индекс физического объема продукции Агрегатный индекс цен (характеризует среднее изменение цен по совокупности различных видов продукции) - абсолютное изменение всей стоимости продукции за счет изменения цен Агрегатный индекс цен (характеризует среднее изменение цен на потребительские товары) Агрегатный индекс затрат на выпуск всей продукции Двухфакторный индекс Связь: Индекс планового задания Индекс степени выполнения плана Связь: Изменение себестоимости продукта А по фирме , средняя себестоимость - Индекс влияния структурных сдвигов в объеме продукции , d0 – удельный вес каждого предприятия в общем объеме выпуска продукта А Абсолютное изменение общей стоимости продукции за счет двух факторов: , за счет изменения физического объема продукции -, за счет изменения цен на продукцию - Абсолютное изменение общих затрат на выпуск продукции за счет двух факторов: , за счет изменения физического объема продукции - , за счет среднего изменения себестоимости единицы продукции - . Выработка - W = Q/T , W – выработка, Q – физический объем реализованной продукции/услуг, T – затраты живого труда (среднесписочная численность работников/рабочих) Трудоемкость (показатель, обратный выработке) - t = 1/W = T/Q Трудоемкость характеризует величину затрат рабочего времени на единицу произведенной продукции. Индекс динамики выработки переменного состава, определяющий отношение выработки отчетного периода к выработке базисного периода - Iw = W1/W0 Этот индекс характеризует изменение производительности труда под влиянием всех факторов, а именно: НТП, человеческого фактора (квалификация и т.п.) и др. Индекс динамики трудоемкости - It = t1/t0 Индекс динамики трудоёмкости характеризует изменение трудоёмкости в отчетном периоде по сравнению с базисным, и его величина зависит от изменения трудоёмкости производимой продукции и от изменения объемов производства этой продукции. IQ = IW * IT – система связанных индексов, которая позволяет определить влияние интенсивных и экстенсивных факторов на изменение объема продукции, услуг. Среднегодовая стоимость основных фондов в базисном и отчетном годах - , - введенные в эксплуатацию фонды в течение года, - число месяцев эксплуатации фондов в данном году, - фонды, выбывшие из эксплуатации в течение года, - число месяцев, оставшихся до конца года после выбытия фондов из эксплуатации. Фондоотдача -. Фондоёмкость – показатель, обратный фондоотдаче, за базисный и отчетный годы по формуле Индекс динамики фондоотдачи IVп.с.= = Этот индекс характеризует изменение фондоотдачи под влиянием всех факторов, включая НТП (новая техника, технология), человеческий фактор, структурный фактор, который на уровне АО может выражаться в изменении состава основных фондов в отчетном по сравнению с базисным годом. Индекс динамики фондоемкости Влияние интенсивного (качественного) и экстенсивного (количественного) факторов на абсолютное изменение физического объема продукции/услуг. Под экстенсивным фактором обычно понимают абсолютное изменение основных фондов. Под интенсивным – абсолютное изменение показателя фондоотдачи. Влияние экстенсивного фактора: Влияние интенсивного фактора: Влияние обоих факторов: Показатели фондовооруженности рабочих , - среднесписочная численность рабочих. Индекс динамики фондовооруженности: Коэффициент износа основных фондов на конец отчетного года Износ фондов на конец отчетного года |