1. Понятие о статистике 3
Скачать 4.08 Mb.
|
Приложение 5. Критические значения коэффициента автокорреляциипри уровне значимости α: 0,05 и 0,01
Приложение 6. Значения критерия Колмогорова P(λ)
1 От лат. status – состояние, положение вещей; первоначально термин употреблялся в значении «политическое состояние» 2 Эту деятельность на профессиональном уровне осуществляет государственная статистика – Федеральная служба государственной статистики (ФСГС) и система ее учреждений, организованных по административно-территориальному признаку, а также ведомственная статистика (на предприятиях, ведомствах, министерствах и т.д.). Информация ФСГС публикуется в специадльных печатных изданиях, а также в сети Интернет: www.gks.ru (или www.fsgs.ru) 3 Термин «статистика» как параметр, как статистический критерий употребляется преимущественно в математической статистике, некоторые из них (χ2, t и др.) рассмотрены в соответствующих темах данного курса лекций 4 «There are three types of lies - lies, damn lies, and statistics» (Benjamin Disraeli, 1804 – 1881) 5 « As a general rule, the most successful man in life is the man who has the best information » 6 Аналогично общее количество школьных тетрадей измеряется в у.ш.т.(условные школьные тетради размером 12 листов), продукция консервного производства измеряется в у.к.б. (условные консервные банки емкостью 1/3 литра или 400 грамм); продукция моющих средств приводится к условной жирности 40% 7 f– это начальная буква англ. слова frequency – частота 8 В статистике, в отличие от математики, пределы суммирования не ставятся, а подразумеваются, так как абсолютные величины здесь не абстрактные, а смысловые (суммируются все величины совокупности – с первой по последнюю) 9 Во многих учебниках по статистике встречается другое название индекса динамики – темп роста. Использование такого названия не совсем логично, так динамика может быть различна (не только рост, но и спад, а также стабильность), поэтому наиболее правильным является использование названия «индекс динамики» или «индекс изменения» 10 Часто встречается и другое название темпа изменения – темп прироста, что не совсем логично (см. предыдущую сноску) 11 Обычно (в т.ч. и в дальнейшем в данном пособии) в статистических формулах пределы суммирования не ставятся, а подразумеваются, т.е. подразумеваются именно такие пределы как формуле (11) – с 1-ой группы по N-ю (последнюю) 12 Для взвешенной средней сумма взвешенных отклонений равна нулю – доказать самостоятельно 13 Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ, то есть ρ = f/h 14 Единицы совокупности, имеющие значение признака, равное границе интервала, включаются в тот интервал, где это точное значение впервые указывается 15 От греч. «гистос» – ткань, строение 16 От греч. слов «поли» и «гонос» – многоугольник 17 При четном числе единиц совокупности за медиану принимают полусумму из двух центральных вариант 18 Получите формулы и произведите их расчет (по аналогии с формулами для расчета квартилей) самостоятельно 19 Максимально возможные значения показателей вариации: Лmax = ; ; ; 20 Например, цена продажи американского доллара в коммерческих банках Н.Новгорода 26 июля 2007 года варьировала от 25,45 до 26,00 при средней цене 25,595 руб., тогда по формуле (32) = (26,00–25,45)/25,595 = 0,021, или 2,1%. Такая малая вариация вызвана тем, что при значительном различии курса доллара немедленно произошел бы отлив покупателей из «дорогого» банка в более «дешевые». Напротив, цена килограмма говядины в разных регионах России варьирует очень сильно – на десятки процентов и более. Это объясняется разными затратами на доставку товара из региона-производителя в регион потребитель. 21 Прочие виды распределений изучаются дисциплиной «Теория вероятностей» 22 Простой расчет возможен при наличии Excel из пакета MicrosoftOffice, где имеется функция, вычисляющая плотность (или интеграл) функции нормального распределения =НОРМРАСП(А;Б;В;Г), где параметры: А – значение X; Б – средняя арифметическая ; В – среднее квадратическое отклонение σ; Г – «0» для вычисления плотности (или «1» для вычисления интеграла) распределения 23 Иногда за счет округлений при расчетах (использование функции плотности распределения вместо интеграла) может быть нарушено равенство сумм эмпирических и теоретических частот, что и произошло в нашем примере про ВО (∑f=35, ∑m=33,832) 24 Практически приемлемая вероятность в экономических исследованиях, означающая, что в 5 случаях из 100 может быть отвергнута правильная гипотеза 25 Основное условие для использования критерия Колмогорова – достаточно большое число наблюдений (N > 50) 26 Названо по имени французского математика Симеона Пуассона (1781 – 1840), еще называют законом распределения редких явлений; возникает, когда значения признака выражены дискретно и являются результатом какого-либо редко возникающего события среди наблюдаемых единиц, причем с увеличением значений признака вероятность наступления события падает 27 Важно не путать понятие «структурный сдвиг», оцениваемый в теме 8, где он представляет не величину самого изменения структуры, а его влияние на результативный показатель 28 Индекс не удовлетовряет свойству независимости от раскола совокупности 29 Существуют и другие показатели, о которых можно прочитать в специальной литературе 30 Приведены наиболее простые функции, более сложные виды, такие как логарифмическая, логистическая и др. описаны в специальной литературе, например – [2] 31 При расчете параметров уравнения тренда на ЭВМ необходимость вести отсчет от середины ряда динамики отпадает. Например, для получения уравнения тренда в MicrosoftOfficeExcel необходимо построить его график с помощью «Мастера диаграмм», после чего вызвать контекстное меню, нажав на правую кнопку мыши на построенном графике, и выбрать пункт «Добавить линию тренда», в появившемся окне выбрать подходящую математическую функцию и установить галочку «показывать уравнение на диаграмме» 32 Понятие «уровень значимости» описано ранее на стр. 29 33 Выравнивание по параболе рассмотрено в методических указаниях к теме на другом примере 34 Используется при малом количестве уровней (n<30), в противном случае (n>30) вместо используют коэффициент доверия t нормального закона распределения (Приложение 1) 35 Попробуйте проделать данное задание самостоятельно (в случае затруднений обратитесь к методическим указаниям по данной теме) 36 Выполните это задание дома самостоятельно (подсказка: продифференцировав и приравняв нулю уравнение учтите, что и ) 37 Подобрать уравнение второй гармоники ряда Фурье по данным табл. 32 самостоятельно 38 Проделайте данное задание самостоятельно 39 Проявление стохастических связей подвержено действию закона больших чисел: лишь в достаточно большом числе единиц индивидуальные особенности сгладятся, случайности взаимопогасятся и зависимость, если она имеет существенную силу, проявится достаточно отчетливо 40 Термин «стохастический» происходит от греч. «stochos» – мишень. Стреляя в мишень, даже хороший стрелок редко попадает в ее центр, выстрелы ложатся в некоторой близости от него. Другими словами стохастическая связь означает приблизительный характер значений признака 41 Термин «корреляция» ввел в статистику английский биолог и статистик Ф. Гальтон в конце XIX в., под которым понималась «как бы связь», т.е. связь в форме, отличающейся от функциональной. Еще ранее этот термин применил француз Ж.Кювье в палеонтологии, где под законом корреляции частей животных он понимал возможность восстановить по найденным в раскопках частям облик всего животного 42 Множественная корреляция изучается в курсе эконометрики на основе применения компьютерных программ (напр., специальная надстройка к Excel, SPSS и др.), в курсе статистики изучается только парная корреляция 43 При измерении тесноты связи между рядами динамики это равнозначно отсутствию автокорреляции между уровнями ряда, т.е. прежде чем оценивать тесноту связи между рядами динамики, необходимо проверить каждый ряд на автокорреляцию – см. методические указания 44 Проделать это самостоятельно 45 Термин «регрессия» ввел в статистику Ф. Гальтон, который изучив большое число семей, установил, что в группе семей высокорослыми отцами сыновья в среднем ниже ростом, чем их отцы, а в группе семей с низкорослыми отцами сыновья в среднем выше отцов, т.е. отклонение роста от среднего в следующем поколении уменьшается – регрессирует 46 Параметры a0и a1 можно получить не только методом подстановки как приводится далее, но и методом определителей 2-го порядка (проделать данное задание самостоятельно) 47 Сумма эмпирических (2864,09) и выравненных по прямой линии (2864,115) значений должна совпадать, но в нашем случае этого не происходит из-за округлений расчетов до 3-х знаков после запятой 48 В числителе – сумма последнего столбца, а в знаменателе – сумма предпоследнего столбца таблицы 45 49 Коэффициент автокорреляции можно рассчитывать либо между соседними уровнями, либо между уровнями, сдвинутыми на другое число единиц времени (временной лаг) m; приведенные формулы с временным лагом m=1 (между соседними уровнями) являются самыми распространенными 50 Формула (156) является тождественной формуле (155) 51 См. тему 5 «Ряды динамики», метод аналитического выравнивания 52 Остаточные величины обычно обозначают εt, но для того, чтобы различать их для разных рядов динамики x и y, приняты обозначения dx и dy 53 По значению коэффициент контингенции всегда меньше коэффициента ассоциации 54 Такая очередность изменения факторов (то есть 1-ый – экстенсивный, а 2-ой – интенсивный) применяется по умолчанию тогда, когда ее затруднительно точно установить 55 В случае построения многофакторных мультипликативных индексных моделей бывает сложно точно определить очередность влияния факторов на результативный показатель, поэтому можно рекомендовать ставить на 1-ое место индекс того фактора, который сильнее всего изменился, на 2-ое место – индекс того фактора, который изменился слабее первого, но сильнее остальных и так далее в порядке убывания изменений индексов 56 Самостоятельно догадайтесь и придумайте пример, когда эффект Гершенкрона выполняться не будет (подсказка – «эффект картошки») 57 Если зафиксировать веса на уровне базисного периода f0, то получим менее распространенную формулу индекса фиксированного состава: или . 58 При фиксировании индексируемой величины на уровне отчетного периода x0 получается менее распространенная формула индекса структурных сдвигов: или . 59 В противном случае применяются формулы, приведенные в сносках к этим формулам. Для определения очередности влияния факторов рассчитываются и те, и другие формулы, а затем рассчитывается их средняя геометрическая величина (индексы Фишера). Сравнивая значения этих индексов Фишера, решается вопрос об очередности влияния факторов: какой из индексов показывает большее изменение, тот фактор и считают 1-ым. 60 Выбор этой формулы вызван тем, что изменение структуры – это 1-ый фактор, и изменение самих цен – 2-ой (доказать это самостоятельно, воспользовавшись предыдущей сноской) 61 В названии использованы начальные буквы фамилий трех статистиков, предложивших этот индекс: венгров Элтетэ и Кэвеша и поляка Шульца |