Информатика и математика, (для юристов), 2011. Информатика и математика проблемнотематический комплекс
Скачать 3.34 Mb.
|
Полигон и гистограмма Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – по- лигон частот: ломаная, отрезки которой соединяют точки с координатами 2. План-конспект лекционного курса 191 (x 1 , n 1 ), (x 2 , n 2 ),…, (x k , n k ), где x i откладываются на оси абсцисс, а n i – на оси ординат. Если на оси ординат откладывать не абсолютные (n i ), а относи- тельные (w i ) частоты, то получим полигон относительных частот. По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события X < x. 2. Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого значения х относительную частоту события X < x. Таким образом: n n x F x = ) ( * , где п х – число вариант, меньших х; п – объем выборки. Замечание. В отличие от эмпирической функции распределения, най- денной опытным путем, функцию распределения F(x) генеральной сово- купности называют теоретической функцией распределения. F(x) опреде- ляет вероятность события X < x, а F*(x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F*(x) стремится по вероятности к F(x). Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно: • 0 ≤ F*(x) ≤ 1; • F*(x) – неубывающая функция; • если х 1 – наименьшая варианта, то F*(x) = 0 при х≤ х 1 ; если х к – наибольшая варианта, то F*(x) = 1 при х > х к . Для непрерывного признака графической иллюстрацией служит гис- тограмма, т.е. ступенчатая фигура, состоящая из прямоугольников, осно- ваниями которых служат частичные интервалы длиной h, а высотами – от- резки длиной n i /h (гистограмма частот) или w i /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объ- ему выборки, во втором – единице (см. рис. 14). Рис. 14. Гистограмма частот Характеристики генеральной совокупности. Выборочные средняя и дисперсия я о исследуемой случайной вели- чины енер среднее. Для оценки рассеяния значений гене лужат выборочные дис- Дл г h n i ценки математического ожидания альной совокупности служит выборочное х 1 х 2 х ральной совокупности с Информатика и математика 192 перс авленное среднее квадратическое отклонение. ия и среднее квадратическое отклонение, а также исправленная дис- персия и испр Выборочным среднимназывается среднее арифметическое значений случайной величины, принимаемых в выборке: n x n n x n x n x n п х х х х k i i i k k п В ∑ = = + + + = + + + = 1 2 2 1 1 2 1 , где x i – варианты, n i – частоты. Выборочной дисперсией называется n x x n n x x D k i B i i n i B i B ∑ ∑ = = − = − = 1 2 1 2 ) ( ) ( , ким отклонением B В D = σ а выборочным средним квадратичес Справедлива также следующая формула для вычисления выборочной дисперсии: 2 2 ) (x x D − = Пример 1. Найдем числовые характеристики выборки, заданной ста- тист i ическим рядом: x 2 5 7 8 n i 3 8 7 2 83 , 1 ; 3475 , 3 55 , 5 2 64 7 49 8 25 3 4 ; 55 , 5 20 2 8 7 7 8 5 3 2 2 = − 3475 , 3 = 20 = × + × + × + × = = × + × + × + × B В D = B х σ Друг ерис риаци яв мода М 0 – варианта, имеющая наибольшую частоту (в предыду- щем примере М 0 = 5); • медиана т е – варианта, которая делит вариационный ряд на две т нечетно ( n = ими характ тиками ва онного ряда ляются: • части, равные по числу вариант. Если число вариан 2k + 1 ), то m e = x k+1 , а при четном n =2k 2 1 + = k k е т . В частности, + x x в примере 1 6 2 = = e m Получив статистические оценки параметров распределения (выбороч- среднее, выборочную дисперсию и т.д.), нуж бедиться, что они в остаточной степени служат приближением соот твующих характери- генеральной сов ности. О этом выполняться 7 5 + ное но у д ветс стик окуп пределим требования, которые должны при Пусть Θ * – статистическая оценка неизвестного параметра Θ теорети- ческого распределения. Извлечем из генеральной совокупности несколько выборок одного и того же объема п и вычислим для каждой из них оценку параметра Θ: ,..., , * * 2 * 1 k Θ Θ Θ Тогда оценку Θ * можно рассматривать как слу- 2. План-конспект лекционного курса 193 чайн М( Θ * ) >Θ ют оценку, математическое ожидание которой не равн ую величину, принимающую возможные значения ,..., , * * 2 * 1 k Θ Θ Θ Если математическое ожидание Θ * не равно оцениваемому параметру, мы будем получать при вычислении оценок систематические ошибки одного знака (с избытком, если , и с недостатком, если М(Θ * ) < Θ). Следователь- но, необходимым условием отсутствия систематических яется требование М(Θ * ) = Θ. Статистическая оценка Θ* называется несмещенной, если ее матема- тическое ожидание равно оцениваемому параметруΘ при любом объеме выборки: М(Θ * ) = Θ. Смещенной называ ошибок явл о оцениваемому параметру. Однако несмещенность не является достаточным условием хорошего приближения к истинному значению оцениваемого параметра. Если при этом возможные значения Θ* могут значительно отклоняться от среднего значения, т.е. дисперсия Θ* велика, то значение, найденное по данным од- ной выборки, может значительно отличаться от оцениваемого параметра. Следовательно, требуется наложить ограничения на дисперсию. Статистическая оценка называется эффективной, если она при задан- ном объеме выборки п имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оцен- кам предъявляется еще и требование состоятельности. Состоятельной называется статистическая оценка, которая при п→∞ стремится по вероятности к оцениваемому параметру (если эта оценка не- смещенная, то она будет состоятельной, если при п→∞ ее дисперсия стре- мится к 0). Выборочное среднее является не только несмещенной, но и состоя- тельной оценкой математического ожидания. В отличие от выборочного среднего выборочная дисперсия является смещенной оценкой дисперсии генеральной совокупности. Можно предложить другую оценку дисперсии – исправленную дисперсию s², вычисляемую по формуле: 1 ) ( 1 1 2 2 − − = − = ∑ = n x x n D n n s k i B i i B Такая оценка будет являться несмещенной. Ей соответствует исправ- ленное среднее квадратическое отклонение 1 1 2 − = = = n s s i 3. При обработке статистического материала ) ( 2 − ∑ x x n k B i i всегда возникает вопрос: насколько точно полученные результаты отражают реальную ситуацию? Поскольку статистическому обследованию подвергается не вся со- вокупность объектов (генеральная совокупност , а только ее часть (вы- ь) Информатика и математика 194 борк к к т а), то любое суждение о генеральной совокупности, сделанное на ос- новании выборки, является приближенным, или, лучше сказать, предполо- жительным. Такие предположения называются статистичес ими гипоте- зами. Поставленный выше вопрос можно сформулировать так: насколько можно доверять статистической гипотезе? Покажем, ка ой отве на этот вопрос содержится в теории вероятностей. Пример. В городском управлении внутренних дел обработали данные о кар ическом отклонении S = 0,64. Мож По-другому можно сказать, что уровень нашего доверия к гипо манных кражах в общественном транспорте в течение года. Среднее число краж составило 12,1 в день. В то же время среднее число краж за но- ябрь оказалось 11,9 при среднем квадрат но ли считать, что данные за ноябрь занижены по сравнению с дан- ными за год? Пусть гипотеза состоит в том, что разница между средними несущест- венна, т.е. она зависит в основном от каких-то случайных факторов, влия- нием которых можно пренебречь. Влияние этих факторов мы оценим ве- личиной 5%. тезе составляет 95%. Пользуясь терминологией теории вероятностей, мы скажем, что доверительная вероятность р равна 0,95. Нам нужно сравнить отклонение средних а = 12,1 – 11,9 = 0,2 с так на- зываемым критическим отклонением k, которое находят из равенства: 2 ) ( , p t Ф n St k = = , гдеФ, как и выше, – функция Лапласа. В нашем примере 2 p = 0,475, п – число наблюдений в ноябре – равно числу дней, т.е. п = 30. Как видно из таблицы, Ф(2) = 0,4772 ≈ 0,475, следовательно, прибли- женно можно считать, что t = 2. Так как S = 0,64, 30 = = 5,48, то n 23 , 0 48 , 5 = 2 64 , 0 × = k Критическое отклонение получилось больше, чем отклонение средних – 0,2. ипотеза ся, т.е. при уровне доверия 95% данные за ноябрь можно считать незаниженными. Примечание. Если число наблюдений п меньше 30, то вместо функции Лапл вопросы темы 1. Ал ий. Формулы. Следовательно, г принимает аса Ф пользуются другой функцией, которая дает более точные ре- зультаты. Подробнее см.: 1. Э ЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ ЛОГИКИ Основные Т ЕМА 15 гебра высказыван 2. План-конспект лекционного курса 195 2. Формулы логи юридических проблемных ситуаций ы методы многозначной и двухзнач- математической логики. , о котором мож - ки предикатов. Важную роль при исследовании еним играет алгебра логики, где прим ной , а также мощный аппарат логики 1. Основным объектом изучения алгебры высказываний, алгебры ло- гики или Булевой алгебры являются высказывания. Будем понимать под высказыванием такое утверждение но сказать: истинно оно или ложно. Когда суждение, являющееся со- держанием какого-либо высказывания, истинно, то и высказывание истин но, и наоборот, если суждение ложно, то и высказывание ложно. В тради- ционном исчислении высказываний исследуются высказывания, которые или истинны или ложны, и ни одно высказывание не может быть истин- ным и ложным одновременно. Например: • 20 > 5; • Москва – столица России; один из крупнейших • Берлин – Вам городов Франции; лет? – это не высказывание. с точки зрения их истин- й язык, с помо- щью • Сколько Любое высказывание будем рассматривать ности или ложности (их логического значения). твенны В логике высказываний применяется искусс которого обозначаются высказывания, формулируются законы логи- ки данной дисциплины и частные правила действий с высказываниями. Каждое высказывание мы будем обозначать заглавными латинскими бук- вами, и определим формальные правила обращения с высказываниями. Считая, что если А = 0 , то высказывание ложно, и наоборот. Однознач- ность построения формул и определения порядка действий будем дости- гать использованием скобок () – это технические знаки. Высказывание, обозначенное с помощью одной какой-либо буквы латинского алфавита, будем называть элементарным или атомарным вы- сказыванием. Оно рассматривается как неразложимая единица, т.е. ника- кое другое высказывание не входит в него в качестве его части. Единственное свойство элементарного высказывания, изучаемое в алгебре логики, – это его истинностное значение. Никакого другого кон- кретного содержания элементарное высказывание не имеет. Заметим, что выражения типа: «В том году был хороший урожай хле- бов» и «Целое число n является простым» не могут считаться высказыва- ниями, поскольку о них нельзя сказать, истинны они или ложны. Информатика и математика 196 Из элементарных высказываний можно составить сложные высказы- вания с помощью логических операций. Все операции в логике высказы- ваний описываются только таблицей истинности. Функция ) ,..., ( 1 n x x f называется n–местной булевой функцией, если каждая переменная принимает только два значения 0 или 1 и функция принимает значения в этом же множестве {0;1}. 1. Отрица Для логической операции «отрицание» таблица истинности выглядит следующим образом: ние А А 0 1 1 0 Иллюстрацией отрицания в естественном языке служит частица «не» или слова «неверно, что» Покажем, что А А = : А А А 0 1 0 1 0 1 2. Конъюнкция Введем еще одну логическую операцию, определив ее словесно сле- дующим образом. Конъюнкция двух сказываний истинна тогда и толь- ко то сказывания истинны. Эта логическая операция на- зыва вы гда, когда оба вы ется еще логическим умножением, или логическим минимумом. Выпишем таблицу истинности для конъюнкции: А В В А & 0 0 0 0 1 0 1 0 0 1 1 1 Свойства конъюнкции: А А = 1 & ; 0 ; & = А А ; А А А А = & 0 0 & = та операция чаще всего интерпретирует- ся союзом «и 3. Дизъюнкц Еще Дизъ ементарных высказываний истинна тогда и только тогда, когда истинно хотя бы одно из элементарных высказываний. Обо- В естественном языке э ». ия одной из логических операций является операция дизъюнкции. юнкция двух эл 2. План-конспект лекционного курса 197 знач я знаком и иногда называется логическим сложе- нием ается эта операци ∨ или логическим максимумом. Таблица истинности дизъюнкции вы- глядит так: А B B А ∨ 0 0 0 0 1 1 1 0 1 1 1 1 Укажем свойства это : й операции ; 1 = ∨ А А ; 1 1 = ∨ А A А = ∨ 0 ; А А А = ∨ 4. Им Следующая орую м рассмотрим, – это опе- рация ложна тогда и только тогда, когда пликация логическая операция, кот ы исти A если истинна i n нно A A A − ∃ ∨ ∨ ∨ 2 1 , импликации. Импликация А – ис- тинно, а B – ложно. А B B A → 0 0 1 0 1 0 1 0 1 1 1 1 Это выражение читает так: если ся А , то B . В таком виде часто фор- мулируются математически еорем Если теорема сформулирована как- нибудь иначе, то ее можно ерефра ровать указанном виде, не теряя сущности. щ е т ы. п зи в В математических терминах импликация е е обозначается фразами: B – следствие А ; А – достаточное условие B Импликацию тоже можно выразить через &, ∨,¬ B A B A B A ∨ = = → & 5. н ть О а значения Эквивалент ос на истинна только тогд , когда А и B совпадают. Эту опер м: ацию еще иногда называют логическим равенство А B B А ↔ 0 0 1 Информатика и математика 198 0 1 0 1 0 0 1 1 1 В математических терминах эта операция интерпретируется в каче- стве фраз «тогда и толь тогда», « обходим и достаточно». Такая форма тоже очень часто пользуется формулировке теорем. Эквива- лентность представляется : ( & B В А B А → → = ↔ , ко не о ис в в виде ( ) ) A т.е. из А следует B и из B следует А Алфавитом называется любой непустой набор символов. Элементы этого набора называются символами алфавита. Словом в алфавите G называется произвольная конечная (возможно пустая следоват имво ) по ельност лов из . Фиксируем некоторый конеч- ный е 2 1 x x ь с G или счетный алфавит пер менных ( X ,...) , = пе Формула алгебры логики определяется следующим образом (индук- тивное определение): • любая логическая ременная есть формула; • если А – формула, то ( ) А – формула (допустимы технические сим- волы); • если А и B – формулы, то B A B A B A B A B A B A B А / , , , , , & , , ⊕ ↔ → ∨ – тоже формулы (допустимы все логические связки); • других формул нет. Подформулой формулы А называется любое подслово слова А , кото- рое само является формулой. обычно принимаются следующи сначала производится дейс л няе писи. автологией, если цию «тождественная единица», и тождественно лож- Для сокращения записи формул е со- глашения: заключена в скобки, то • если часть формулы твие в скобках; • если над частью форму ы стоит знак отрицания, то он заме т со- бой скобки, в которые заключена эта часть формулы. Принят следующий порядок выполнения операций: • отрицание; • конъюнкция; • дизъюнкция; • импликация и эквивалентность в порядке их за Формула называется тождественно истинной или т она реализует функ ной, если 0. |