Главная страница

Математическая статистика в информатике.. РЕФЕРАТ(15). Введение Математическая статистика


Скачать 31.57 Kb.
НазваниеВведение Математическая статистика
АнкорМатематическая статистика в информатике
Дата21.10.2022
Размер31.57 Kb.
Формат файлаdocx
Имя файлаРЕФЕРАТ(15).docx
ТипРеферат
#746476

Содержание


Введение 3

1.История развития теории вероятностей и математической статистики. 4

2.Основные понятия математической статистики. 7

3.Математическая статистика в информатике. 10

Заключение 12


Введение


Математическая статистика - это раздел математики, в котором изучаются математические методы планирования экспериментов, систематизации, обработки и использования статистических данных для научных и практических целей. В математической статистике предполагается, что результаты опытных данных и наблюдений являются реализацией случайных величин или процессов, имеющих те или иные законы распределения.

Методы математической статистики обосновывают способы группировки и анализа статистических сведений о качественных и количественных признаках объектов различной природы. Проведение обследования каждого объекта большой совокупности относительно интересующего признака или физически невозможно или экономически нецелесообразно. Для установления статистических закономерностей случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.





  1. История развития теории вероятностей и математической статистики.


Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей - нормальное, а в теории случайных процессов основной объект изучения - гауссовские процессы.

В конце XIX в. - начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К. Пирсон (1857-1936) и Р.А. Фишер (1890-1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер - дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ в. поляк Ежи Нейман (1894-1977) и англичанин Э. Пирсон развили общую теорию проверки статистических гипотез, а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В. Смирнов (1900-1966) заложили основы непараметрической статистики. В сороковые годы ХХ в. румын А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Понятие случайного процесса введено в XX столетии и связано с именами А.Н. Колмогорова (1903-1987), А.Я. Хинчина (1894-1959), Е.Е. Слуцкого (1880-1948), Н. Винера (1894-1965). Это понятие в наши дни является одним из центральных не только в теории вероятностей, но также в естествознании, инженерном деле, экономике, организации производства, теории связи. Теория случайных процессов принадлежит к категории наиболее быстро развивающихся математических дисциплин. Несомненно, что это обстоятельство в значительной мере определяется ее глубокими связями с практикой. XX век не мог удовлетвориться тем идейным наследием, которое было получено от прошлого. Для исследования изменения во времени теория вероятностей конца XIX - начала XX века не имела ни разработанных частных схем, ни тем более общих приемов. А необходимость их создания буквально стучала в окна и двери математической науки. Изучение броуновского движения в физике подвело математику к порогу создания теории случайных процессов. В исследованиях датского ученого А.К. Эрланга (1878-1929) была открыта новая важная область, связанная с изучением загрузки телефонных сетей.

Во втором десятилетии XX века начались исследования динамики биологических популяций. Итальянский математик Вито Вольтерра (1860-1940) разработал математическую теорию этого процесса на базе чисто детерминистских соображений. Позднее ряд биологов и математиков развивали его идеи уже на основе стохастических представлений. Многие физические явления для своего изучения требуют умения вычислять вероятность того, что определенная доля молекул успеет за заданный промежуток времени перейти из одной области пространства в другую.

Теория броуновского движения, исходящая из теоретико-вероятностных предпосылок, была разработана в 1905 г. двумя известными физиками М. Смолуховским (1872-1917) и А. Эйнтейном (1879-1955). В частности, именно с этих работ, как, впрочем, и с работ Эрланга, проявился широкий интерес к процессу Пуассона. Впрочем, сам Пуассон ввел в рассмотрение только распределение Пуассона, но он заслужил, чтобы его имя произносилось и при рассмотрении случайных процессов, связанных с его распределением. Это не единственный случай, когда в честь того или другого исследователя новым понятиям присваиваются их имена, хотя до этих понятий они и не доходили. Теперь широко распространены гауссовские случайные процессы, хотя сам Гаусс о них не имел никакого представления, да и само исходное распределение задолго до его рождения было получено Муавром, Лапласом и др.

В теории же ошибок измерений одновременно с Гауссом к нему пришел также Лежандр. Попытка изучения средствами теории вероятностей явления диффузии была предпринята в 1914 г. двумя известными физиками - М. Планком (1858-1847) и А. Фоккером (1887-1972). Н. Винер в середине двадцатых годов при изучении броуновского движения ввел в рассмотрение процесс, получивший название винеровского процесса (процесса броуновского движения). Мы должны упомянуть еще о двух важных группах исследований, начатых в разное время и по разным поводам. Во-первых, эта работы А.А. Маркова (1856-1922) по изучению цепных зависимостей. Во-вторых, работы Е.Е. Слуцкого (1880-1948) по теории случайных функций.

В 1931 г. была опубликована большая статья А.Н. Колмогорова - Об аналитических методах в теории вероятностей, а через три года - работа А.Я. Хинчина - Теория корреляции стационарных стохастических процессов, которые следует считать началом построения общей теории случайных процессов. В первой из этих были заложены основы марковских процессов, а во второй - основы стационарных процессов. Они были источником огромного числа последующих исследований, среди которых следует отметить статью В. Феллера - К теории стохастических процессов (1936), давшую интегро-дифференциальные уравнения для скачкообразных марковских процессов. Обе только что упомянутые основополагающие работы содержат не только математические результаты, но и глубокий философский анализ причин, послуживших исходным пунктом для построения основ теории случайных процессов.

Математическая статистика бурно развивается и в настоящее время. Так, за последние 40 лет можно выделить четыре принципиально новых направления исследований:

- разработка и внедрение математических методов планирования экспериментов;

- развитие статистики объектов нечисловой природы как самостоятельного направления в прикладной математической статистике;

- развитие статистических методов, устойчивых по отношению к малым отклонениям от используемой вероятностной модели;

- широкое развертывание работ по созданию компьютерных пакетов программ, предназначенных для проведения статистического анализа данных.
  1. Основные понятия математической статистики.


Значительная часть математической статистики связана с необходимостью описать большую совокупность объектов. Всю совокупность объектов, подлежащих изучению, называют генеральной совокупностью.

Генеральной совокупностью могут быть всё население страны, месячная продукция завода, популяция рыб, живущих в данном водоёме и т.д

Но генеральная совокупность - это не просто множество. Если интересующая нас совокупность объектов слишком многочисленна, или объекты труднодоступны, или имеются другие причины, не позволяющие изучить все объекты, прибегают к изучению какой-то части объектов.

Та часть объектов, которая попала на проверку, исследование и т.п., называется выборочной совокупностью или просто выборкой. Число элементов в генеральной совокупности и выборке называется их объёмами.

Если целое, т.е. если генеральная совокупность нам мало известна или совсем неизвестна, не удаётся предложить ничего лучшего, чем чисто случайный выбор. Большая осведомлённость позволяет действовать лучше, но всё равно на некоторой стадии наступает незнание и, как результат - случайный выбор.

Если целое, т.е. если генеральная совокупность нам мало известна или совсем неизвестна, не удаётся предложить ничего лучшего, чем чисто случайный выбор. Большая осведомлённость позволяет действовать лучше, но всё равно на некоторой стадии наступает незнание и, как результат - случайный выбор.

Из генеральной совокупности извлечена выборка объёмом n> n1, где n1 - столько раз наблюдалось появление x1, n 2 - x2 и т.д.

Наблюдаемые значения хi называют вариантами, а последовательность вариантов, записанных в возрастающем порядке - вариационным рядом. Числа наблюдений ni называют частотами и ni/n - относительными частотами (или частостями).

Вариационным рядом называется ряд, расположенный в порядке возрастания (или убывания) вариантов с соответствующими им частотами (частостями).

При изучении вариационных рядов наряду с понятиями частоты используется понятие накопленной частоты. Накопленные частоты (частости) для каждого интервала находятся последовательным суммированием частот всех предшествующих интервалов.

Накопление частот или частостей называют кумуляцией. Кумулировать можно частоты вариант и интервалов.

Характеристики ряда могут быть количественные и качественные.

Количественные (вариационные) характеристики - это характеристики, которые можно выразить числами. Их подразделяются на дискретные и непрерывные.

Качественные (атрибутивные) характеристики - это характеристики, которые не выражаются числами.

Непрерывные переменные - это переменные, которые выражаются действительными числами.

Дискретные переменные - это переменные, которые выражаются только целыми числами.

Выборки характеризуются центральными тенденциями: средним значением, модой и медианой. Средним значением выборки называют среднее арифметическое всех её значений. Мода выборки - те её значения, которые встречаются чаще всего. Медиана выборки - это число, “разделяющее” пополам упорядоченную совокупность всех значений выборки.

Вариационный ряд может быть дискретным или непрерывны

Медианой вариационного ряда называется то значение случайной величины, которое приходится на средину вариационного ряда (Ме).

Медианой упорядоченного ряда чисел с нечетным числом членов называется число, записанное посередине, а медианой упорядоченного ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине. Медианой произвольного ряда чисел называется медиана соответствующего упорядоченного ряда.

Модой вариационного ряда называют вариант (значение случайной величины), которому соответствует наибольшая частота (Мо), т.е. которая встречается чаще других.

Среднеарифметическим значением вариационного ряда называется результат деления суммы значений статистической переменной на число этих значений, то есть на число слагаемых.

Правило нахождения среднеарифметического значения выборки:

a. каждую варианту умножить на её частоту (кратность);

b. сложить все полученные произведения;

c. поделить найденную сумму на сумму всех частот.

Размахом ряда называется разность между R=xmax -xmin, т.е. наибольшим и наименьшим значениями этих вариантов. Относительной частотой значений выборки называют отношение её частоты к числу всех значений выборки. Относительные частоты иначе называют частостями. Частоты и частости называют весами. Найдём размах ряда: R=5-1,2=3,8; Размах ряда равен 3,8.

Среднее арифметическое – это условная величина. Реально она не существует. Реально существует общая сумма. Поэтому среднее арифметическое не есть характеристика одного наблюдения; она характеризует ряд в целом.

Среднее значение можно трактовать как центр рассеивания значений наблюдаемого признака, т.е. значения, около которого колеблются все наблюдаемые значения, причём алгебраическая сумма отклонений от среднего, всегда равна нулю, т.е. сумма отклонений от среднего в большую или меньшую сторону равны между собой.

Среднее арифметическое является абстрактной (обобщающей) величиной. Даже при задании ряда только из натуральных чисел, среднее значение может выражаться дробным числом. Пример: средний балл контрольной работы 3,81.

Среднее значение находится не только для однородных величин. Средняя урожайность зерновых по всей стране (кукуруза-50-60 ц. с га. и гречиха-по5-6 ц. с га, рожь, пшеница и т.д.), среднее потребление продуктов питания, средняя величина национального дохода на душу населения, средний показатель обеспеченности жильём, средний взвешенный показатель стоимости жилья, средняя трудоёмкость возведения здания и т.д. - это характеристики государства как единой народнохозяйственной системы, это так называемые системные средние.

В статистике широкое применение находят такие характеристики, как мода и медиана. Их называют структурными средними, т.к. значения этих характеристик определяются общей структурой ряда данных.

Иногда ряд может иметь две моды, иногда ряд может не иметь моды.

Мода является наиболее приемлемым показателем при выявлении расфасовки некоторого товара, которой отдают предпочтение покупатели; цены на товар данного вида, распространённый на рынке; как размер обуви, одежды, пользующийся наибольшим спросом; вид спорта, которым предпочитают заниматься большинство населения страны, города, посёлка школы и т.д.

Моду ряда данных находят тогда, когда хотят выявить некоторый типичный показатель.

Мода может быть выражена числом и словами, с точки зрения статистики мода – это экстремум частоты.

Медиана позволяет учитывать информацию о ряде данных, которую даёт среднее арифметическое и наоборот.
  1. Математическая статистика в информатике.


Теоретический раздел любой науки базируется на математических методах исследования. Это относится и к информатике. Она использует методы математики для построения и изучения моделей обработки, передачи и использования информации, создаёт тот теоретический фундамент, на котором строится всё здание информатики.

По своей природе информация дискретна и представляется обычно в символьно-цифровом виде в текстах и точечном виде на рисунках. С учётом этого в информатике широко используется математическая логика, как раздел дискретной математики. Следующее направление теоретической информатики - вычислительная математика, которая разрабатывает методы решения задач на компьютерах с использованием алгоритмов и программ.

Информатика развивалась параллельно с прикладной математикой и до середины 1980-х годов была академической наукой, обслуживавшей отрасль вычислительной техники. Можно сказать, что ее статус, в отличие от прикладной математики, был долгое время спорным в связи с идеологическими спорами 1950-х годов. К тому же чрезмерная централизация и бюрократизация всего, что было связано с вычислительной техникой, замедлило разработку и выпуск отечественных персональных компьютеров.

В первой половине 1990-х гг. на обе дисциплины сильно повлияло появление в нашей стране большого количества персональных компьютеров. Выяснилось, что методы, разработанные для больших ЭВМ, устаревают и становятся невостребованными. Для новых информационных явлений не оказалось подходящей теоретической базы ни у прикладной математики, ни у советской информатики. В этот момент две дисциплины стали объединять как в рамках вузовских факультетов, так и в исследовательских институтах.

Тем не менее, специализация осталась: прикладную математику интересуют, в первую очередь, вычислительные методы. Для обработки гигантских объемов данных, получаемых физиками на андронных коллайдерах, астрономами с помощью космических телескопов, требуются суперкомпьютеры, принципы создания которых исследует, и формирует, несомненно, информатика, но на разработку программного обеспечения для таких вычислений первоочередное влияние оказывает прикладная математика.


Заключение


Как говорит Мак-Коннелл, статистика это, прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой.

Хотим ли мы спланировать бюджет, или рассчитать потребление бензина автомашиной! Оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок! Предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, - нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Список использованных источников

Годин, А. М. Статистика: учебник / А. М. Годин. - Москва: Дашков и К°, 2016. - 451 с.

Гореева, Н. М. Статистика в схемах и таблицах /. - Москва: Эксмо, 2017. - 414 с.

Ван, дер Варден Б.Л. Математическая статистика / Ван дер Б.Л. Варден. - М.: [не указано], 2014. - 123 c.

Едроновва Общая теория статистики / Едроновва, В.Н; Едронова, М.В.. - М.: ЮРИСТЪ, 2017. - 511

Елисеева, И. И. Статистика: [углубленный курс]: учебник для бакалавров / И. И. Елисеева и др.]. - Москва: Юрайт: ИД Юрайт, 2016. 565 с.

Зинченко, А. П. Статистика: учебник / А. П. Зинченко. - Москва: КолосС, 2016. -566 с.

Ивченко, Г.И. Математическая статистика / Г.И. Ивченко, Ю.И. Медведев. - М.: [не указано], 2016. - 329 c.

 Краснов, М.Л. Вся высшая математика / М.Л. Краснов, А.И. Киселев, Г.И. Макаренко. - М.: КД Либроком, 2014. - 256 c.

Ниворожкина, Л. И. Статистика: учебник для бакалавров: учебник /. Москва: Дашков и Кº: Наука-Спектр, 2015. – 415 с.

Романовский, В.И. Избранные труды, том 2. Теория вероятностей, статистика и анализ / В.И., Романовский. - М.: [не указано], 2017. - 145 c.

Статистика: учебник / [И. И. Елисеева и др.]. Москва: Проспект, 2015. - 443 с.

Статистика: теория и практика в Excel: учебное / В. С. Лялин, И. Г. Зверева, Н. Г. Никифорова. - Москва: Финансы и статистика: Инфра-М, 2016. - 446c

Тюрин, Ю.Н. Лекции по математической статистике / Ю.Н. Тюрин. - М.: [не указано], 2017. - 992 c.

Фадеева, Л.Н. Математика для экономистов. Теория вероятностей и математическая статистика. Задачи и упражнения / Л.Н. Фадеева, Ю.В. Жуков, А.В. Лебедев. - М.: Эксмо, 2016. -336 c.

Ячменёв, Л.Т. Высшая математика: Учебник / Л.Т. Ячменёв. -М.: Риор, 2017. - 42 c.


написать администратору сайта