Главная страница
Навигация по странице:

  • Что такое данные

  • Переменная

  • Генеральная совокупность

  • Параметры

  • Введение анализ данных


    Скачать 14.97 Kb.
    НазваниеВведение анализ данных
    Дата18.01.2019
    Размер14.97 Kb.
    Формат файлаdocx
    Имя файлаVVEDENIE.docx
    ТипДокументы
    #64185

    ВВЕДЕНИЕ

    Анализ данных — область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных; процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений. Анализ данных имеет множество аспектов и подходов, охватывает разные методы в различных областях науки и деятельности.
    Что такое данные?

    В широком понимании данные представляют собой факты, текст, графики, картинки, звуки, аналоговые или цифровые видео-сегменты.

    Данные могут быть получены в результате измерений, экспериментов, арифметических и логических операций.

    Данные должны быть представлены в форме, пригодной для хранения, передачи и обработки.

    Иными словами, данные - это необработанный материал, предоставляемый поставщиками данных и используемый потребителями для формирования информации на основе данных.

    Объект описывается как набор атрибутов.

    Объект также известен как запись, случай, пример, строка таблицы и т.д.

    Атрибут - свойство, характеризующее объект.

    Например: цвет глаз человека, температура воды и т.д.

    Атрибут также называют переменной, полем таблицы, измерением, характеристикой.

    В результате операционализации понятий [6], т.е. перехода от общих категорий к конкретным величинам, получается набор переменных изучаемого понятия.

    Переменная (variable) - свойство или характеристика, общая для всех изучаемых объектов, проявление которой может изменяться от объекта к объекту.

    Значение (value) переменной является проявлением признака.

    При анализе данных, как правило, нет возможности рассмотреть всю интересующую нас совокупность объектов. Изучение очень больших объемов данных является дорогостоящим процессом, требующим больших временных затрат, а также неизбежно приводит к ошибкам, связанным с человеческим фактором.

    Вполне достаточно рассмотреть некоторую часть всей совокупности, то есть выборку, и получить интересующую нас информацию на ее основании.

    Однако размер выборки должен зависеть от разнообразия объектов, представленных в генеральной совокупности. В выборке должны быть представлены различные комбинации и элементы генеральной совокупности.

    Генеральная совокупность (population) - вся совокупность изучаемых объектов, интересующая исследователя.

    Выборка (sample) - часть генеральной совокупности, определенным способом отобранная с целью исследования и получения выводов о свойствах и характеристиках генеральной совокупности.

    Параметры - числовые характеристики генеральной совокупности.

    Статистики - числовые характеристики выборки.

    Часто исследования основываются на гипотезах. Гипотезы проверяются с помощью данных.

    Гипотеза - предположение относительно параметров совокупности объектов, которое должно быть проверено на ее части.

    Гипотеза - частично обоснованная закономерность знаний, служащая либо для связи между различными эмпирическими фактами, либо для объяснения факта или группы фактов.

    Пример гипотезы: между показателями продолжительности жизни и качеством питания есть связь. В этом случае целью исследования может быть объяснение изменений конкретной переменной, в данном случае - продолжительности жизни. Допустим, существует гипотеза, что зависимая переменная (продолжительность жизни) изменяется в зависимости от некоторых причин (качество питания, образ жизни, место проживания и т.д.), которые и являются независимыми переменными.

    Однако переменная изначально не является зависимой или независимой. Она становится таковой после формулировки конкретной гипотезы. Зависимая переменная в одной гипотезе может быть независимой в другой.


    Измерения


    Измерение - процесс присвоения чисел характеристикам изучаемых объектов согласно определенному правилу.

    В процессе подготовки данных измеряется не сам объект, а его характеристики.


    написать администратору сайта