Главная страница
Навигация по странице:

  • Порядок выполнения задания Кластерный анализ

  • Joining (tree clustering

  • Ward’s method

  • Euclidean distance

  • Статистический пакет STATISTICA. Содержание Введение Теоретические сведения 1 Статистика. Виды статистического анализа 2 Статистический пакет statistica статистический анализ экономических данных в statistica 1 Практическое задание.


    Скачать 256.66 Kb.
    НазваниеСодержание Введение Теоретические сведения 1 Статистика. Виды статистического анализа 2 Статистический пакет statistica статистический анализ экономических данных в statistica 1 Практическое задание.
    АнкорСтатистический пакет STATISTICA
    Дата16.03.2023
    Размер256.66 Kb.
    Формат файлаdocx
    Имя файлаfile_435319.docx
    ТипРеферат
    #995808
    страница4 из 4
    1   2   3   4

    2.2 Практическое задание 2. Кластерный анализ в STATISTICA



    Постановка задачи

    Двадцать банков, акции которых котируются на рынке, предоставили следующую информацию (см. табл.), где – x затраты за прошлый период, y – прибыль за прошлый период.

    Необходимо:

    1) дополнить таблицу до 20 значений. Данные можно не просто придумать, а взять из любых примеров деятельности банков того или иного города, приведенных в книгах по статистике, эконометрике, СМИ, Internet или любых иных источников.

    2) построить график по исходным данным (Scatterplot)

    3) c использованием системы STATISTICA выяснить (дать рекомендацию) акции каких банков некоторому предприятию имеет смысл приобрести, каких – придержать, а от каких – избавиться.

    Таблица

    Номер

    банка

    Затраты

    x

    Прибыль

    y

    1

    4

    2

    2

    6

    10

    3

    5

    7

    4

    12

    3

    5

    17

    4

    6

    3

    10

    7

    6

    1

    8

    6

    3

    9

    15

    1

    10

    15

    4

    11

    5

    4

    12

    3

    8

    13

    13

    5

    14

    15

    3

    15

    5

    9


    Порядок выполнения задания

    Кластерный анализ – один из методов статистического многомерного анализа, предназначенный для группировки (кластеризации) совокупности элементов, которые характеризуются многими факторами, и получения однородных групп (кластеров). Задача кластерного анализа состоит в представлении исходной информации об элементах в сжатом виде без ее существенной потери.

    STATISTICA предлагает несколько методов кластерного анализа. В дальнейшем будем использовать Joining (tree clustering) – группу иерархических методов (7 видов), которые используются в том случае, если число кластеров заранее неизвестно.


    Используемый метод – Ward’s method – метод Уорда, который хорошо работает с небольшим количеством элементов и нацелен на выбор кластеров с примерно одинаковым количеством членов. В качестве метрики расстояния пакет предлагает различные меры, но наиболее употребительными являются Euclidean distance (евклидово расстояние). При кластеризации элементов в пакете STATISTICA следует выбирать режим: cases (rows) – строки, а при кластеризации факторов: variables (columns) – столбцы. В качестве переменных для рассматриваемого примере следует выбрать все переменные (all).

    Для вывода результатов на экран следует выбрать
    либо .

    Вывести график на печать.
    Проанализировать результат и заполнить таблицу.

    Номер

    банка

    Затраты

    x

    Прибыль

    y

    Рекомендация

    приобрести/придержать/избавиться

    1

    4

    2




    2

    6

    10




    3

    5

    7




    4

    12

    3




    5

    17

    4




    6

    3

    10




    7

    6

    1




    8

    6

    3




    9

    15

    1




    10

    15

    4




    11

    5

    4




    12

    3

    8




    13

    13

    5




    14

    15

    3




    15

    5

    9




    16










    17










    18










    19










    20











    1   2   3   4


    написать администратору сайта