Урб. УРБ 1.2. Анализ данных в бизнесе. Место дисциплины в учебном плане вариативная (дисциплина по выбору студента), 2 триместр Краткое
Скачать 148.92 Kb.
|
Анализ данных в бизнесе АНАЛИЗ ДАННЫХ В БИЗНЕСЕ Аннотация курса Ответственный преподаватель курса: Говорова Ангелина Валерьевна Место дисциплины в учебном плане: вариативная (дисциплина по выбору студента), 2 триместр Краткое содержание дисциплины: Задача курса – познакомить студентов с основами анализа данных и его применении в профессиональной деятельности менеджера. Общая трудоёмкость дисциплины: 3 зачётные единицы, 108 академических часов Язык преподавания: русский Краткое содержание тем дисциплины Тема 1. Введение в анализ данных: основы Python Ценность анализа данных для принятия решений в бизнесе. Этапы проведения анализа данных. Python как инструмент анализа данных: задачи и цели использования. Установка необходимого программного обеспечения для работы с Python (Visual Studio Code, Jupiter). Основы синтаксиса Python. Списки и таблицы. Функции, переменные и условия. Импорт и чтение файлов. Типы данных в Python. Библиотека pandas: установка и основы синтаксиса. Тема 2. Предварительная обработка данных Цели и задачи предварительной обработки данных. Работа с пропусками: обнаружение, поиск причин, заполнение пропусков. Изменение типов данных. Основные методы поиска дубликатов и причины их появления. Стемминг и лемматизация. Работа с несовершенными реальными наборами данных. Тема 3. Инструменты визуализации данных Визуализация данных для их анализа. Основные библиотеки для визуализации данных: matplotlib, seaborn, plotly, geoplotlib. Визуализация данных с помощью гистограмм, ящиков с усами, круговых диаграмм. Группировка данных, создание срезов, построение сводных таблиц. Работа с несколькими источниками данных: объединение таблиц методами merge() и join(). Выбор типа графика в зависимости от типа данных и целей визуализации. Создание интерактивных графиков в Google Charts. Тема 4. Статистический анализ данных Изучение объектов и их взаимосвязей методами статистики. Гистограммы частот и плотностей. Дисперсия, стандартное отклонение и скошенность наборов данных. Введение в теорию вероятностей. Эксперименты, элементарные исходы, события. Проверка гипотез исследования. Выборки и статистическая значимость. Формулирование односторонней и двусторонней гипотез. Тест Стьюдента. Гипотеза о равенстве средних двух генеральных Анализ данных в бизнесе совокупностей. Гипотеза о равенстве средних для зависимых (парных) выборок. Тема 5. Анализ бизнес-показателей Анализ данных в предпринимательстве и управлении проектом. Связь бизнес-метрик и KPI. Анализ пользовательских данных. Маркетинговая аналитика и её инструменты. Воронка продаж. Когортный анализ потребителей. Retention Rate и Churn Rate (коэффициент удержания и коэффициент оттока). Юнит-экономика. Пользовательские метрики: оценка пользовательской активности. Источники данных о поведении пользователей компании. Тема 6. Принятие решений в бизнесе на основе данных Методы и инструменты проверки гипотез. Качественные и количественные методы проверки гипотез. Приоритизация гипотез: параметры reach, impact, confidence, efforts. Подготовка к A/B-тестированию: А/А тест, ошибки I и II рода при проверке гипотез, множественные сравнения, расчёт размера выборки и длительности теста. Графический анализ метрик. Анализ результатов A/B-тестирования. Проверка гипотезы о равенстве долей, проверка данных на нормальность (критерий Шапиро-Уилка). Непараметрический тест Уилкоксона-Манна-Уитни. Формулирование выводов на основе полученных результатов. Основные ошибки при анализе А/В-тестов. Презентация результатов аналитического исследования. Способы наглядного представления данных. Создание отчётов, объясняющих выводы аналитика. |