Главная страница
Навигация по странице:

  • От теории к практике. Как построить гистограмму

  • Как это сделать

  •  что значит: СКО много больше среднего или наоборот, много меньше

  • Пример отчета 1 расширеный c комментариями и пояснениями (1). Отчета по практической работе Предмет Метеорологические процессы в городах и промышленных зонах


    Скачать 2.38 Mb.
    НазваниеОтчета по практической работе Предмет Метеорологические процессы в городах и промышленных зонах
    Дата09.11.2022
    Размер2.38 Mb.
    Формат файлаpdf
    Имя файлаПример отчета 1 расширеный c комментариями и пояснениями (1).pdf
    ТипОтчет
    #778735

    Пример отчета по практической работе
    Предмет: «Метеорологические процессы в городах и промышленных зонах»
    1. Титульный лист
    РГГМУ
    Кафедра МКОА
    Практическая работа по курсу «Метеорологические процессы в городах и промышленных зонах» на тему: «Статистическая обработка результатов измерения концентрации загрязняющих веществ по наблюдениям на автоматизированных постах системы городского мониторинга»
    Вариант № 1, NO
    2
    Выполнил: ст. гр. ,,,,,,,,
    Студент: ,,,,,,
    Проверил: Мханна Ааед Исмаил Назир
    СПб,2022 2. Описание работы
    Цель: проанализировать временной ряд значений концентрации диоксида азота (окиси углерода).
    Задачи:
    1. Проверить ряд на презентабельность.
    2. Получить эмпирический закон распределения значений концентрации исследуемой величины и сравнить его с логарифмически нормальным законом распределения.
    3. Получить осредненный суточный ход исследуемой величины.
    Исходные данные: временной ряд значений концентрации диоксида азота (окиси углерода) с 01.01.01 по 31.03.01 с шагом по времени около 20 минут.
    Максимально-разовая ПДК(NO
    2
    ): 0,040 мг/м
    3
    Среднесуточная ПДК(NO
    2
    ): 0,085 мг/м
    3 1. Анализ ряда
    ОТБРАКОВКА ДАННЫХ
    Визуальная оценка ряда. Строите график и выделяете выпадающие из общего ряда значения. Это могут быть отдельные одиночные скачки или, наоборот, интервалы с постоянными значениями. Удаляете такие как недостоверные. Удаляете полностью строкой. Также удаляете строки с отсутствующими значениями концентрации, можно также удалить нулевые значения.
    Отдельные значения ищите по дате, нули и пустые удобно искать «Фильтр» -
    «Автофильтр».

    Рис.1.1. График изменчивости концентрации за весь период наблюдений
    Таблица 1.1.
    Число недостоверных данных
    Число наблюдений
    Период
    (если больше суток)
    Отрицательные и нулевые значения
    Отбракованные периоды
    Число отбракованных наблюдений по другим причинам (если есть, с указанием причины)
    Всего отбраковано наблюдений:
    -
    Если ничего не отбраковано, таблицу рисовать не обязательно, достаточно сказать об этом выводах.
    ТИПИЗАЦИЯ СУТОЧНОГО ХОДА
    Выберите любые сутки, которые Вам понравятся (можно не одни), укажите дату, нанесите ПДК, среднее для всего ряда
    Суточный ход концентрации примеси на первую неделю мая 2004 г
    0 0.5 1
    1.5 2
    2.5 3
    3.5 0:00 4:48 9:36 14:24 19:12 0:00
    Время
    К
    о н
    ц е
    н тр а
    ц и
    я
    С
    О
    , м г/
    м
    3 1 мая СБ
    2 мая ВС
    3 мая ПН
    4 мая ВТ
    6 мая СР
    7 мая ПТ

    Пример выводов:
    На рисунке таком то приведен суточных ход концентрации СО для первой декады мая 2004 года. Видно, что в рабочие дни ход концентрации имеет общую форму, с максимумом в утренний час пик движения автотранспорта, 8:30 – 9:30 утра, и вечерний максимум, начинающийся с 20-21 часа и спадающий к полуночи. Днем наблюдаются низкие значения концентрации.
    Выделяются графики 1 и 3 мая. Первый (1 мая) имеет пик в час ночи и может быть связан как с метеорологическими факторами, так и с подготовкой к проведению праздничных мероприятий. 3 мая – ярко выраженным утренник пик, предположительно вызван автомобильным затором.
    Предварительный анализ суточного хода показал наличие устойчивого суточного хода с двумя максимумами, приходящимися на пик движения автотранспорта.
    Таблица 1.2.
    Статистические характеристики фильтрованного ряда
    Весь ряд
    Месяц
    1
    Месяц
    2
    Месяц
    3
    Среднее значение, мг/м
    3
    Среднеквадратичное отклонение
    (оно же – стандартное отклонение), мг/м
    3
    Длина ряда, шт.
    Число наблюдений, превышающих ПДК
    (Какое из ПДК, решите сами; будьте готовы объяснить, почему вы взяли среднесуточную ПДК, а не максимально разовую или наоборот))
    Всего значений
    Проанализировать таблицы и рисунки, например:
     процент отбраковки;
     общая изменчивость ряда (по рис. 1.1.) и колебания относительно среднего;
     если есть превышение ПДК, то это – случайность или закономерность;
     среднее значение относительно ПДК
     и т.д.
    По таблице 1.2 делаете выводы, есть ли значительные расхождения в среднем значении концентрации и СКО. Если нет, то пишите, что распределение концентрации примеси в эти месяцы похоже и детального анализа не требуется. Далее обрабатываете весь ряд целиком. Могут быть похожи 2 месяца, а третий выпадать. Могут быть все разными. Оцениваете по двум характеристикам!
    2. Закон распределения
    Немного теории
    Значение концентрации в нашем случае можно рассматривать как случайную величину, т.к. в реальных условиях присутствует множество факторов, которые оказывают влияние.
    Случайной величиной называется величина, которая в результате опыта может принять то или иное значение, неизвестно заранее какое именно.
    Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.

    Закон распределения прерывной случайной величины Х может быть задан в следующих формах:
    • табличной;
    • аналитической;
    • графической.
    Простейшей формой задания закона распределения прерывной случайной величины Х является таблица. x
    i x
    1
    x
    2
    … x n
    p i
    p
    1
    p
    2
    … p n
    Такую таблицу называют рядом распределения случайной величины Х.
    Чтобы придать ряду распределения более наглядный вид, часто прибегают к его графическому изображению
    1
    - гистограмме.
    0 500 1000 1500 2000 2500 3000
    ч и
    сл о
    з н
    ач ен и
    й
    1 2
    3 4
    5 6
    7 8
    9 10 11
    номер градации
    Рис.2.1. Гистограмма распределения (она же – эмпирическая плотность вероятности)
    По виду должна напоминать логнормальное распределение (если только повезло, и не попался пример с двухмодальным); для этого шаг при расчете гистограммы должен быть не равномерным: уменьшить в окрестности моды, увеличить на «хвостах»; всего
    10-15 градаций (не больше!)
    Гистограмма — способ графического представления табличных данных.
    Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны. Чаще всего для удобства восприятия ширину прямоугольников берут одинаковую, при этом их высота определяет соотношения отображаемого параметра.
    Таким образом, гистограмма представляет собой графическое изображение зависимости частоты попадания элементов выборки от соответствующего интервала группировки.
    2 1
    Случайные величины и законы их распределения

    В нашем случае гистограмма может быть построена как по количеству попаданий в диапазон, так и по вероятности попадания.

    От теории к практике. Как построить гистограмму?
    Определяем максимальное, Qmax, и минимальное, Qmin, значения. Логично было бы их определить еще на этапе таблицы 1.2. При расчете гистограммы (особенно для
    NOx) можно принять Qmin=0.
    Выбираете число градаций Ngrad.
    Рассчитываете шаг
    Ngrad
    Q
    Q
    q min max



    Вот так для примера будет выглядеть разбиение на диапазоны:
    1 способ. Самый тупой и самый примитивный.
    Столбец со значениями концентрации сортируется по возрастанию. Далее
    «ручками» находите значение, попадающее в диапазон, считаете сколько значений в него попало. На примере второго диапазона (0,025 – 0,049]
    2
    Википедия,
    Гистограмма

    2 способ. Простой, но потребует дополнительного расчета функции распределения.
    Рассчитываем попадание значения концентрации в диапазон по формуле
    (
    внимание! ошиблась на паре
    )
    1
    min 
    


    





    q
    Q
    q
    ОКРУГЛВНИЗ
    k i
    где: k – номер диапазона; i
    q
    – измеренная концентрация;
    ОКРУГЛВНИЗ – функция округления до минимального целого.
    Максимальному(-ым) значению(-ям) будет присвоено значение Ngrad+1 из-за целого при делении, приплюсовать к последнему диапазону.
    Кстати, в данном примере надо брать больше 10 диапазонов – второй максимум не должен приходится на последние столбцы!
    Если максимальный столбец в два раза превышает соседние, то его надо разделить на два столбца!
    3 способ. Универсальный. Требует знаний функций Excel
    (
    зато вникнув, всегда сможете посчитать любое распределение
    )
    С помощью использования функции СЧЁТЕСЛИ определить количество значений слева (меньше) от НАЧАЛА диапазона, n1, и количество значений справа (больше)
    КОНЦА диапазона, n2.

    Зная n1 и n2, определяем количество значений в диапазоне по простой формуле
    2 1 n n
    N
    n



    , где N – всего значений.
    Последовательность действий.
    1. рассчитать пределы диапазонов как на рисунке. одинаково для всех способов.
    2. преобразовать полученные значения (цифры) в текст с помощью функции ТЕКСТ.
    3. превратить значения в текстовом формате в условия для функции СЧЁТЕСЛИ как на рисунке. (Не важно, где вы поставите строгое неравенство, а где нестрогое, в любом случае «потеряется» одно значение, справа или слева. Его надо будет вручную «поймать».)
    4. Рассчитать n1 по первому условию. Разделив результат на N (всего значений), вы получите функцию распределения в долях единицы, а умножив на 100 – в %.
    5. Рассчитать n2 по второму условию. Разделив результат на N, вы получите функцию обеспеченности.
    6. Рассчитать n по формуле. Разделив результат на N, получите плотность распределения.

    Рассмотрим на примере второго диапазона

    Концентрация в генеральной совокупности является непрерывной величиной – она может принять любое значение. Но поскольку у нас есть только выборка – измерения за конечный отрезок времени, то для нас концентрация – дискретная случайная величина. И нашей задачей является как раз перейти от табличной (дискретной) формы представления к непрерывной, от диапазона – к точке.
    РАСЧЕТ ФУНКЦИЙ
    Если Вы будете использовать третий способ построение гистограммы, то функции плотности вероятности, распределения и обеспеченности уже рассчитаны. Если же был выбран 1 или 2 способы, то
    1. Из таблицы гистограммы получаете плотность распределения по след.формуле
    %
    100
    )
    (
    N
    n q
    f i
    i

    , где i
    n
    – попаданий значений в диапазон, N – всего значений. Первая точка f(q) =0, остальные расчетные.
    2. Рассчитываете функцию распределения как



    i m
    m i
    q f
    q
    F
    0
    )
    (
    )
    (
    , при m=0 F(q) =0, далее нарастающая сумма по f(q)
    3. Рассчитываете функцию обеспеченности
    )
    (
    100
    )
    (
    q
    F
    q
    P


    4. Для построения графиков рассчитать середину интервалов, по которым считалась гистограмма.
    5. Построить графики как точечную диаграмму.
    6. Повторить для всех месяцев
    0 10 20 30 40 50 60 70 80 90 100 0
    0.05 0.1 0.15 0.2 0.25
    q, мг/м3
    В
    е р
    о я
    тн о
    ст ь,
    %
    f(q)
    F(q)
    P(q)
    По оси ординат – вероятность в долях единицы или в процентах, по оси абсцисс – значения концентрации (не забудьте подписать!). Должны быть кривые: 1) плотности вероятности,2) функции распределения, 3) функции обеспеченности.

    Можно в одну кучу, но лучше для каждого месяца отдельный график. Провести сравнение.
    ПРОЦЕНТИЛИ
    1 способ. Снять процентили с функции обеспеченности.
    2 способ. Снять процентили с функции распределения как (100-обеспеченность).
    3 способ. Использовать функцию ПЕРСЕНТИЛЬ
    4 способ. Отсортировать столбец концентрации по возрастанию. ввести столбец с номером значения. Рассчитать обеспеченность каждого значения как
    %
    100
    *
    ),%
    (
    N
    n
    N
    q
    P


    , где n – порядковый номер значения концентрации. Найти значения вероятности, ближайшие к заданной обеспеченности, снять значения концентрации.
    Таблица 2.1.
    Процентильные значения
    Обеспеченность,
    %
    Месяц
    1
    Месяц
    2
    Месяц
    3 1
    2 5
    10
    Выводы:
     похоже или непохоже полученное распределение на логарифмическое;
     оценить вероятность превышения ПДК;
     оценить загрязненность атмосферного воздуха в точке расположения поста
     и т.д.

    3. Осредненный уточный ход для каждого месяца и по всему ряду.
    Что значит осредненный? По всем дням месяца находите значения концентрации, измеренные в час X, и по ним считаете среднее. Это и будет средняя концентрация за месяц N для часа X. А по заданию надо еще и в диапазоне час X1 и час X2.

    Как это сделать?
    Общее для всех способов. Из первого столбца с датой надо вытащить месяц и час.
    Делается это с помощью функций «МЕСЯЦ» и «ЧАС» соответственно.
    Настоятельно рекомендую использовать подписи столбцов и не оставлять пустых столбцов.
    1 способ. Самый примитивный и трудоемкий. С помощью автофильтра.
    Включаете Автофильтр. В версии 2003 это делается через меню «Данные» -
    «Фильтр» - «Автофильтр» (по памяти). В версии 2007/2010 а) «Главная» - «Сортировка и фильтр» - «Фильтр» б) «Данные» – «Фильтр»

    Далее (пользователям версий 2007/2010) включаете в фильтре «Месяц» отображение каждого месяца по очереди (оставляете одну галочку), в фильтре «Час» - оставляете часы, соответствующие нужному временному диапазону.
    Подумайте, какие часы надо взять, чтоб получить среднее для 0 часов.
    Для пользователей версии 2003 (также реализовано в 2007/2010 в числовых фильтрах) (пишу по памяти)
    В версии 2003 нет возможности выделить диапазон, только значение. Поэтому месяц выбирается также, а для выделения нужных часов используется «Условие…»
    Для среднего на 3 часа (2-3-4) (окно с 2010, в 2003 почти такое же).

    Условие для 0 часов будет другим ;)
    Полученную выборку (месяц-часы) копируем на отдельный лист, по столбцу Q считаем среднее и СКО. И так повторяем (3 месяца * 8 сроков) = 24 раза.
    2 способ. С помощью сводных таблиц. Обязательны заголовки стобцов!
    Пользователям версии 2003. «Данные» - «Сводная таблица».
    Пользователям версий 2007/2010. «Вставка» - «Сводная таблица».
    В поле «таблица или диапазон» задаете таблицу с заголовками. Столбец «Дата» нам не нужен, нужное (месяц, час) мы оттуда уже вытащили. «ОК».
    Получите вот такую заготовку таблицы (2007/2010, в 2003 немного другой вид)

    Перетащите по стрелкам (месяц и час можно поменять местами). Q лучше перетащить последним. Программа автоматически составит таблицу. В верхнем левом углу таблицы в ячейке – переключатель отображаемой функции по двойному щелчку. Нам надо «Среднее» и «Смещенное отклонение», выделяете таблицу, копируете и через
    «Специальную вставку» вставляете в пустое место как «Значения».
    Теперь осталось вручную сосчитать среднее по временным интервалам, заполнить итоговую таблицу и построить графики.
    Есть еще несколько способов, но они требуют применения неоправданно много формул. При этом основная сложность возникает с расчетом СКО.
    Таблица 3.1.
    Осредненный суточный ход исследуемой величины
    Часы (центральные диапазона)
    0 3
    6 9
    12 15 18 21
    Среднее значение, мг/м
    3
    СКО, мг/м
    3
    Рис.3.1. Осредненный суточный ход
    Рис.3.2. Зависимость среднего от СКО (не обязательно, точечный, линейный тренд)
    На рис. 3.1. нанести значение ПДК и среднего по всему ряду. На рис. 3.2. не забыть подписать оси.
    Выводы:

     почему суточный ход имеет такой вид (ваши предположения)
     как осредненный суточный ход сопоставим с ПДК (и с какой?)

     что значит: СКО много больше среднего или наоборот, много меньше?
    Немного доп.информации.
    1. СКО – среднеквадратичное отклонение, оно же стандартное отклонение, оно же смещенное отклонение. В Excel есть функция СТАНДОТКЛОН, с версии 2010 добавлены новые.
    2. Для копирования, вырезания, вставки, отмены действия иногда удобно использовать сочетания клавиш
    Ctrl+C – копирование
    Ctrl+V – вставка
    Ctrl+X – вырезать
    Ctrl+Z – отменить действие
    3. Для быстрого перехода по таблице можно использовать сочетание клавиш Ctrl + стрелки. Они позволяют «прыгнуть» через заполненные ячейки до первой пустой или наоборот, по пустым до первой заполненной. Удобно использовать при вводе диапазонов в формулах и при копировании для позицирования на первой ячейке.
    Если одновременно нажать Ctrl+Shift+стрелки, будет выполнен «прыжок с выделением». Также очень удобно в функциях и при копировании.
    Например, надо выделить диапазон в сводных таблицах. Нажимаете кнопку выделения на листе (справа), тыкаете где то в таблице, нажимаете
    Ctrl+ влево (курсор прыгнет по строке на первый столбец);
    Ctrl+вверх (курсор прыгнет на самый верх до названия столбца);
    Ctrl+Shift+вправо (будет выделена первая строка до последнего столбца включительно)
    Ctrl+Shift+вниз (будет выделена вся таблица)
    4. «Строка состояния» внизу окна отображает минимальные, максимальные, проч.
    Значения в выбранном диапазоне. В 2003 переключение отображаемой функции производится мышкой, в 2007/2010 также мышкой можно включить отображение нескольких функций.


    написать администратору сайта