Главная страница
Навигация по странице:

  • 5.1. Недоминируемая сортировка

  • Митина_P. Популяционные методы аппроксимации множества Парето в задаче многокритериальной оптимизации. Обзор. 7730569363023


    Скачать 0.63 Mb.
    НазваниеПопуляционные методы аппроксимации множества Парето в задаче многокритериальной оптимизации. Обзор. 7730569363023
    Дата30.04.2021
    Размер0.63 Mb.
    Формат файлаpdf
    Имя файлаМитина_P.pdf
    ТипДокументы
    #200474
    страница2 из 5
    1   2   3   4   5
    4. Методы агрегации целевых функций
    В данном случае целевые функции агрегируют (сворачивают) в один параметризованный скалярный критерий, который выступает в роли фитнесс-функции.
    Рассматриваем следующие методы данного класса: метод взвешенных критериев; метод идеальной точки; адаптивный метод взвешенных сумм.
    4
    .1. Метод взвешенных критериев
    Теоретической основой метода взвешенных критериев (Sum of Weighted Objectives,
    SWO) является следующая известная теорема [1, 2].
    Теорема 1. Если для некоторых весовых множителей
    0
    >
    k
    λ
    ,
    ]
    :
    1
    [
    F
    k

    имеет место равенство
    ( )


    =
    =

    =
    F
    k
    k
    k
    F
    k
    k
    k
    D
    X
    X
    f
    X
    f
    X
    1
    *
    1
    )
    (
    λ
    λ
    min
    , (2) где
    X
    D
    X

    *
    , то вектор
    *
    X
    оптимален по Парето.
    Доказательство. Пусть вектор
    *
    X
    не оптимален по Парето. Тогда существует такой вектор
    X
    D
    X

    , что
    )
    (
    )
    *
    X
    f
    X
    f
    k
    k

    ,
    ]
    :
    1
    [
    F
    k

    , причем хотя бы одно из неравенств является строгим. Умножая каждое из последних неравенств на
    0
    >
    k
    λ
    и складывая, получим
    http://technomag.edu.ru/doc/363023.html
    9
    ( )
    ( )


    <
    =
    =
    F
    k
    k
    k
    F
    k
    k
    k
    X
    f
    X
    f
    1
    *
    1
    λ
    λ
    , что противоречит условию теоремы●
    Теорема 1 показывает, что выбор определенной точки из множества Парето эквивалентен указанию весов для каждого из частных критериев оптимальности. Важно, что теорема задает лишь необходимое условие оптимальности по Парето вектора
    X
    D
    X

    *
    . Т.е. из того факта, что точка
    *
    X
    принадлежит множеству Парето, не следует, что эта точка обязательно удовлетворяет условию (2) – случай невыпуклого множества
    *
    F
    D
    (
    рисунок 4).
    Рисунок 4 – Невыпуклый фронт Парето:
    2
    =
    F
    ; дуга
    AB
    - фронт Парето
    *
    F
    D
    В качестве фитнесс-функции в методе взвешенных критериев используем функцию

    =
    =
    Λ
    =
    F
    k
    k
    k
    X
    f
    F
    X
    1
    )
    (
    )
    ,
    (
    )
    (
    λ
    ϕ
    ϕ
    , где
    )
    1
    (
    ×
    F
    - вектор
    )
    ...,
    ,
    ,
    (
    2 1
    F
    λ
    λ
    λ
    =
    Λ
    Основным недостатком метода является невозможность с его помощью локализовать точки фронта Парето, принадлежащие его невыпуклой части (дуга
    CD
    на рисунке 4).
    Метод широко используется для построения не популяционных алгоритмов Парето- аппроксимации, схема которых состоит из двух следующих основных шагов.

    77-30569/363023
    , №04 апрель 2012 г. http://technomag.edu.ru
    10 1)
    Множество
    ])
    :
    1
    [
    ,
    1 0
    |
    (
    F
    i
    D
    i



    Λ
    =
    Λ
    λ
    допустимых значений вектора весовых множителей
    )
    ,...,
    ,
    (
    2 1
    F
    λ
    λ
    λ
    =
    Λ
    покрываем некоторой сеткой с узлами
    )
    ,...,
    ,
    (
    ,
    ,
    2
    ,
    1
    j
    F
    j
    j
    j
    λ
    λ
    λ
    =
    Λ
    ,
    ,...
    2
    ,
    1
    =
    j
    2)
    При каждом
    j
    Λ
    решаем задачу глобальной условной оптимизации (2) – получают точку
    *
    *
    X
    j
    D
    X

    4
    .2. Метод идеальной точки
    Идеальной называют точку в пространстве критериев
    )
    ,...,
    ,
    (
    *
    *
    2
    *
    1
    *
    *
    F
    f
    f
    f
    F
    =
    , где
    )
    (
    min
    )
    (
    *
    *
    X
    f
    X
    f
    f
    k
    D
    X
    k
    k
    k
    X

    =
    =
    ,
    ]
    :
    1
    [
    F
    k

    В качестве фитнесс-функции в этом случае используют функцию
    )
    ,
    (
    )
    (
    *
    *
    F
    F
    X
    ρ
    ϕ
    =
    , (3) где
    )
    ,
    (


    ρ
    - некоторая метрика пространства
    }
    {F
    , например, чебышевская метрика [17]
    (
    )
    )
    (
    max
    )
    ,
    (
    *
    ]
    :
    1
    [
    *
    *
    k
    k
    k
    F
    k
    f
    f
    abs
    F
    F

    =

    λ
    ρ
    ,
    0
    >
    k
    λ
    Здесь
    )
    (

    abs
    - символ абсолютного значения числа.
    Метод идеальной точки иллюстрирует рисунок 5, показывающий, что, в отличие от метода взвешенных критериев, данный метод позволяет отыскивать точки, лежащие на невыпуклой части фронта Парето. Заметим, что свертка на основе идеальной точки (3) близка к свертке Гермейера [17].
    http://technomag.edu.ru/doc/363023.html
    11
    Рисунок 5 – К методу идеальной точки:
    2
    =
    F
    ; дуга
    AB
    - фронт Парето
    Метод может быть использован для построения не популяционных алгоритмов
    Парето-аппроксимации. Задачу Парето-аппроксимации в этом случае сводят к многократному решению задачи глобальной оптимизации
    )
    ,
    (
    )
    ,
    (
    min
    *
    *
    *
    *
    *
    F
    F
    F
    F
    X
    D
    X
    ρ
    ρ
    =

    при различных допустимых значениях компонентов вектора весов
    )
    ,...,
    ,
    (
    2 1
    F
    λ
    λ
    λ
    =
    Λ
    по схеме, близкой к схеме, приведенной в предыдущем пункте.
    4
    .3. Адаптивный метод взвешенных сумм
    Адаптивный метод взвешенных сумм (Adaptive Weighted Sum Method, AWSM) предложили Рю, Ким и Ван (J-H. Ryu, S. Kim, H. Wan) в 2009 г. [18]. Целью разработки метода было преодоление указанного выше ограничения метода взвешенных критериев, заключающегося в невозможности отыскания точек, принадлежащих невыпуклым частям фронта Парето. Метод не является популяционным. Мы включаем его в обзор вследствие новизны и высокого потенциала развития.
    Метод разработан для двухкритериальной задачи (
    2
    =
    F
    ) и включает в себя три следующие основные процедуры:
    • определение центральной точки;
    • формирование метамоделей частных критериев;
    • решение полученных оптимизационных задач.
    Рассмотрим суть указанных процедур.

    77-30569/363023
    , №04 апрель 2012 г. http://technomag.edu.ru
    12
    Определение центральной точки. На этапе инициализации центральная точка
    0
    C
    X
    выбирается случайным образом в области
    X
    D
    . На этом же этапе должны быть определены следующие свободные параметры метода:
    δ
    δ
    =
    0
    - начальный радиус области доверия (trust
    region radius);
    )
    1
    ;
    0
    (

    ρ
    - коэффициент сужения области доверия; min
    δ
    - минимальная величина радиуса области доверия.
    На итерации
    1
    +
    t
    центральная точка
    С
    X
    отыскивается среди точек текущей Парето- аппроксимации
    t
    X
    X
    A
    A
    =
    , построенной на предыдущей итерации
    t
    Отсортируем элементы архивных множеств
    F
    X
    A
    A ,
    по возрастанию первого частного критерия оптимальности
    )
    (
    1
    X
    f
    и представим в виде линейных списков с прежними наименованиями. Определим расстояние
    j
    d
    архивной точки
    A
    j
    F
    до ближайших к ней в списке
    F
    A
    точек формулой
    |
    ||
    ||
    =||
    1 1
    A
    j
    A
    j
    A
    j
    A
    j
    j
    F
    F
    F
    F
    d
    +


    +

    ,
    A
    j
    <
    <
    1
    , (4) где
    ||
    ||

    - символ евклидовой нормы.
    Метод использует следующее правило определения центральной точки
    C
    X
    1)
    Если
    2
    >
    A
    , то полагаем
    A
    j
    C
    X
    X
    *
    =

    , где
    [
    ]







    =


    T
    A
    j
    j
    A
    j
    X
    X
    d
    j
    |
    max arg
    )
    1
    (
    :
    2
    *
    Здесь
    T
    X
    - множество точек, использованных в качестве центральных на всех предыдущих итерациях
    ]
    :
    0
    [
    t
    Иными словами, за центральную точку принимаем точку, во-первых, наиболее удаленную от других точек множества
    X
    A
    в смысле расстояния (4), и, во-вторых, не использованную на предшествующих итерациях.
    2)
    Если
    2
    =
    A
    , то с равной вероятностью полагаем
    A
    C
    X
    X
    1
    =

    или
    A
    C
    X
    X
    2
    =

    3)
    Если
    1
    =
    A
    , то принимаем
    A
    C
    X
    X
    1
    =

    Формирование метамоделей. Метамодели представляют собой квадратичные аппроксимации
    )
    (
    1
    X
    m
    ,
    )
    (
    2
    X
    m
    функций
    )
    (
    1
    X
    f
    ,
    )
    (
    2
    X
    f
    в окрестности точки
    C
    X
    :
    )
    (
    )
    (
    )
    (
    2 1
    )
    (
    )
    (
    )
    (
    =
    )
    (
    ;
    )
    (
    )
    (
    )
    (
    2 1
    )
    (
    )
    (
    )
    (
    =
    )
    (
    2 2
    2 2
    1 1
    1 1
    C
    C
    T
    C
    C
    C
    T
    C
    C
    C
    T
    C
    C
    C
    T
    C
    X
    X
    X
    H
    X
    X
    X
    X
    X
    G
    X
    f
    X
    m
    X
    X
    X
    H
    X
    X
    X
    X
    X
    T
    G
    X
    f
    X
    m





    +



    +







    +



    +


    Здесь
    T
    - символ транспонирования;
    )
    (
    ),
    (
    2 1
    C
    C
    X
    G
    X
    G


    - градиенты функций
    )
    (
    1
    X
    f
    ,
    http://technomag.edu.ru/doc/363023.html
    13
    )
    (
    2
    X
    f
    в точке
    C
    X
    соответственно;
    )
    (
    ),
    (
    2 1
    C
    C
    X
    H
    X
    H


    - матрицы Гессе этих функций.
    Если
    2
    >
    A
    , то дополнительно строим метамодели
    )
    (
    )
    (
    )
    (
    2 2
    1 1
    X
    m
    X
    m
    X
    m
    p
    p
    p

    +

    =

    λ
    λ
    ,
    )
    (
    )
    (
    )
    (
    2 2
    1 1
    X
    m
    X
    m
    X
    m
    q
    q
    q

    +

    =

    λ
    λ
    , а если
    2
    =
    A
    или
    1
    =
    A
    - метамодель
    )
    (
    )
    (
    )
    (
    2 2
    1 1
    X
    m
    X
    m
    X
    m
    p
    p
    p

    +

    =

    λ
    λ
    В первом случае (
    2
    >
    A
    ) весовые множители
    p
    p
    p
    Λ
    =
    )
    ,
    (
    2 1
    λ
    λ
    ,
    q
    q
    q
    Λ
    =
    )
    ,
    (
    2 1
    λ
    λ
    определяем по правилу
    (
    )
    ))
    (
    )
    (
    (
    )),
    (
    )
    (
    (
    1 1
    1 1
    2 2
    *
    *
    A
    j
    A
    C
    A
    j
    A
    C
    p
    p
    X
    f
    X
    f
    X
    f
    X
    f
    c



    +

    =
    Λ
    ,
    (
    )
    ))
    (
    )
    (
    (
    )),
    (
    )
    (
    (
    1 1
    1 2
    1 2
    *
    A
    C
    A
    j
    A
    C
    A
    j
    q
    q
    X
    f
    X
    f
    X
    f
    X
    f
    c

    +

    =
    Λ
    +
    +

    ; во втором случае (
    2
    =
    A
    ) – по правилу
    (
    )
    ))
    (
    )
    (
    (
    )),
    (
    )
    (
    (
    1 1
    2 1
    1 2
    2 2
    A
    A
    A
    A
    p
    p
    X
    f
    X
    f
    X
    f
    X
    f
    c

    +

    =
    Λ
    ; в третьем случае (когда
    1
    =
    A
    ) – по правилу
    (
    )
    5
    ,
    0
    ,
    5
    ,
    0
    =
    Λ
    p
    Константы
    p
    c
    ,
    q
    c
    выбираем таким образом, чтобы обеспечить выполнение условий нормировки
    1
    =
    =
    2 1
    2 1
    q
    q
    p
    p
    λ
    λ
    λ
    λ
    +
    +
    Отметим, что при построении метамоделей
    )
    (
    1
    X
    m
    ,
    )
    (
    2
    X
    m
    речь может идти не о градиентах и матрице Гессе функций
    )
    (
    1
    X
    f
    ,
    )
    (
    2
    X
    f
    , а об их оценках, полученных, например, численными методами (путем соответствующих конечно-разностных аппроксимаций указанных функций).
    Решение оптимизационных задач. Данная процедура предполагает решение задач оптимизации
    ),
    ˆ
    (
    )
    (
    min
    1 1
    1
    X
    m
    X
    m
    C
    D
    X


    =



    ),
    ˆ
    (
    )
    (
    min
    2 2
    2
    X
    m
    X
    m
    C
    D
    X


    =



    (5) где текущая область доверия
    C
    D
    определяет формула
    }
    ,
    |
    {
    δ




    =

    C
    X
    C
    X
    X
    D
    X
    X
    D
    Если
    2
    >
    A
    , то решения
    2 1
    ˆ
    ,
    ˆ
    X
    X


    задач (5) позволяют отыскать приближенно

    77-30569/363023
    , №04 апрель 2012 г. http://technomag.edu.ru
    14 оптимальные по Парето точки
    q
    p
    X
    X


    ˆ
    ,
    ˆ
    , принадлежащие области доверия
    C
    D
    , путем решения оптимизационных задач
    ),
    ˆ
    (
    )
    (
    min
    p
    p
    p
    D
    X
    X
    m
    X
    m
    C


    =



    )
    ˆ
    (
    )
    (
    min
    q
    q
    q
    D
    X
    X
    m
    X
    m
    C


    =



    . (6)
    Данный этап метода AWSM иллюстрирует рисунок 6, на котором принято что
    )
    (
    C
    C
    X
    F
    F

    =

    ,
    )
    (
    1 1
    *
    *
    A
    j
    A
    j
    X
    F
    F


    =
    ,
    )
    (
    1 1
    *
    *
    A
    j
    A
    j
    X
    F
    F
    +
    +
    =
    Отметим, что задачи (5), (6) представляют собой задачи оптимизации квадратичных функций, для решения которых известны высокоэффективные методы, алгоритмы и соответствующее программное обеспечение.
    Рисунок 6 – К схеме адаптивного метода взвешенных сумм: результаты решения задач (6)
    В процессе итераций текущий радиус области доверия уменьшают по правилу
    δ
    ρ
    δ
    =
    до достижения минимально допустимой его величины min
    δ
    Новое состояние архивного множества
    X
    A
    получаем путем добавления в текущее множество
    X
    A
    точек
    1
    ˆ
    X
    ,
    2
    ˆ
    X
    ,
    p
    X
    ˆ
    ,
    q
    X
    ˆ
    и исключения из полученного набора доминируемых решений. Множество
    F
    D
    образуют точки, соответствующие построенному множеству
    X
    A
    5.
    Методы на основе ранжирования агентов популяции
    Основным понятием методов данного класса является понятие ранга агента
    популяции. Известно несколько правил вычисления рангов. Ниже рассмотрены основные из
    http://technomag.edu.ru/doc/363023.html
    15 этих правил, используемые в методе недоминируемой сортировки, методе Парето-силы, а также в некоторых других методах.
    5.1. Недоминируемая сортировка
    Метод недоминируемой сортировки (Non-Dominated Sorting, NDS) впервые был опубликован в работе Шриниваса (N. Srinivas) и Деба (K. Deb) в 1994 г. [19]. Метод лежит в основе широко известного генетического алгоритма Парето-аппроксимации NGSA (Non-
    Dominated Sorting Genetic Algorithm) [21].
    Положим, что все частные критерии оптимальности являются одинаково важными.
    Ранг агента
    i
    s
    ,
    ]
    :
    1
    [
    S
    i

    в его текущем положении
    i
    X
    обозначаем
    i
    r
    . В методе NDS
    используется простейшее из правил вычисления рангов, имеющее следующий вид (рисунок
    7).
    1)
    Выбираем среди всех агентов популяции недоминируемых, присваиваем им ранг, равный единице, и исключаем из дальнейшего рассмотрения.
    2)
    Среди оставшихся агентов выбираем недоминируемых, присваиваем им ранг, равный двум, и исключаем из дальнейшего рассмотрения. И так далее до исчерпания популяции.
    Ранг индивида легко использовать для вычисления его приспособленности, например, по формуле вида
    i
    i
    r
    X
    +
    =
    1 1
    )
    (
    ϕ
    ,
    ]
    :
    1
    [
    S
    i

    Рисунок 7 – К определению понятия ранга агента:
    2
    =
    F
    Предтечей метода недоминируемой сортировки можно, вероятно, считать метод
    MOGA
    (Multi-Objective Genetic Algorithm
    ), предложенный Фонсека (C. M. Fonseca) и

    77-30569/363023
    , №04 апрель 2012 г. http://technomag.edu.ru
    16
    Флемингом (P. J. Fleming) в 1993 г. [10]. В методе предполагается, что ранг агента равен числу агентов в популяции, которые его доминирует. Заслуживает также упоминания Парето
    генетический алгоритм с нишеванием (Niched-Pareto Genetic Algorithm, NPGA), предложенный Хорном (J. Horn) c соавторами в 1994 г. [20].
    Как отмечалось выше, важнейшим требованием к методам и алгоритмам Парето- аппроксимации является требование обеспечения равномерности покрытия множества и фронта Парето. Для оценки равномерности покрытия может быть использована величина, называемая разреженностью (scarcity), имеющая смысл минимального расстояния между решениями, принадлежащими Парето-аппроксимации. Указанное расстояние может быть измерено с помощью различных метрик, например, с помощью известного манхеттеновского расстояния (Manhattan distance). Развитием метода недоминируемой сортировки является метод, в котором при формировании архивов
    F
    X
    A
    A ,
    отвергают агентов, расстояние которых до других агентов в архиве не превышает заданной величины. Такой модифицированный метод положен в основу генетического алгоритма Парето- аппроксимации NGSA-II (Non-Dominated Sorting Genetic Algorithm II) [21].
    1   2   3   4   5


    написать администратору сайта