04. Условия оптимальности первого порядка
При изучении задач оптимизации важное место занимает вопрос об Условиях оптимальности. Необходимые условия оптимальности – это условия, которым должна удовлетворять точка, являющаяся решением задачи. Достаточные условия оптимальности – это условия, из которых следует, что данная точка является решением задачи. Большое значение условий оптимальности определяется тем, что они составляют основу качественных методов изучения свойств экстремальных задач, используются при обосновании численных методов оптимизации, позволяют в простых случаях явно решить задачу.
Пусть целевая функция является дифференцируемой при всех . Вектор-столбец частных производных функции в точке называется Градиентом и обозначается
. (1.5)
В формулах градиент часто обозначают вектором .
Необходимое условие существования экстремума функции нескольких переменных в точке представляется теоремой, аналогичной теореме для экстремума функции одной переменной.
Теорема 1.2. Если дифференцируемая функция имеет в точке экстремум, то
. (1.6)
Доказательство. Пусть для определенности функция имеет в точке минимум. Разложим функцию в окрестности точки в ряд Тейлора, ограничиваясь слагаемыми не выше первого порядка малости,
.
Положим , где – некоторое малое число. Тогда с точностью до бесконечно малых первого порядка имеем
.
Разделив это выражение на , придем к неравенству
,
Откуда следует, что . ÿ
Итак, для дифференцируемой по всем переменным функции по этой теореме с учетом (1.5) и (1.6) получим:
, . (1.7)
Точка , удовлетворяющая этому условию, называется Стационарной точкой. Это необходимое условие экстремума, общее для минимума и максимума. Данному условию также удовлетворяют Седловые точки, которые соответствуют минимуму функции по одним направлениям и ее максимуму по другим.
Локальный минимум функции может достигаться и в точках, в которых первые частные производные функции не существуют. Такие точки называются Критическими. Точку глобального минимума функции, если она существует, можно искать, сравнивая значения функции во всех стационарных и критических точках. Выяснять, какие из этих точек являются точками локального минимума, не обязательно.
Использование необходимого условия локального экстремума приводит к решению системы нелинейных уравнений (1.7), что является сложной задачей. Функция может иметь большое или даже бесконечное число стационарных точек, и тогда выбрать среди них точку с наименьшим значением функции сложно. Для выпуклых функций эта задача существенно упрощается.
Теорема 1.3. Пусть функция Выпукла и дифференцируема в точке . Тогда, если , то – точка глобального минимума функции .
Доказательство. Возьмем произвольную точку и рассмотрим сечение функции , проходящее через точки , и определяющее функцию одной переменной , где . Для такой функции , . Из выпуклости функции следует и выпуклость ее сечения , поэтому с учетом свойства (1.2) выпуклой функции . Отсюда , и
.
Тогда . По правилу дифференцирования сложной функции , и в силу условия имеем , то есть . ÿ
Доказанная теорема является достаточным условием минимума выпуклой функции. Из этой теоремы и теоремы 1.2 вытекает необходимое и достаточное условие минимума выпуклой функции.
Следствие 1.3. Пусть функция Выпукла и дифференцируема в точке . Для того, чтобы точка была точкой глобального минимума функции , Необходимо и достаточно, чтобы выполнялось условие .
Необходимое условие оптимальности первого порядка (1.7) для выпуклых функций является и достаточным условием. В этом случае локальный минимум является также и глобальным.
< Предыдущая | Следующая > |
---|