17. Вычисление матрицы Гессе
Для минимизации дважды дифференцируемой целевой функции , зависящей от
переменных
,
, …,
, все варианты метода Ньютона, которые являются методами второго порядка, используют матрицу Гессе вторых частных производных
.
По теореме Шварца
,
,
.
Поэтому матрица Гессе является симметрической матрицей, для которой симметричные относительно главной диагонали элементы совпадают: . В силу этого свойства при транспонировании матрица Гессе не изменяется
.
Во многих задачах оптимизации, которые встречаются на практике, целевые функции представляются сложными выражениями или вычисляются алгоритмически, поэтому матрица Гессе в методах второго порядка определяется численно с помощью конечных разностей.
Для вычисления матрицы Гессе целевую функцию разложим в ряд Тейлора, учитывая слагаемые второго порядка малости:
.
Вначале рассмотрим квадратичную функцию двух переменных при :
. (2.13)
Для такой функции
,
.
|
Рис. 2.10. Точки для вычислений |
В силу симметричности матрицы Гессе . Поэтому функция (2.13) имеет шесть неизвестных параметров:
,
,
,
,
,
. Эти параметры вычислим по шести значениям функции в различных ее точках (рис. 2.10). Положим
, зададим точки
,
,
,
,
,
и вычислим значения функции в этих точках:
,
,
,
,
,
. Подставляя эти значения в уравнение (2.13), получим систему шести уравнений с шестью неизвестными, решая которую имеем:
,
,
,
,
,
.
Полученные для квадратичной функции (2.13) формулы обобщаются для вычисления градиента и матрицы Гессе произвольной функции переменных с использованием ортов системы координат
,
.
Проекции градиента вычислим по формуле центральных разностей (1.22):
,
. (2.14)
Диагональные элементы матрицы Гессе вычисляются по формуле конечной разности второго порядка:
,
. (2.15)
Недиагональные элементы матрицы Гессе вычислим по формуле
, (2.16)
Где ,
.
Формулы (2.14)–(2.16) кроме значения целевой функции в точке требуют
дополнительных вычислений значений функции. При этом точность вычисления градиента и матрицы Гессе существенно зависит от величины приращения аргумента
, которую связывают со значением машинного эпсилон
. Обычно полагают
. По формулам (2.14)–(2.16) составлен алгоритм вычисления градиента и матрицы Гессе для функции многих переменных.
Алгоритм вычисления градиента и матрицы Гессе.
Входные параметры: и
– точка, в которой вычисляется градиент, и значение в ней функции;
– процедура вычисления целевой функции;
– параметр приращения аргумента.
Выходные параметры: – градиент,
– матрица Гессе.
1. Положить ,
,
,
,
,
.
2. Вычислить ,
,
,
.
3. Вычислить ,
.
4. Положить ,
,
.
5. Если , то положить
и перейти к шагу 2.
6. Положить .
7. Положить ,
.
8. Вычислить ,
,
.
9. Положить ,
.
10. Если , то положить
и перейти к шагу 8.
11. Положить .
12. Если , то положить
и перейти к шагу 7.
13. Остановиться.
В этом алгоритме на шагах 2–5 вычисляются градиент и диагональные элементы матрицы Гессе, а на шагах 6–12 вычисляются недиагональные элементы матрицы Гессе. В примерах 2.1–2.10 градиент и матрица Гессе вычислены по приведенному алгоритму со значением параметра .
< Предыдущая | Следующая > |
---|