17. Вычисление матрицы Гессе

Для минимизации дважды дифференцируемой целевой функции , зависящей от переменных , , …, , все варианты метода Ньютона, которые являются методами второго порядка, используют матрицу Гессе вторых частных производных

По теореме Шварца

, , .

Поэтому матрица Гессе является симметрической матрицей, для которой симметричные относительно главной диагонали элементы совпадают: . В силу этого свойства при транспонировании матрица Гессе не изменяется .

Во многих задачах оптимизации, которые встречаются на практике, целевые функции представляются сложными выражениями или вычисляются алгоритмически, поэтому матрица Гессе в методах второго порядка определяется численно с помощью конечных разностей.

Для вычисления матрицы Гессе целевую функцию разложим в ряд Тейлора, учитывая слагаемые второго порядка малости:

Вначале рассмотрим квадратичную функцию двух переменных при :

. (2.13)

Для такой функции

, .

Рис. 2.10. Точки для вычислений

В силу симметричности матрицы Гессе . Поэтому функция (2.13) имеет шесть неизвестных параметров: , , , , , . Эти параметры вычислим по шести значениям функции в различных ее точках (рис. 2.10). Положим , зададим точки , , , , , и вычислим значения функции в этих точках: , , , , , . Подставляя эти значения в уравнение (2.13), получим систему шести уравнений с шестью неизвестными, решая которую имеем:

, , ,

, ,

Полученные для квадратичной функции (2.13) формулы обобщаются для вычисления градиента и матрицы Гессе произвольной функции переменных с использованием ортов системы координат , .

Проекции градиента вычислим по формуле центральных разностей (1.22):

, . (2.14)

Диагональные элементы матрицы Гессе вычисляются по формуле конечной разности второго порядка:

, . (2.15)

Недиагональные элементы матрицы Гессе вычислим по формуле

, (2.16)

Где , .

Формулы (2.14)–(2.16) кроме значения целевой функции в точке требуют дополнительных вычислений значений функции. При этом точность вычисления градиента и матрицы Гессе существенно зависит от величины приращения аргумента , которую связывают со значением машинного эпсилон . Обычно полагают . По формулам (2.14)–(2.16) составлен алгоритм вычисления градиента и матрицы Гессе для функции многих переменных.

Алгоритм вычисления градиента и матрицы Гессе.

Входные параметры: и – точка, в которой вычисляется градиент, и значение в ней функции; – процедура вычисления целевой функции; – параметр приращения аргумента.

Выходные параметры: – градиент, – матрица Гессе.

1. Положить , , , , , .

2. Вычислить , , , .

3. Вычислить , .

4. Положить , , .

5. Если , то положить и перейти к шагу 2.

6. Положить .

7. Положить , .

8. Вычислить , , .

9. Положить , .

10. Если , то положить и перейти к шагу 8.

11. Положить .

12. Если , то положить и перейти к шагу 7.

13. Остановиться.

В этом алгоритме на шагах 2–5 вычисляются градиент и диагональные элементы матрицы Гессе, а на шагах 6–12 вычисляются недиагональные элементы матрицы Гессе. В примерах 2.1–2.10 градиент и матрица Гессе вычислены по приведенному алгоритму со значением параметра .

< Предыдущая		Следующая >