梯度上升法 (Gradient Ascent)

1. 介紹

梯度上升法的原理就好比一個登山客在山中行走，而登山客只往自身位置附近最陡峭的上坡行走，一直走直到沒有上坡為止，即到達山頂。相當於我們今天進行優化，每次都往最好的結果進行參數的調整，最後即可以得到找到最好參數。梯度演算法是一個非常直觀的優化演算法，在腦海裡想像就可以了解其背後的計算原理，但同時缺點也很明顯，就是容易困在區域最佳解 (Loacal Optimal Solution) 之中。區域最佳解可以理解為群峰裡的其中一座高山，但不是群峰裡的最高峰。若登山客的目標是爬到最高峰，也就是全域最佳解 (Globe Optimal Solution)，以梯度上升法作為優化演算法是非常容易找尋到區域最佳解，因此，又被稱作為區域演算法。之後，有許多人開始針對爬山的過程進調整，詳細內容可以參考維基百科 (梯度下降法)。

同時，也有人提出基因演算法以及群粒子演算法，在搜尋最佳解過程中以基因變異或候鳥飛行中的資訊共享方法，來避免困在區域最佳解的可能。這兩種演算法也被稱作為全域演算法，而全域演算法也不止這兩種，在此就不多在著墨。

2. 背景條件與基本原理

本程式碼是根據我在研究過程中，因為特定的背景條件下進行改良設計的，而當時情況是 :

在模型 (Model) 中計算每一個評價分數 (Score) 都需要耗費大量時間。
在 n 維度的模型中，每次的梯度上升一步都需要評價 Seed 本身與鄰近 2n 個 Near Seed 的分數，共要評價 2n+1 次

在此先定義 :

從 Model 中隨機取一個 Seed 到此 Seed 的找到最佳解，這個過程為「一次搜尋」。

梯度上升法的「一次搜尋」的流程圖 :

因此，要尋找全域最佳解時，就有必要進行「多次搜尋」。運氣好的話可能 1 ~ 100 次，但「單次搜尋」所計算的時間成本很高，單靠運氣來優化是不可靠的，更何況運氣不好到需要上千次。

3. 設計思路

上一段內容可以了解，進行「一次搜尋」的時間成本很高，因此我的提出的想法是 : 分區評價

先將 Model 進行等分分區 (Zone)，並在每個 Zone 個別取 x 個樣本 Seed 進行評價並加總，作為各個 Zone 的評價分數。之後，再從最高分的 Zone 隨機取 Seed 進行梯度上升的搜尋。分區評價的梯度上升法流程圖：

在評價樣本的 Seed 不會進行 Near Seed 的評價，因此進行評價次數為「Zone 的個數乘上 ${x}$ 個樣本數」，而此數量通常都遠小於「一次搜尋」的計算量。因此我就可以藉由分區評價的方式，大概知道整體 Model 的分佈，之後，就可以針對分數最高的 Zone 來隨機取 Seed，大幅減少搜尋次數找到全域最佳解的可能性。

4. 驗證

我使用 Matlab 的 peak 函數作為此次驗證的 Model。首先，我先對 Model 進行 5x5 的劃分，共 25 個 Zones。每個 Zone 個別取 5 的樣本數來代表該 Zone 的分數，如下圖：

接下來，我們就可以針對分數較高的區域進行隨機取 Seed，如下圖：

最後我們再進行梯度上升法進行搜尋就可以搜尋到最佳解，而本驗證也直接搜尋到全域最佳解，如下面的動畫：

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
image		image
Gradient_Ascent.m		Gradient_Ascent.m
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

image

image

Gradient_Ascent.m

Gradient_Ascent.m

README.md

README.md

Repository files navigation

梯度上升法 (Gradient Ascent)

1. 介紹

2. 背景條件與基本原理

3. 設計思路

4. 驗證

About

Releases

Packages

Languages

YiChenLai/Gradient_Ascent

Folders and files

Latest commit

History

Repository files navigation

梯度上升法 (Gradient Ascent)

1. 介紹

2. 背景條件與基本原理

3. 設計思路

4. 驗證

About

Topics

Resources

Stars

Watchers

Forks

Languages