計算圖 - 深度學習

反向傳播通過使用計算圖形在Tensorflow，Torch，Theano等深度學習框架中實現。更爲重要的是，理解計算圖上的反向傳播結合了幾種不同的算法及其變體，如通過時間反向傳播和共享權重反向傳播。一切轉換成計算圖，它們仍然是相同的算法 - 只是在計算圖上反向傳播。

什麼是計算圖

計算圖被定義爲有向圖，其中節點對應於數學運算。計算圖是表達和評估數學表達式的一種方式。

例如，這裏有一個簡單的數學公式 -

p = x + y

我們可以繪製上述方程的計算圖如下。

上面的計算圖具有一個加法節點(具有「+」符號的節點)，其具有兩個輸入變量x和y以及一個輸出q。

讓我們再舉一個例子，稍微複雜些。如下等式。

g = ( x + y ) ∗ z

以上等式由以下計算圖表示。

計算圖

計算圖和反向傳播都是深度學習訓練神經網絡的重要核心概念。

前進傳遞

正向傳遞是評估由計算圖表示的數學表達式的值的過程。進行前向傳遞意味着我們將變量的值從左側(輸入)向前傳遞到輸出所在的右側。

讓我們考慮一個例子，給所有的投入賦予一些價值。假設給所有輸入賦予下列值。

x=1, y=3, z=−3

通過將這些值賦予輸入，我們可以執行正向傳遞並獲得每個節點上輸出的以下值。

首先，使用x = 1和y = 3的值來獲得p = 4。

計算圖

然後使用p = 4和z = -3來得到g = -12。下面從左到右前進。
計算圖

在後向傳遞中，我們的目的是計算每個輸入相對於最終輸出的梯度。這些梯度對於使用梯度下降訓練神經網絡至關重要。

例如，我們希望以下漸變。所需的漸變

計算圖

後退傳遞

我們通過查找最終輸出相對於最終輸出(本身！)的導數來開始反向傳遞。因此，這將導致身份推導，並且值等於一。

計算圖

計算圖現在看起來如下所示 -

接下來，我們將通過「*」操作進行反向傳遞。將計算p和z處的梯度。由於g = p * z，所以可以知道 -

計算圖

已經知道正向傳遞的z和p值。因此得到 -

計算圖

我們想要計算x和y處的梯度 -

計算圖

然而，我們想要有效地做到這一點(儘管x和g在圖中只有兩跳，想象它們彼此之間真的很遠)。要有效計算這些值，我們將使用差異化的鏈式規則。從連鎖規則來看，如下 -

計算圖

但是已經知道dg/dp = -3，dp/dx和dp/dy很容易，因爲p直接取決於x和y。如下公式 -

計算圖

因此，可以得到 -

計算圖

另外，對於輸入y -

計算圖

這樣做的主要原因是，當必須計算x處的梯度時，只使用了已計算的值，而dq/dx(節點輸出相對於同一節點的輸入的導數)。使用本地信息來計算全局值。

按照這些步驟來訓練一個神經網絡 -