初學者該用什麼樣的 DL 架構?當然是越簡單越好、訓練速度越快越好、測試準確率越高越好!那麼我們到底該選擇 PyTorch 還是 Keras 呢?

Keras 和 PyTorch 當然是對初學者最友好的深度學習框架,它們用起來就像描述架構的簡單語言一樣,告訴框架哪一層該用什麼。這樣減少了很多抽象工作,例如設計靜態計算圖、分別定義各張量的維度與內容等等。

但是,到底哪一個框架更好一點呢?當然不同的開發者和研究者會有不同的愛好,也會有不同的看法。本文主要從抽象程度和性能兩個方面對比 PyTorch 與 Keras,並介紹了一個新的基準,它復現並對比了兩個框架的所有預訓練模型。

在 Keras 和 PyTorch 基準項目中,MIT 在讀博士 Curtis G. Northcutt 復現了 34 個預訓練模型。該基準結合了 Keras 和 PyTorch,並將它們統一到一個框架內,這樣我們就能知道這兩個框架的對比結果,知道不同模型用什麼框架好。例如,項目作者表示 ResNet 架構的模型使用 PyTorch 要比 Keras 效果好,Inception 架構的模型使用 Keras 又要比 PyTorch 好。

Keras 和 PyTorch 基準項目:https://github.com/cgnorthcutt/benchmarking-keras-pytorch

兩大框架的性能與易用性

作為 TensorFlow 的高度封裝,Keras 的抽象層次非常高,很多 API 細節都隱藏了起來。雖然 PyTorch 比 TensorFlow 的靜態計算圖更容易使用,但總體上 Keras 隱藏的細節更多一些。而對於性能,其實各框架都會經過大量的優化,它們的差別並不是很明顯,也不會作為主要的選擇標準。

易用性

Keras 是一個更高級別的框架,將常用的深度學習層和運算封裝進便捷的構造塊,並像積木一樣搭建複雜模型,開發者和研究者不需要考慮深度學習的複雜度。

PyTorch 提供一個相對較低級別的實驗環境,使用戶可以更加自由地編寫自定義層、查看數值優化任務等等。例如在 PyTorch 1.0 中,編譯工具 torch.jit 就包含一種名為 Torch Script 的語言,它是 Python 的子語言,開發者使用它能進一步對模型進行優化。

我們可以通過定義簡單的卷積網絡看看兩者的易用性:

model = Sequential()model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))model.add(MaxPool2D())model.add(Conv2D(16, (3, 3), activation='relu'))model.add(MaxPool2D())model.add(Flatten())model.add(Dense(10, activation='softmax'))

如上所示為 Keras 的定義方式,很多時候運算都會作為參數嵌入到 API 中,因此代碼會顯得非常簡潔。如下所示為 PyTorch 的定義方式,它一般都是通過類和實例的方式定義,且具體運算的很多維度參數都需要定義。

class Net(nn.Module):    def __init__(self):        super(Net, self).__init__()        self.conv1 = nn.Conv2d(3, 32, 3)        self.conv2 = nn.Conv2d(32, 16, 3)        self.fc1 = nn.Linear(16 * 6 * 6, 10)         self.pool = nn.MaxPool2d(2, 2)    def forward(self, x):        x = self.pool(F.relu(self.conv1(x)))        x = self.pool(F.relu(self.conv2(x)))        x = x.view(-1, 16 * 6 * 6)        x = F.log_softmax(self.fc1(x), dim=-1)        return xmodel = Net()

雖然 Keras 感覺比 PyTorch 更易於使用,但兩者的差別不大,都期望模型的編寫能更便捷。

性能

目前有很多對比各框架性能的實驗都表明 PyTorch 的訓練速度相比 Keras 會快一些。如下兩張圖表展示了不同框架在不同硬件和模型類型的表現:

PyTorch 和 Keras 框架下的性能
PyTorch 和 Keras 框架下的性能2

下面兩張同樣展示了不同模型在 PyTorch 和 Keras 框架下的性能,這兩份 18 年的測試都表明 PyTorch 的速度要比 Keras 快那麼一點點。

這兩份對比細節可查閱:

  • https://github.com/ilkarman/DeepLearningFrameworks/
  • https://wrosinski.github.io/deep-learning-frameworks/

Keras 和 PyTorch Benchmark

現在如果我們從預訓練模型的角度看,那麼相同的模型在不同的框架上,驗證集準確度又是什麼樣的?在這個項目中,作者用兩個框架一共復現了 34 個預訓練模型,並給出了所有預訓練模型的驗證準確率。所以該項目不僅能作為對比依據,同時還能作為學習資源,又有什麼比直接學習經典模型代碼更好的方法呢?

預訓練模型不是已經可以復現了嗎?

在 PyTorch 中是這樣的。然而有些 Keras 用戶卻覺得復現非常難,他們遇見的問題可以分為三類:

1. 不能復現 Keras 已發佈的基準結果,即使完全複製示例代碼也沒有用。實際上,他們報告的準確率(截止到 2019 年 2 月)通常略高於實際準確率。

2. 一些預訓練的 Keras 模型在部署到某個服務器或與其他 Keras 模型一起依次運行時會產生不一致或較低的準確率。

3. 使用批歸一化(BN)的 Keras 模型可能並不可靠。對於一些模型,前向傳播評估仍然會導致推理階段中的權重改變。

這些問題都是現實存在的,原 GitHub 項目為每個問題都提供了鏈接。項目作者的目標之一是通過為 Keras 預訓練模型創建可復現基準,從而幫助解決上述的一些問題。解決方法可分為以下三個方面,在 Keras 中要做到:

  • 推理期間避免分批(batches)。

每次運行一個樣本,這樣做非常慢,但可以為每個模型得出一個可復現的輸出。

只在本地函數或 with 語句中運行模型,以確保在加載下一個模型時,前一個模型的任何東西都不會保存在內存中。

預訓練模型復現結果

以下是 Keras 和 PyTorch 的「實際」驗證集準確度表(已經在 macOS 10.11.6、Linux Debian 9 和 Ubuntu 18.04 上得到驗證)。

復現方法

首先需要下載 ImageNet 2012 驗證集,該數據集包含 50000 張圖片。在 ILSVRC2012_img_val.tar 下載完成後,運行以下命令行預處理/提取驗證集:

# Credit to Soumith: https://github.com/soumith/imagenet-multiGPU.torch$ cd ../ && mkdir val && mv ILSVRC2012_img_val.tar val/ && cd val && tar -xvf ILSVRC2012_img_val.tar$ wget -qO- https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh | bash

ImageNet 驗證集中每個示例的 top 5 預測已經進行了預計,運行以下命令行將直接使用這些預計算結果,並在幾秒內復現 Keras 和 PyTorch 基準。

$ git clone https://github.com:cgnorthcutt/imagenet-benchmarking.git$ cd benchmarking-keras-pytorch$ python imagenet_benchmarking.py /path/to/imagenet_val_data

不使用預計算數據也可以復現每個 Keras 和 PyTorch 的推理輸出。Keras 的推理要花很長時間(5-10 小時),因為每次只計算一個示例的前向傳播,還要避免向量計算。如果要可靠地復現同樣的準確率,這是目前發現的唯一的方法。PyTorch 的推理非常快(一個小時都不到)。復現代碼如下:

$ git clone https://github.com:cgnorthcutt/imagenet-benchmarking.git$ cd benchmarking-keras-pytorch$ # Compute outputs of PyTorch models (1 hour)$ ./imagenet_pytorch_get_predictions.py /path/to/imagenet_val_data$ # Compute outputs of Keras models (5-10 hours)$ ./imagenet_keras_get_predictions.py /path/to/imagenet_val_data$ # View benchmark results$ ./imagenet_benchmarking.py /path/to/imagenet_val_data

你可以控制 GPU 的使用、批大小、輸出存儲目錄等。運行時加上-h flag,可以查看命令行參數選項。

本文轉自 機器之心,原文地址