亚洲全黄无码一级在线看_国产剧情久久久性色_无码av一区二区三区无码_亚洲成a×人片在线观看

當前位置: 首頁 > 科技新聞 >

PyTorch終于能用上谷歌云TPU,推理性能提升4倍,該

時間:2019-11-12 19:20來源:網(wǎng)絡整理 瀏覽:
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。 Facebook在PyTorch開發(fā)者大會上正式推出了PyTo

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

Facebook在PyTorch開發(fā)者大會上正式推出了PyTorch 1.3,并宣布了對谷歌云TPU的全面支持,而且還可以在Colab中調(diào)用云TPU。

之前機器學習開發(fā)者雖然也能在Colab中使用PyTorch,但是支持云TPU還是第一次,這也意味著你不需要購買昂貴的GPU,可以在云端訓練自己的模型。

而且如果你是谷歌云平臺(Google Cloud Platform)的新注冊用戶,還能獲得300美元的免費額度。

PyTorch終于能用上谷歌云TPU,推理性能提升4倍,該如何薅羊毛?

現(xiàn)在PyTorch官方已經(jīng)在Github上給出示例代碼,教你如何免費使用谷歌云TPU訓練模型,然后在Colab中進行推理。

訓練ResNet-50

PyTorch先介紹了在云TPU設備上訓練ResNet-50模型的案例。如果你要用云TPU訓練其他的圖像分類模型,操作方式也是類似的。

在訓練之前,我們先要轉(zhuǎn)到控制臺創(chuàng)建一個新的虛擬機實例,指定虛擬機的名稱和區(qū)域。

PyTorch終于能用上谷歌云TPU,推理性能提升4倍,該如何薅羊毛?

如果要對Resnet50在真實數(shù)據(jù)上進行訓練,需要選擇具有最多CPU數(shù)量的機器類型。為了獲得最佳效果,請選擇n1-highmem-96機器類型。

然后選擇Debian GNU/Linux 9 Stretch + PyTorch/XLA啟動盤。如果打算用ImageNet真實數(shù)據(jù)訓練,需要至少300GB的磁盤大小。如果使用假數(shù)據(jù)訓練,默認磁盤大小只要20GB。

創(chuàng)建TPU

官方建議初次運行時使用假數(shù)據(jù)進行訓練,因為fake_data會自動安裝在虛擬機中,并且只需更少的時間和資源。你可以使用conda或Docker進行訓練。

在fake_data上測試成功后,可以開始嘗試用在ImageNet的這樣實際數(shù)據(jù)上進行訓練。

用conda訓練:

 

用Docker訓練:

 

在n1-highmem-96的虛擬機上選用完整v3-8 TPU進行訓練,第一個epoch通常需要約20分鐘,而隨后的epoch通常需要約11分鐘。該模型在90個epoch后達到約76%的top-1準確率。

為了避免谷歌云后續(xù)進行計費,在訓練完成后請記得刪除虛擬機和TPU。

性能比GPU提升4倍

訓練完成后,我們就可以在Colab中導入自己的模型了。

打開notebook文件,在菜單欄的Runtime中選擇Change runtime type,將硬件加速器的類型改成TPU。

PyTorch終于能用上谷歌云TPU,推理性能提升4倍,該如何薅羊毛?

先運行下面的代碼單元格,確??梢栽L問Colab上的TPU:

 

然后在Colab中安裝兼容PyTorch/TPU組件:

 

接下來就可以導入你要訓練好的模型和需要進行推理的圖片了。

在PyTorch上使用TPU對性能的提升到底有多明顯呢?官方選用了v2-8的一個核心,即1/8 TPU的情形,與使用英偉達Tesla K80 GPU進行對比,實測顯示推理時間大大縮短,性能約有4倍左右的提升。

PyTorch終于能用上谷歌云TPU,推理性能提升4倍,該如何薅羊毛?

GitHub地址:

https://github.com/pytorch/xla/tree/master/contrib/colab

【責任編輯:張燕妮 TEL:(010)68476606】
推薦內(nèi)容