亚洲全黄无码一级在线看_国产剧情久久久性色_无码av一区二区三区无码_亚洲成a×人片在线观看

當(dāng)前位置: 首頁 > 科技新聞 >

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

時(shí)間:2019-11-13 00:57來源:網(wǎng)絡(luò)整理 瀏覽:
在對(duì)技術(shù)毫無了解的人看來,人工智能是什么? 《流浪地球》里的AI語音助手MOSS么?還是《終結(jié)者》里的天網(wǎng)? 如果對(duì)當(dāng)今人工智能的主流技術(shù)&

在對(duì)技術(shù)毫無了解的人看來,人工智能是什么?

《流浪地球》里的AI語音助手MOSS么?還是《終結(jié)者》里的天網(wǎng)?

如果對(duì)當(dāng)今人工智能的主流技術(shù)——深度學(xué)習(xí)沒有了解,可能真的會(huì)有人覺得,當(dāng)前的科學(xué)家們?cè)趧?chuàng)造無所不能、無所不知的電影AI形象。

那么,如何用最淺顯的方式,給大眾解釋什么是深度學(xué)習(xí)呢?

法國(guó)博主Jean-Louis Queguiner撰寫了這篇《給我8歲的女兒解釋深度學(xué)習(xí)》,以用深度學(xué)習(xí)技術(shù)搭建識(shí)別手寫數(shù)字的神經(jīng)網(wǎng)絡(luò)為例,用清晰的方式,解釋了深度學(xué)習(xí)的原理。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

這些數(shù)字每個(gè)人的寫法都不一樣,要如何讓計(jì)算機(jī)判斷出這些手寫體數(shù)字是幾呢?

1、和數(shù)數(shù)一樣簡(jiǎn)單

首先,考慮到0~9這十個(gè)數(shù)字,本身也是存在各種筆畫的,那我們就拆解開來,看每個(gè)手寫體數(shù)字里,有多少橫豎撇捺,曲折彎彎。

左邊豎著的一列是是個(gè)數(shù)字,上方橫著的紅色字符則是拆解出來的筆畫,用這個(gè)表格,來統(tǒng)計(jì)每個(gè)字符里有多少個(gè)相應(yīng)的筆畫。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

現(xiàn)在,我們來寫一些新的數(shù)字,然后數(shù)一數(shù),這些新寫的數(shù)字里,有多少個(gè)紅色的筆畫,和上方的表格對(duì)比一下,就能判斷出這些新寫的數(shù)字是幾了。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

比如,第一個(gè)數(shù)字里,有一個(gè)“ / ”,一個(gè)“丨”,我們發(fā)現(xiàn)有這種特征的,是“1”這個(gè)數(shù)字,而且完全符合,那第一個(gè)數(shù)字就是“1”。

第二個(gè)數(shù)字,上下左右半圓各有2個(gè),另外還有一個(gè)“ / ”,一個(gè)“丨”,總共10個(gè)筆畫。比較之下,會(huì)發(fā)現(xiàn)上表中的數(shù)字“8”有8個(gè)筆畫符合,數(shù)字“9”有6個(gè)筆畫符合,那么這第二個(gè)數(shù)字就是“8”。

看懂這一步,那恭喜你已經(jīng)搭建了世界上最簡(jiǎn)單的識(shí)別手寫數(shù)字神經(jīng)網(wǎng)絡(luò)。

2、圖像即矩陣

矩陣這個(gè)概念,大部分8歲的小學(xué)生肯定是沒學(xué)過的,可以簡(jiǎn)單的理解為一串橫豎的格子里,每個(gè)放一個(gè)數(shù)。

對(duì)于計(jì)算機(jī)來說,每張照片都是細(xì)微的像素組成的,這些像素排列成矩陣格子,每個(gè)格子一個(gè)顏色,拼起來便是一副圖像。

比如這些紅紅綠綠的格子,你縮小來看,原來是一張草莓圖片的一部分。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

而顏色,對(duì)于計(jì)算機(jī)來說,正是用數(shù)表示的,草莓圖片中彩色的顏色是紅綠藍(lán)三種色光,各自有一個(gè)數(shù),總共三個(gè)數(shù);而手寫數(shù)字都是黑白的,只要一個(gè)數(shù),0表示純黑色,255表示純白色,兩者中間的數(shù)則是灰色,數(shù)字越小顏色越深,數(shù)字越大顏色越淺。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

所以,看這個(gè)手寫數(shù)字,一共28行28列,784個(gè)像素格子,沒有筆畫的黑色格子就是0,有筆畫的部分,筆畫中心是更淺的白色,數(shù)字在一兩百左右,筆畫邊緣則是灰色,數(shù)字只有幾十,這就構(gòu)成了這個(gè)手寫數(shù)字的矩陣。

3、卷積層:找到筆畫輪廓

現(xiàn)在,我們知道了圖片的每個(gè)像素格子都是數(shù)字,但如何找出這些數(shù)字中的筆畫呢?

深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)是有許多許多“層”組成的,找輪廓這一步需要用到卷積層,本質(zhì)上就是在前面用數(shù)字表示的圖像上加一個(gè)過濾器,把沒有筆畫的部分過濾掉,留下有筆畫的部分。

過濾器就像下面這個(gè)玩具一樣,識(shí)別出圖案的輪廓,如果輪廓匹配,就可以放進(jìn)盒子里,輪廓不匹配,那就放不進(jìn)去,三角形的過濾器匹配三角形的木塊,正方形的過濾器匹配正方形的木塊

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

4、獨(dú)立過濾

過濾器過濾的過程就像這張動(dòng)畫一樣,每一次掃描都是獨(dú)立的,所以可以同時(shí)進(jìn)行許多次掃描,每次掃描互不干擾。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

5、重復(fù)卷積

前面的過程,是我們的手寫數(shù)字圖像被多個(gè)過濾器過濾,但是為了提高準(zhǔn)確性,只要把前一次過濾的圖像再拿來過濾就好了,用的過濾器越多,過濾的次數(shù)越多,結(jié)果越準(zhǔn)確。

而且,由于手寫的數(shù)字并不像玩具中的三角形、五角星一樣規(guī)整,每個(gè)人寫數(shù)字“8”都可能寫成不同的樣子,因此筆畫的布局都不一樣。

為了讓過濾出來的筆畫更清晰,需要不斷創(chuàng)建新的過濾器,直到過濾器被精確到我們前面看到的那些紅色橫豎撇捺半圓的形狀。

6、卷積:乘法和加法

但過濾中具體的掃描過程是怎樣的呢?

涉及到卷積運(yùn)算,比如下圖,左邊是一張8×8的圖像,中間是一個(gè)3×3的卷積濾波器,3×3的格子在8×8的圖像上逐一移動(dòng),挨個(gè)進(jìn)行卷積。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

這里,需要告訴大家卷積是怎樣算的。比如上圖,左邊的3×3格子的左上角是3,中間卷積過濾器的左上角是-1,那就需要把3和-1乘起來,得到-3。以此類推,同一位置的兩個(gè)數(shù)相乘,得到9個(gè)乘積,再把9個(gè)乘積加起來,得到-3,就是卷積的結(jié)果。

當(dāng)然,圖上這個(gè)例子中涉及了負(fù)數(shù),如果小朋友還沒有學(xué)會(huì)負(fù)數(shù)的運(yùn)算,可以先不要理它,當(dāng)做一個(gè)整數(shù)就好啦。

7、池化層:把圖片變小,易于總結(jié)

經(jīng)過了復(fù)雜的卷積過程,我們現(xiàn)在需要進(jìn)行總結(jié)采樣,首先要把矩陣縮小,這里用到的是池化層。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

比如,把四個(gè)格子縮成一個(gè)格子,可以取四個(gè)格子的最大值、最小值、平均值、求和等,這樣矩陣的大小就只有原來的四分之一了。

8、神經(jīng)網(wǎng)絡(luò)

我們整個(gè)過程,是為了識(shí)別手寫的數(shù)字是幾,這個(gè)過程叫做圖像分類,因?yàn)閿?shù)字只有10個(gè),所以需要把每個(gè)不同的手寫數(shù)字分到0~9十類中。

經(jīng)過了上面的多層處理,現(xiàn)在需要把它放進(jìn)類中,需要準(zhǔn)備10個(gè)神經(jīng)元,每個(gè)代表一類,連接到最后一個(gè)池化層之后。

下面是Yann LeCun設(shè)計(jì)的最早的LeNet-5卷積神經(jīng)網(wǎng)絡(luò),這是圖像識(shí)別領(lǐng)域的幾個(gè)早期成果之一。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

9、靠反向傳播實(shí)現(xiàn)自我改進(jìn)

不過,整個(gè)過程不只靠卷積完成,還需要依靠神經(jīng)網(wǎng)絡(luò)自身學(xué)習(xí)和適應(yīng)的能力,比如借助一種叫做反向傳播的方法,靠權(quán)重來減少神經(jīng)元的數(shù)量。

簡(jiǎn)單來講,我們看神經(jīng)網(wǎng)絡(luò)的輸出的結(jié)果,如果輸出的這個(gè)分類是錯(cuò)的,比如把手寫的6認(rèn)成了9,我們就認(rèn)為,其中有一個(gè)過濾器犯了個(gè)錯(cuò)誤,是個(gè)不靠譜的過濾器,擔(dān)不起自己的責(zé)任,就把它的權(quán)重降低,下次神經(jīng)網(wǎng)絡(luò)就不會(huì)犯同樣的錯(cuò)誤了。

這樣,整個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)就擁有了學(xué)習(xí)能力,保持自我提升。

10、寫在最后

找了數(shù)千張圖片,運(yùn)行了數(shù)十個(gè)過濾器,采樣輸出……所有的步驟都可以完美的同時(shí)搞定,因此適合在GPU上運(yùn)行。

另外,我們還沒有討論準(zhǔn)確率的問題,在圖像識(shí)別競(jìng)賽ImageNet中,根據(jù)歷年的結(jié)果,我們可以看出,隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的增加,準(zhǔn)確率在不斷提升。

看懂這十步,8歲的小朋友都能理解深度學(xué)習(xí)

最后,本文講得雖然是識(shí)別手寫字母,但所有的圖像識(shí)別,無論是用于醫(yī)療還是用于自動(dòng)駕駛,原理都是一樣的,靠很多層神經(jīng)網(wǎng)絡(luò)、各種濾波器,在不同的矩陣上做各種變換。

也就是說,所有圖像識(shí)別都是在GPU上運(yùn)行的矩陣運(yùn)算。

傳送門

英文原文:

https://www.ovh.com/blog/deep-learning-explained-to-my-8-year-old-daughter/

【責(zé)任編輯:龐桂玉 TEL:(010)68476606】
推薦內(nèi)容