索尼近日宣布即將推出兩款 AI 圖像傳感器,代號 IMX500 和 IMX501,號稱具備智能視覺的 “全球首款 AI 圖像傳感器”。其中 IMX500 是無封裝版,IMX501 是封裝版,沒有其他性能差異。
AI 圖像傳感器兼具運算能力和內(nèi)存,能夠在沒有額外硬件輔助的情況下執(zhí)行機(jī)器學(xué)習(xí)驅(qū)動的計算機(jī)視覺任務(wù),使得 很多依賴機(jī)器學(xué)習(xí)算法的圖像處理技術(shù)能夠在本地運行,衍生出更簡化、高效和安全的解決方案。
索尼業(yè)務(wù)與創(chuàng)新副總裁馬克·漢森(Mark Hanson)認(rèn)為, 相比將數(shù)據(jù)發(fā)送到云端的解決方案,IMX500 的應(yīng)用潛力巨大,成本效益更高,尤其是在未來的邊緣計算領(lǐng)域。它支持 1200 萬像素圖像,以每秒 60 幀的速度捕獲 4K 視頻,或者不捕獲任何圖像,僅提供所見內(nèi)容的元數(shù)據(jù)。
圖|IMX500(?。┖?IMX501(大)(來源:索尼)
不過, 第一代 AI 圖像傳感器可能不會出現(xiàn)在智能手機(jī)或平板電腦等消費者產(chǎn)品中。索尼的首批目標(biāo)是零售商和工業(yè)客戶,比如亞馬遜 Go 無人商店,其他應(yīng)用場景包括訪客統(tǒng)計、交通狀況和人流量熱圖繪制等。
以亞馬遜無人商店為例,每家商店中都裝有上百個 AI 技術(shù)加持的攝像頭,用來追蹤顧客的行動軌跡,捕捉他們在貨架上的購買行為,最終創(chuàng)建購物清單完成結(jié)賬。有數(shù)據(jù)分析顯示,對運算能力和數(shù)據(jù)處理的高要求推高了硬件成本,并減緩了 Go 商店的推廣速度。
漢森指出, “建造這種商店需要上百個攝像頭,每天要生成和處理 PB 級別的數(shù)據(jù)(1PB 等于 100 萬 GB),如果我們可以把運算能力縮小并放在每一塊芯片上,就可以實現(xiàn)更多有趣的事情?!?
圖 | IMX500 和 IMX501 的詳細(xì)參數(shù)(來源:索尼)
相比之下,谷歌 Clips 相機(jī)和大疆精靈 4 無人機(jī)所使用的 Movidius 計算機(jī)視覺芯片(2016 年被英特爾收購),可能需要數(shù)百毫秒以上的處理時間,相差 30 多倍。
這一點在工業(yè)自動化協(xié)作機(jī)器人上至關(guān)重要。它們通常會在車間與工人搭配合作,出于安全因素考慮,驅(qū)動它們的計算機(jī)視覺芯片需要具備快速檢測人類目標(biāo)的能力。這樣可以在發(fā)生意外時快速停止工作,避免誤傷。
目前第一代 IMX500 還存在一定的局限性,只能運行比較基礎(chǔ)的機(jī)器學(xué)習(xí)算法,還不具備處理復(fù)雜任務(wù)的能力。
面對日益增加的自動駕駛等需求,索尼希望未來將 IMX500 打造成一個簡單的單應(yīng)用設(shè)備,即專門應(yīng)對復(fù)雜和多樣化任務(wù)的專用AI硬件,具備處理和分析更復(fù)雜任務(wù)的能力,而不僅局限于運行基礎(chǔ)算法。
索尼首席執(zhí)行官吉田憲一郎明確表示,新產(chǎn)品符合公司的長期目標(biāo),即擴(kuò)大其傳感解決方案的種類并追求更多樣化的經(jīng)常性收入。
目前在圖像處理領(lǐng)域,索尼擁有巨大的影響力,市場份額超過 60%,去年傳感器出貨量約為 16 億枚。因此索尼認(rèn)為,一旦技術(shù)完成多次迭代走向成熟,龐大的占有量足以幫助其大規(guī)模推廣 AI 圖像傳感器,打入消費者市場。
https://www.bloomberg.com/news/articles/2020-05-14/sony-builds-ai-into-latest-image-sensor
責(zé)任編輯: