今年,醫(yī)學影像分析頂會MICCAI 2019在深圳舉行。在這次會上,英偉達醫(yī)療副總裁Kimberly Powell也來到了中國,并且?guī)砹艘粋€20多人的隨行團。
作為全球最大的獨立 GPU 供應商,英偉達給外界釋放的信號不言而喻。Kimberly說到,之所以來參加MICCAI,是要見一些潛在的合作伙伴。同時,英偉達也將會在NVIDIA內(nèi)部打造中國本土的醫(yī)療團隊。
2008年,Kimberly加入英偉達,負責將英偉達GPU開發(fā)為可應用于醫(yī)療成像儀器的加速器平臺。此前,她曾表示,醫(yī)療領(lǐng)域是英偉達規(guī)模最大、也是最為成熟的一個領(lǐng)域?!霸诜派鋵W中,我們可以利用人工智能大幅的降低成本,提升圖像的質(zhì)量,并且將醫(yī)療和人工智能整合到一起?!?/p>
作為入局醫(yī)療的重要一步,2018年,英偉達發(fā)布了Clara平臺。時隔一年,Clara的進展如何?Clara能否支撐起英偉達的醫(yī)療夢想?
醫(yī)療:算力需求最大的產(chǎn)業(yè)
實驗室表現(xiàn)出色的AI遲遲難以在醫(yī)院落地應用,很重要的一個原因就是“臨床環(huán)境非常復雜”。
就以設(shè)備來說,很多醫(yī)院還在用十幾年前生產(chǎn)的成像設(shè)備,因為設(shè)備升級耗資巨大,醫(yī)院的“改造動力”并不充足。這也是英偉達入局醫(yī)療的動力之一。
Kimberly說,在消費級AI當中,英偉達更關(guān)注的是數(shù)據(jù)訓練、模型訓練。醫(yī)學影像的數(shù)據(jù)規(guī)模非常龐大,一些主流的消費級AI工具無法處理。如果沒有更為先進的工具,AI就很難進入到下一個層級的應用。
現(xiàn)在,英偉達更關(guān)注的是規(guī)模可擴展的推理,以更快、更大規(guī)模的方式來進行推理。在Clara平臺上,醫(yī)生可以繼續(xù)使用原來的超聲、CT等成像設(shè)備,輸入圖像后,系統(tǒng)可以自動推理出更加清晰的圖像。
Kimberly向雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))表示,醫(yī)療將會是世界上對于計算能力需求最大的產(chǎn)業(yè)?!澳P秃蛿?shù)據(jù)集的規(guī)模較大,而且很多都是3D數(shù)據(jù)。想象一下,我們有十幾種醫(yī)療器械,身體結(jié)構(gòu)、器官、疾病都有十幾種分類。因此,針對各個細分領(lǐng)域的AI算法種類是指數(shù)級增長的。”
除此之外,考慮到醫(yī)學數(shù)據(jù)的敏感性,醫(yī)院對于數(shù)據(jù)本地化的要求比較苛刻,對于底層CPU、GPU性能的要求不斷上升。
這些是英偉達決定開發(fā)Clara平臺來滿足醫(yī)療需求的原因。
一年來,Clara的四大進展
作為一個軟硬件相結(jié)合的平臺,Clara的核心是英偉達 Clara AGX,是一套以英偉達 Xavier 人工智能運算模塊和英偉達 Turing 架構(gòu) GPU 為基礎(chǔ)的運算架構(gòu)。
2018年,Clara軟件開發(fā)工具包(SDK)在北美放射學會會議上發(fā)布,定位于針對醫(yī)療行業(yè)分層的軟件堆棧。
發(fā)布將近一年后,Kimberly也向雷鋒網(wǎng)分享了Clara平臺的成績。
其中一個比較大的進展,是工具集的高度模塊化。在Clara第一個版本當中,整個工作流是提前設(shè)定好的。也就是說,用現(xiàn)有的模型去訓練現(xiàn)有的預定好的模型。
而在最新的版本當中,用戶可以將自己的模型帶到平臺上來進行訓練,“所以在使用層面,Clara變得更加友好了。”
其次,英偉達還整合了一些開源的工具。比如,新的醫(yī)療影像瀏覽器能從三個視角觀察圖像,相當于是一個AI助理分析工具,從用戶的角度而言,使用更方便。
再然后是優(yōu)化了性能,尤其是改善了數(shù)據(jù)加載訓練的時間。Kimberly笑道,“有開發(fā)者反映,有時候數(shù)據(jù)加載的時間,比訓練的時間還要長。”
最后,新的SDK還實現(xiàn)了自動化的多GPU訓練,不再需要用戶過多干涉。
據(jù)雷鋒網(wǎng)了解,Clara主要針對三種類型醫(yī)療客戶,第一是醫(yī)療設(shè)備公司,第二是人工智能軟件開發(fā)公司,第三是那些擁有幾百個應用的醫(yī)院。
Kimberly認為,對于這些醫(yī)療領(lǐng)域的用戶,英偉達可提供四個方面的能力。
第一、訓練好的模型,可以用來訓練數(shù)據(jù),利用這些模型來作為醫(yī)生的助理;第二,讓模型表現(xiàn)非常有效的一個辦法是對數(shù)據(jù)進行標記,在Clara平臺上,研究人員可以來做預標記的事情;第三,有一個預訓練模型讓開發(fā)者有一個比較高的起點,對這個模型再進行訓練時,可以用更少的數(shù)據(jù)量就達到非常高的準確度;第四,就是應用的部署。
很多AI初創(chuàng)企業(yè)手里有一些AI模型,但是他們需要將這些AI模型進行大規(guī)模的運轉(zhuǎn),比如:每天至少做上百個推理。
所以,Clara平臺實際上就提供了可擴展的AI推理功能,那些初創(chuàng)企業(yè)和醫(yī)療公司就可以用Clara平臺快速和低成本的擴展。
據(jù)了解,英偉達在醫(yī)療領(lǐng)域已經(jīng)收獲國內(nèi)包括平安保險、華大基因、碳云智能、聯(lián)影智能、推想科技等在內(nèi)的眾多合作伙伴。例如,推想科技使用的就是Clara里的推理引擎,并行執(zhí)行多個人工智能算法。如果沒有這個推理引擎,一個AI的模型就必須有一個專門的GPU執(zhí)行。
此外,聯(lián)影智能也在NVIDIA DGX系統(tǒng)的基礎(chǔ)上構(gòu)建AI架構(gòu),以便開發(fā)用于全棧式醫(yī)學影像的人工智能軟件uAI。
Kimberly說,AI初創(chuàng)企業(yè)現(xiàn)在基本上都是基于英偉達的技術(shù)來打造自己的應用,英偉達做的事情就是給他們的應用去加速,去做更底層的事情。
雷鋒網(wǎng)了解到,從發(fā)布以來,Clara平臺的開發(fā)者數(shù)量增長非常迅速。Kimberly說,英偉達在今年春天正式發(fā)布了這個應用框架,幾個月的時間,Clara開發(fā)者的數(shù)量增加了4倍。
將聯(lián)邦學習引入Clara
深度學習仍然是這波人工智能熱潮中占“統(tǒng)治性”地位的技術(shù)。據(jù)雷鋒網(wǎng)了解,這一次的MICCAI會議上,仍然有超過70%的研究人員做的都是深度學習領(lǐng)域的研究。
但是,值得注意的一個現(xiàn)象是,聯(lián)邦學習悄悄成為了今年MICCAI上的一個熱詞。
大會主席沈定剛教授向雷鋒網(wǎng)表示,聯(lián)邦學習對于醫(yī)療數(shù)據(jù)的隱私性來說是一個很好的方法,既可以保證數(shù)據(jù)“不出院”,又能夠利用不同醫(yī)院的數(shù)據(jù)訓練同一個算法。
英偉達資深研究科學家Nicola Rieke說,聯(lián)邦學習的提出,主要是為了解決“數(shù)據(jù)收集”的問題。
“如果一項研究需要跨國或者跨區(qū)域,就不可能建一個共有的數(shù)據(jù)池。在聯(lián)邦學習里,其實是模型找數(shù)據(jù),而不是數(shù)據(jù)找模型,醫(yī)學數(shù)據(jù)一直沒有離開醫(yī)院。這個新技術(shù)的最大突破點在于,模型訓練完、數(shù)據(jù)回傳時,要保證最少的涉及到隱私的數(shù)據(jù)被回傳過來。所以我們只是回傳訓練后模型的數(shù)據(jù),而不是原有的數(shù)據(jù)?!?/p>
其次,如果采取集中化的數(shù)據(jù)處理方式,會大大增加數(shù)據(jù)的規(guī)模?!氨热?,CT的圖象原來有1TB。我把這個數(shù)據(jù)集中之后,就相當于把1TB做一個拷貝,創(chuàng)造了2TB的數(shù)據(jù)?!?/p>
當然,Nicola Rieke也提到“數(shù)據(jù)安全”的問題:如果根據(jù)模型訓練出來的數(shù)據(jù),又知道底層的運行邏輯,確實是可以進行模型反推。
因此,英偉達和倫敦國王學院的研究人員在這個模型上引入了稀疏向量技術(shù)(SVT,Sparse Vector Technique)。訓練完數(shù)據(jù)之后,在數(shù)據(jù)中加入“噪點”,讓數(shù)據(jù)變得模糊、改變原有數(shù)據(jù)的顆粒度,讓反推變得更加困難。
當然,任何一個方法都不是完美的。此前,很多的數(shù)據(jù)訓練放在云端,用大量的GPU去做。但是,由于聯(lián)邦學習需要把集中于中心服務器的模型訓練過程分散到了各地。這對于合作對象的硬件條件提出了要求,會增加各地的GPU數(shù)量。
Nicola Rieke表示,確實存在這種情況,但是現(xiàn)在英偉達的GPU硬件,基本上對于每一個服務器的供應商來說都是可以使用的,最入門的、最低的投入可能只需要1萬美金,一定程度上降低了使用的門檻。
借助于聯(lián)邦學習,今年8月,英偉達與總部位于英國的藥物研發(fā)聯(lián)盟MELLODDY組織聯(lián)手,圍繞藥物研究展開合作。
MELLODDY包括了10家領(lǐng)先的制藥公司,如安進、拜耳、葛蘭素史克、楊森和諾華;兩所歐洲頂尖大學——魯汶大學和布達佩斯科技經(jīng)濟大學以及四家初創(chuàng)企業(yè)。MELLODDY的研究人員創(chuàng)建了一個分布式深度學習模型,用于在不同的云集群中的傳輸以及對未知的1000萬化合物注釋數(shù)據(jù)的訓練工作。
為AI生態(tài)打造“一個工具”
在英偉達內(nèi)部,Clara的定位就是“一個工具”。
NVIDIA中國高性能計算、產(chǎn)業(yè)AI業(yè)務總經(jīng)理劉通說到,對于任何使用Clara的用戶用,原則上是沒有任何限制的。相反,無論是初創(chuàng)企業(yè)還是大的醫(yī)療公司做AI,工具恰恰都能提供非常好的幫助。
Kimberly表示,Clara支持任何階段的初創(chuàng)企業(yè)。如果是非常早期的初創(chuàng)企業(yè),可能需要的更多是技術(shù)上的幫助。如果是成熟一點的初創(chuàng)企業(yè),可能它們需要的是市場方面的幫助。
市場化的能力體現(xiàn)在幾個方面。一方面,在英偉達的渠道上進行宣傳;另一方面,在GTC大會上,英偉達也會邀請這些公司參與大會、發(fā)表演講?!耙驗橛泻芏囡L投參會,通過這種良性的循環(huán),我們能幫助這些企業(yè)拿到一些好的風投基金?!?/p>
除此之外,英偉達也與學術(shù)機構(gòu)合作。4月,英偉達與美國放射學會聯(lián)手,將Clara AI平臺整合到旗下的ACR AI-LAB中,讓超過38000名的放射科醫(yī)生創(chuàng)建滿足自己需求的AI工具。
而在半個月前,英偉達與加州大學舊金山分校合作,用DGX超級計算機打造自己的AI訓練架構(gòu),并且用Clara開發(fā)和部署了應用。
Kimberly補充說,英偉達更多的是扮演一個“賦能者”的角色,為整個AI生態(tài)系統(tǒng)打造了一個完善的開發(fā)工具,幫助創(chuàng)業(yè)公司更好地執(zhí)行醫(yī)療AI的應用。