雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))8月28日消息,搜狗在京舉辦了開放聽寫服務(wù)暨AI創(chuàng)新聯(lián)盟發(fā)布會(huì)。發(fā)布會(huì)現(xiàn)場,搜狗官宣開放聽寫服務(wù),讓更多的錄音筆廠商享受AI紅利,并與愛國者,索尼,紐曼,萬城集團(tuán)四大頭部錄音筆廠商成立AI創(chuàng)新聯(lián)盟。
20多年來,產(chǎn)品創(chuàng)新上只限于擴(kuò)容,續(xù)航,外觀改造的傳統(tǒng)錄音筆,在智能手機(jī)日益普及后,逐漸進(jìn)入了增長瓶頸期,AI的加持或?qū)?huì)為行業(yè)迎來新的轉(zhuǎn)折點(diǎn),這是近幾年來錄音筆行業(yè)內(nèi)的普遍共識。但時(shí)至今日搭載AI技術(shù)快車道,有“語音識別”“機(jī)器翻譯”超能力的智能錄音筆在市面上仍不多見,很重要的一點(diǎn)是:傳統(tǒng)數(shù)碼錄音筆廠商在AI研發(fā)上較為欠缺,且AI語音技術(shù)壁壘較高。
搜狗在自己試水做了AI錄音筆且一舉獲得市場認(rèn)可后,再選擇開放聽寫服務(wù),無疑是為行業(yè)迎來了新的發(fā)展契機(jī),讓傳統(tǒng)錄音筆行業(yè)從單純依靠硬件銷售的模式轉(zhuǎn)向了硬件+軟件雙服務(wù)的商業(yè)模式。
此次“開放聽寫服務(wù)”上,搜狗也沒走俗套,避開做開放性平臺(tái)向廠商提供API接口,而是做了“錄音筆的OS”!通過藍(lán)牙開放協(xié)議,讓合作廠商零成本接入,讓用戶通過PC和移動(dòng)端享用搜狗聽寫增值服務(wù)。搜狗開放的“錄音筆OS”,正如Google的安卓系統(tǒng)對于手機(jī)的意義,微軟Windows對于電腦的意義,是AI技術(shù)實(shí)現(xiàn)更大商業(yè)化的生態(tài)打法。
搜狗公司AI交互技術(shù)中心總經(jīng)理王硯峰在28日的媒體專訪現(xiàn)場也坦言,未來AI賦能一定會(huì)越來越重,搜狗開放服務(wù)是做了一件很重的事兒。
做錄音筆OS: 服務(wù)比技術(shù)更重
在8月28日的現(xiàn)場發(fā)布會(huì)上,搜狗CTO楊洪濤也不止一次強(qiáng)調(diào):“我們開放的是服務(wù),不是技術(shù),這是不同的概念?!?br/>
究竟有什么不同呢?雷鋒網(wǎng)記者在現(xiàn)場采訪中了解到,開放技術(shù)是一個(gè)相對輕的做法,開放服務(wù)是更重的操作。坦白講,如果搜狗“開放聽寫技術(shù)”,那么適配廠商就得利用搜狗的API開放接口做自己的語音識別軟件。這不利于行業(yè)標(biāo)準(zhǔn)化,同時(shí)廠商的運(yùn)維成本也會(huì)很高。更重要的一點(diǎn)是,平臺(tái)的參與度不夠,用戶體驗(yàn)可能會(huì)下降,可替代性會(huì)增強(qiáng)。
相對的,“開放聽寫服務(wù)”會(huì)是一個(gè)很重的事兒。搜狗公司AI交互技術(shù)中心總經(jīng)理王硯峰在媒體專訪現(xiàn)場中向記者解釋稱,“僅僅開放技術(shù)是不夠的,我們要把語音聽寫配套服務(wù)做起來,因?yàn)榧夹g(shù)開放平臺(tái)本身與客戶使用場景銜接度不夠,優(yōu)化不夠,技術(shù)會(huì)成為一種雞肋?!?br/>
王硯峰在28日的發(fā)布會(huì)現(xiàn)場也將這樣的服務(wù)稱為是“錄音筆OS”, 接入這個(gè)OS后,愛國者,索尼,紐曼,萬城集團(tuán)四大廠商的錄音筆將會(huì)獲得多項(xiàng)超能力,實(shí)現(xiàn)智能轉(zhuǎn)寫。
1、優(yōu)秀的轉(zhuǎn)寫技術(shù),準(zhǔn)確率高達(dá)95%。
2、接入搜狗輸入法。由于用統(tǒng)一的輸入法賬號,加上長期的數(shù)據(jù)積累后,用戶會(huì)建立起個(gè)人的輸入詞庫,常用的專業(yè)詞匯、人名地名會(huì)被輕松識別。
3、多端同步編輯:無論在PC、安卓還是iOS上,用戶都可以同步對錄音轉(zhuǎn)寫的文字,進(jìn)行編輯。未來輸入法可以提供錄音文件的導(dǎo)入,導(dǎo)入完了以后進(jìn)行閉環(huán)的管理和編輯等一系列功能,即使用戶沒有帶錄音筆,換一個(gè)電腦登錄自己的輸入法,也可以把錄音文件同步過來,進(jìn)行跨電腦的編輯。同時(shí)由于配備了聲紋識別能力,轉(zhuǎn)寫的文字可自動(dòng)區(qū)分出說話人的角色,進(jìn)行分段整理文字。
4、智能糾錯(cuò):轉(zhuǎn)寫過程中會(huì)自動(dòng)去掉音頻中的重復(fù)詞,口頭語,讓文本更順滑,更有邏輯性。如果有有不確定的部分,搜狗聽寫服務(wù)會(huì)提供多個(gè)可能的詞匯備選,不用手動(dòng)一個(gè)字一個(gè)字的人工刪改。
5、云存儲(chǔ)服務(wù):用戶的錄音和文字都能作為一種資產(chǎn),長期保存在云端。
現(xiàn)在購買合作廠商錄音筆的用戶可以通過兩條路徑享用搜狗聽寫服務(wù):對于市面上的現(xiàn)有產(chǎn)品,用戶將錄音筆USB接口插入電腦,搜狗輸入法就能探測到錄音筆的插入,開始按需執(zhí)行語音轉(zhuǎn)寫服務(wù);對于AI創(chuàng)新聯(lián)盟內(nèi)企業(yè)未來研發(fā)的新品,在移動(dòng)端開放藍(lán)牙協(xié)議后,用戶通過藍(lán)牙與搜狗錄音助手相連,就可以實(shí)時(shí)完成語音轉(zhuǎn)寫服務(wù)。
錄音筆行業(yè)將進(jìn)入軟硬結(jié)合的雙增長模式
搭載搜狗聽寫快車道的AI錄音筆,不僅能錄,能轉(zhuǎn)寫,還能智能編輯。搜狗在28日的開放聽寫發(fā)布會(huì)上表示,此次開放這樣的錄音OS系統(tǒng),也希望未來是以場景為用戶提供更多元的增值服務(wù)。
相比于傳統(tǒng)錄音筆,AI錄音筆降噪,去混響,增強(qiáng)收音的效果也是增強(qiáng)用戶體驗(yàn)的一大優(yōu)勢。硬件體驗(yàn)上更優(yōu)質(zhì),軟件配套服務(wù)商更人性智能化,這樣軟硬結(jié)合的雙輪驅(qū)動(dòng),讓不少業(yè)內(nèi)人士堅(jiān)信傳統(tǒng)錄音筆行業(yè)將走出增長瓶頸期,迎來新的增長拐點(diǎn)。
有數(shù)據(jù)統(tǒng)計(jì),2017年7月到2018年6月,各主流電商平臺(tái),數(shù)碼錄音筆單品訪問量在持續(xù)下降,對比同窗口期,2019年3月后不再像往年關(guān)注度和銷量持續(xù)下降,而是走高。這一時(shí)期,也是智能錄音筆廣泛引起關(guān)注的時(shí)刻。
搜狗在28日發(fā)布會(huì)上表示,自今年3月份發(fā)布一代搜狗智能錄音筆C1后,Q2時(shí)間里C1多次榮獲各大主流電商平臺(tái)銷冠,并宣布上周又發(fā)布了黃、紅、白等時(shí)尚炫彩版智能錄音筆,以滿足用戶多元化的需求。
正是搜狗自研產(chǎn)品的成功,讓行業(yè)內(nèi)傳統(tǒng)廠商看到新的希望,有了此次成立AI創(chuàng)新聯(lián)盟的契機(jī)。得益于搜狗AI聽寫服務(wù)的背后支持,加上硬件的升級,未來錄音筆行業(yè)將打破行業(yè)天花板,擺脫過去單純依靠硬件銷售獲利的方式轉(zhuǎn)向軟件服務(wù)+硬件聯(lián)合的新商業(yè)模式。
經(jīng)過在AI技術(shù)上的多年鏖戰(zhàn),搜狗正嘗試將自身的AI能力與行業(yè)進(jìn)行更多結(jié)合,進(jìn)而探索增值空間,而搜狗高管在接受采訪時(shí)也表示,搜狗聽寫服務(wù)的開放只是開始,未來提供更完整服務(wù)的能力也會(huì)逐步開放。