作者:admin 點(diǎn)擊量:5657
在其年度秋季硬件發(fā)布會(huì )的前一天,亞馬遜宣布了一項重要的合作關(guān)系聲明:它創(chuàng )建了“語(yǔ)音互操作性計劃”(Voice Interoperability Initiative),這是30多家公司的聯(lián)合意向聲明,將努力確保設備可以同時(shí)兼容多個(gè)數字助理。例如,用戶(hù)只需說(shuō)出適當的喚醒詞,即可與同一臺智能音箱上的Alexa或Cortana對話(huà)。
亞馬遜設備和服務(wù)高級副總裁Dave Limp表示:“我們不愿意看到只有一個(gè)語(yǔ)音助手來(lái)統治所有設備。這不是體育賽事,不會(huì )僅有一個(gè)贏(yíng)家?!盠imp認為,如果會(huì )存在多個(gè)語(yǔ)音助手,那么它們應該更好地協(xié)作。
大批為語(yǔ)音助手構建軟件和硬件的公司已加入該計劃,亞馬遜的聲明如下:
“30多家公司正在支持這項工作,包括亞馬遜、百度、寶馬、Bose、Cerence、ecobee、Harman、羅技、微軟、Salesforce、Sonos、Sound United、索尼、Spotify和騰訊等全球品牌;Free、Orange、SFR和Verizon等電信運營(yíng)商;硬件解決方案提供商,例如Amlogic、InnoMedia、英特爾、MediaTek、恩智浦、高通、Inc.、SGW Global和Tonly;以及CommScope、DiscVision、Libre、Linkplay、MyBox、Sagemcom、StreamUnlimited和Sugr等系統集成商?!?/p>
這是一個(gè)非常長(cháng)的列表,但其中卻缺少了三個(gè)非常杰出的公司:谷歌、蘋(píng)果和三星。
而那些支持這一計劃的公司卻表示很高興。英特爾表示,其第10代芯片將于今年兼容“多個(gè)助手”,而高通則表示,其芯片組已經(jīng)能夠支持多個(gè)喚醒詞匯。
如果仔細閱讀微軟Cortana副總裁Andrew Shuman的聲明,你可能會(huì )發(fā)現這是對谷歌和蘋(píng)果不支持第三方助手最為溫和的表態(tài):“我們希望這一計劃能夠幫助我們將這一愿景擴展到更多公司,并建立一個(gè)平衡的生態(tài)系統,使各大公司能夠在所有平臺上創(chuàng )建和提供助手?!?/p>
更有趣的是,其他公司似乎也渴望在Echo設備上安裝自己的語(yǔ)音助手。Salesforce首席執行官Marc Benioff寫(xiě)道:“我們期待與亞馬遜和其他行業(yè)領(lǐng)導者合作,使世界領(lǐng)先的CRM助手Einstein Voice能夠在任何設備上獲得訪(fǎng)問(wèn)?!盨potify研發(fā)主管表示:“我們很高興加入語(yǔ)音互操作性計劃,該計劃將使我們的聽(tīng)眾在他們選擇的任何語(yǔ)音助手上都能獲得更加無(wú)縫的體驗?!?/p>
百度的參與也很引人注目。其DuerOS語(yǔ)音助手擁有超過(guò)4億用戶(hù),雖然比Alexa多,但比Google Assistant少。據研究公司Canalys稱(chēng),百度僅次于亞馬遜,成為第二大智能音箱制造商,盡管僅服務(wù)于中國市場(chǎng),但最近已超過(guò)谷歌。
這些公司設想的理想情況是將有兩種助手。一種將具有廣泛的知識和能力(例如Alexa、Siri和Google Assistant),而另一種則更為專(zhuān)業(yè)和深入,并針對特定知識領(lǐng)域。當然,最終的目的就是,無(wú)需精通高深的技巧,就能在智能音箱上直接與其中一個(gè)助手對話(huà)。
這是已經(jīng)在PC電腦上發(fā)揮作用的策略。亞馬遜的語(yǔ)音助手已經(jīng)更緊密地集成到了Windows 10中,當有人從房間的一邊喊“Alexa”時(shí),特定的PC電腦就可以響應一般查詢(xún)。微軟的Cortana也在重新調整重心,關(guān)注與該公司軟件和服務(wù)的交互。
Limp將他對語(yǔ)音助手的愿景比作瀏覽器:你可以使用所需的任何瀏覽器訪(fǎng)問(wèn)所需的網(wǎng)站,那么為什么不使用所需的音箱與所需的助手對話(huà)呢?“我們是一家Web 1.0公司,”Limp說(shuō)?!岸椰F在能夠坐在這座大樓中的原因就在于網(wǎng)絡(luò )的互操作性?!?/p>
這是一個(gè)崇高的理想,但在戰略上也可能很精明。亞馬遜已經(jīng)在擁有Alexa的家庭中占據了有利位置,因此讓其他助手使用Echo音箱進(jìn)行工作似乎并不是一個(gè)大問(wèn)題。需要明確的是,亞馬遜致力于允許這種情況發(fā)生。該公司此前宣布,法國的Orange用戶(hù)將能夠購買(mǎi)支持Alexa和Orange助理Djingo的Echo音箱。
但是,盡管曾多次嘗試與Android制造商和耳機制造商建立合作伙伴關(guān)系,但Alexa在手機上并沒(méi)有取得太大的成功。除智能手機中最有影響力的三家公司外,每家公司都參與的整個(gè)行業(yè)計劃似乎是被故意設計的,旨在向這些公司施加壓力。(這也可能幫助亞馬遜證明它不是壟斷性的,因為它非常愿意與他人合作,并向競爭對手開(kāi)放其語(yǔ)音平臺。)
無(wú)論你將其視為利他主義還是戰略性的策略,該計劃至少會(huì )對谷歌造成一定壓力。該公司一直以來(lái)對允許Google Assistant與其他軟件配合使用,表現的非常謹慎——盡管這更可能是出于與隱私相關(guān)的原因,而不是與市場(chǎng)動(dòng)態(tài)有關(guān)。
當被問(wèn)及有關(guān)谷歌、蘋(píng)果和三星的具體細節時(shí),Limp說(shuō):“我們很樂(lè )意讓這三家公司參與這項計劃?!边@樣的表態(tài)聽(tīng)起來(lái)很像是這三家公司拒絕了邀請,但是Limp拒絕對此進(jìn)行詳細說(shuō)明。
他說(shuō),盡管一直以來(lái)他都在與其他公司討論這個(gè)想法,但直到最近的“六周”,它才逐漸成型??紤]到像谷歌和三星這樣的公司移動(dòng)的速度之快,六周似乎并不是很長(cháng)的時(shí)間。從技術(shù)上講,Harman是三星的子公司,而三星手機也已經(jīng)同時(shí)支持Bixby和Google Assistant,因此尚不清楚該公司為什么不參與這項計劃。而至于蘋(píng)果,我們并不清楚它是否愿意加入。
谷歌向媒體發(fā)布了一則聲明,指出它只是在上周末才聽(tīng)說(shuō)這項計劃:“我們剛剛聽(tīng)說(shuō)過(guò)這項計劃,需要對其細節進(jìn)行審查,但總的來(lái)說(shuō),我們始終對參與能夠得到生態(tài)系統廣泛支持并堅持嚴格隱私和安全措施的計劃感興趣?!?/p>
三星和蘋(píng)果尚未回復置評請求。
需要明確的是,Limp否認這項計劃會(huì )給這些公司施加壓力:“如果他們不想這樣做,那我們是不會(huì )嘗試改變他們的想法的?!?/p>
從技術(shù)角度來(lái)看,關(guān)于實(shí)施、軟件、隱私等各種問(wèn)題,我們還尚無(wú)法回答。語(yǔ)音互操作性計劃既不是標準組織,也不是對其成員如何應對一臺音箱同時(shí)支持多名助理這一復雜問(wèn)題的規定。
亞馬遜目前正在免費提供其“喚醒引擎”,以便其他想要建立自己助手的公司可以利用亞馬遜的研究來(lái)開(kāi)始開(kāi)發(fā)。但是這項聯(lián)盟中的公司可以自由地使用他們喜歡的任何技術(shù)。
迄今為止,還沒(méi)有很多設備可以“支持多個(gè)同時(shí)喚醒詞匯”。比如,Sonos One等更出色的設備,讓用戶(hù)在A(yíng)lexa或Google Assistant之間進(jìn)行選擇。
但是實(shí)際上并不存在真正的技術(shù)限制。Sonos軟件副總裁Antoine Leblond演示了一個(gè)Sonos One音箱。它在聽(tīng)到“Alexa”和“Hey Google”喚醒詞之后運行得非常好,包括Sonos的“連續性”功能,該功能使用戶(hù)可以使用一個(gè)助手開(kāi)始音樂(lè ),然后用另一個(gè)助手進(jìn)行控制。
考慮到亞馬遜一再表示很高興讓Alexa與其他助手共存,那么Sonos One不采用這樣的模式是不是因為谷歌不允許這樣做?Leblond表示了否認,但他確實(shí)提出了一個(gè)事實(shí),即一個(gè)音箱上存在兩個(gè)活躍助手可能會(huì )出錯。例如:如果你通過(guò)一個(gè)助手設置了鬧鈴,但鬧鐘響起時(shí)卻不在身邊,你的家人該告訴哪位助手停止呢?
從技術(shù)角度弄清楚如何部署多個(gè)助手甚至不是最困難的問(wèn)題。如果過(guò)去一年有什么能夠教導我們的事情,那就是很少有人意識到語(yǔ)音助手正在收集我們的全部數據。讓人工審核者檢查轉錄音質(zhì)的做法,已經(jīng)讓亞馬遜、谷歌和蘋(píng)果遭受了輿論打擊。三家公司為此都改變了研發(fā)方向,增加了透明度,讓退出、刪除數據或兩者都更容易。
一個(gè)由25家公司組成的聯(lián)盟想要讓多個(gè)助手輕松共存,這聽(tīng)起來(lái)也不是保護隱私的好方法。但是Limp強調,他想仔細研究這些系統的結構。
例如,他認為應該有嚴格的規定,絕不允許一個(gè)助手“竊聽(tīng)”用戶(hù)與另一個(gè)助手的對話(huà)。這看起來(lái)很簡(jiǎn)單,但是還有更棘手的問(wèn)題。聆聽(tīng)不同喚醒詞所涉及的大部分工作應該由硬件還是軟件來(lái)處理呢?當Limp表示他設想“語(yǔ)音助手有朝一日可以私人名義代表客戶(hù),以保留上下文和連續性的方式在云中進(jìn)行協(xié)作”時(shí),如何確保隱私性呢?
而且它變得更加棘手:在過(guò)去的一年中,一個(gè)常見(jiàn)的疑問(wèn)是,這些助手在出人意料地錄音的同時(shí),卻沒(méi)有聽(tīng)到喚醒詞。因此,如果一臺音箱中可能準備好兩個(gè)或十幾個(gè)不同助手時(shí),那些意外的錄音會(huì )怎樣?
這些問(wèn)題尚無(wú)明確答案,而且在六周關(guān)于組建該計劃的討論后,氣氛開(kāi)始變得嚴肅起來(lái)。我問(wèn)Sonos是否還會(huì )后續會(huì )議、合同甚至應酬時(shí),答案都是“不,不,不”??磥?lái),一切都還很早。
亞馬遜,尤其是Alexa,因迅速行動(dòng)以擴展其生態(tài)系統而聞名,有時(shí)也以犧牲清晰度或軟件質(zhì)量為代價(jià)。但是,至少這次,亞馬遜似乎并不著(zhù)急。
“我們研究這個(gè)事情已經(jīng)五年了,”Limp說(shuō)。當他仔細研究技術(shù)和隱私問(wèn)題時(shí),他認為“這是一個(gè)棘手的問(wèn)題,而且規模相當的大,將需要很多很多年才能夠解決?!?/p>