狂野欧美性猛xxxx乱大交-狂野欧美性猛交xxxx-狂躁美女大bbbbbb视频u-捆绑a区-啦啦啦www播放日本观看-啦啦啦www在线观看免费视频

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 熱點 » 正文

搜狗同傳用 3.0 技術(shù)撬動 AI 語音市場更大版圖

放大字體  縮小字體 發(fā)布日期:2020-01-08 00:06:08    瀏覽次數(shù):78
導(dǎo)讀

原標(biāo)題:搜狗同傳:用 3.0 技術(shù)撬動 AI 語音市場更大版圖 來源:極客公園「語言是人工智能皇冠上的一顆明珠」,王小川如此比喻。從輸入法到搜索引擎,表達(dá)信息和獲取信息被搜狗汲取到了產(chǎn)品發(fā)展脈絡(luò)中。向

原標(biāo)題:搜狗同傳:用 3.0 技術(shù)撬動 AI 語音市場更大版圖 來源:極客公園

「語言是人工智能皇冠上的一顆明珠」,王小川如此比喻。

從輸入法到搜索引擎,表達(dá)信息和獲取信息被搜狗汲取到了產(chǎn)品發(fā)展脈絡(luò)中。向 AI 時代跨越的搜狗,產(chǎn)品需要以新技術(shù)和新形態(tài)來承載。

而在 AI 商業(yè)化落地的進(jìn)程中,搜狗以自然交互和知識計算分別作為橫軸和縱軸。橫縱交匯處,便是搜狗在 AI 語音技術(shù)和產(chǎn)品的布局。在已成型的項目中,有一個產(chǎn)品顯而易見,那就是「搜狗同傳」。

在中國,從事同傳工作的,大多數(shù)是英語專業(yè)背景,精通全領(lǐng)域是充分而非必要條件。而面對涉及醫(yī)療、數(shù)學(xué)和物理等領(lǐng)域的會議時,同傳人員并不能很好地將這些相關(guān)術(shù)語準(zhǔn)地翻譯。

當(dāng)學(xué)術(shù)盲點變成了行業(yè)痛點,以語音智能見長的科技公司便主動出擊,抓住了同聲傳譯這一細(xì)分市場的機(jī)遇。迭代到 3.0 版本的搜狗同傳,已在逾千場大型會議上登場。

搜狗認(rèn)為,機(jī)器同傳的產(chǎn)品價值,主要體現(xiàn)在其致力于解決跨語言交流、跨語言信息獲取和語言表達(dá)的電子化記錄等障礙。若要真正實現(xiàn)這三點,不能單純地把語音識別和機(jī)器翻譯做嫁接,而需要一套完整的「有機(jī)系統(tǒng)」。

搜狗同傳產(chǎn)品的迭代軌跡

從語音到機(jī)器視覺

作為業(yè)內(nèi)首個商用機(jī)器同傳的產(chǎn)品,搜狗同傳的初始版本要追溯至 2016 年 11 月。

「在測試級的準(zhǔn)確率波動比較大」,這是內(nèi)部對搜狗同傳 1.0 的客觀描述。比如領(lǐng)域、口音、中英文混雜等因素,都是導(dǎo)致同傳輸出的內(nèi)容出現(xiàn)極強(qiáng)不確定性的原因。「只有(演講者)字正腔圓時,準(zhǔn)確率才達(dá)到 95% 到 98%,其他時候可能只有 80%,」搜狗 AI 交互技術(shù)總監(jiān)陳偉如是說。

三年后,同樣的舞臺,相近的時間,搜狗同傳進(jìn)化到了第三代。對比初代版本,「其識別能力越來越強(qiáng),錯誤率越來越小,穩(wěn)定性越來越好」,這是團(tuán)隊給出的全新評價。

早期同傳產(chǎn)品之所以收效甚微,恰恰是沒有很好地搭建其這套系統(tǒng)模型。陳偉指出,傳統(tǒng)的同傳產(chǎn)品掣肘于通用模型,在會議同傳場景下,一旦涉及專業(yè)領(lǐng)域的內(nèi)容,機(jī)器同傳的效果和準(zhǔn)確度就遠(yuǎn)不及人工同傳。

搜狗同傳 1.0 發(fā)布以來就陷入了瓶頸。每逢重大場合,陳偉和團(tuán)隊就忐忑不已。歸根到底,是擔(dān)心效果不好。為了加速商用化進(jìn)程,團(tuán)隊連帶推出了「個性化私人定制」的服務(wù),就是投入人力,針對演講內(nèi)容做優(yōu)化。

在推進(jìn)的過程中團(tuán)隊發(fā)現(xiàn),由于很難把所有演講人的 PPT 和材料收全,導(dǎo)致所謂的「個性化定制」很難在會前完成。當(dāng)產(chǎn)品上了試煉戰(zhàn)場,疲于應(yīng)付的「下下策」總不是長久之計。況且,一家科技公司不應(yīng)受困于技術(shù)。

順著個性化定制的思路,團(tuán)隊在琢磨:「如果把接口開放給用戶,事先上傳演講稿或重點內(nèi)容會不會好一些?」實現(xiàn)這一點不難,單仍舊談不上進(jìn)步。要知道,大會演講通常是來也匆匆,去也匆匆,嘉賓上陣 PPT 馬上跟播,不可能有充裕的時間來完成私人定制。

趔趄之中,倒逼著搜狗同傳的技術(shù)團(tuán)隊研發(fā)更智能、更敏捷的同傳系統(tǒng),讓機(jī)器自覺地定制語境,擺脫人工干預(yù)。

「原來我們以為,人工同傳只是戴著耳機(jī)去聽演講者在講什么,」陳偉后來了解到,同傳的過程不是全程無材料的「裸翻」。同傳師坐進(jìn)全玻璃的同傳箱之前,需要提前準(zhǔn)備一到兩天的時間,了解活動當(dāng)天的全部背景資料。

以往的機(jī)器同傳,僅僅是通過語音技術(shù)來識別講述內(nèi)容。而搜狗同傳 2.0 的產(chǎn)品啟發(fā),實際上借鑒了人工同傳的流程。在同傳的過程中,除了做好語音識別以外,團(tuán)隊意識到,視覺信息同等重要。

實際上,」每個演講者都有一套自己的話語體系,」陳偉指出,基于搜狗同傳 2.0,團(tuán)隊引入 OCR 技術(shù),通過攝像頭或數(shù)據(jù)線來捕捉 PPT 內(nèi)容,算法實時在后端分析 PPT 的核心關(guān)鍵詞,搜狗同傳 3.0 的就緒度已完成了 50%。

識別翻譯協(xié)同模塊進(jìn)化前后的語句對比

多模態(tài)+知識圖譜=語境引擎

當(dāng)自動化定制成為過去式,最新發(fā)布的搜狗同傳 3.0,內(nèi)核進(jìn)化成為了「語境引擎」。除了「語音信息+OCR」的結(jié)合方式,升級后的產(chǎn)品,最大亮點是在「能聽會看」的多模態(tài)基礎(chǔ)上,注入了思考和推理能力,背后靠的是知識圖譜的加持。

從機(jī)器同傳的流程來看,當(dāng)機(jī)器視覺捕捉到核心關(guān)鍵詞之后,會根據(jù)搜狗的知識圖譜技術(shù),把相關(guān)的詞匯以及專業(yè)領(lǐng)域相關(guān)的詞語拓展出來,作為語音識別和翻譯的加強(qiáng)。

這一點非常重要。通過語境引擎構(gòu)建的個性化知識,團(tuán)隊在某一專業(yè)論壇做了測試評估,結(jié)果顯示其識別準(zhǔn)確率提升了 21.7%,翻譯正確率提升了 40.3%。補(bǔ)足了上一代從 PPT 獲許不到太多關(guān)鍵詞的短板。

從搜狗同傳 3.0 在某論壇的的評測效果來看,滿分為 5 分,人工同傳得分 4.08,搜狗同傳 2.0 為 3.41 分,搜狗同傳 3. 為 3.82 分。「這說明這說明 3.0 的系統(tǒng)距離人工同傳的水平更加接近,它更像一個專家和內(nèi)行一樣,去解讀和翻譯大會,」陳偉表示

以搜狗同傳 3.0 實際應(yīng)用效果為例。案例一的背景是圍繞阿爾法狗和李世石的人機(jī)大戰(zhàn)。「投子」是一個圍棋術(shù)語,沒有語境的前提下,2.0 版本會把這一詞匯識別為「投資」,但 3.0 版本可以根據(jù) PPT 的內(nèi)容,拓展出「投子」的術(shù)語。

類似的案例還有「羅輯思維」。搜狗同傳 2.0 的系統(tǒng)沒有辦法捕捉語境信息去做優(yōu)化和增強(qiáng)。3.0 版本,系統(tǒng)根據(jù)羅振宇的知識圖譜做拓展,自動判定跟他密切相關(guān)的是「羅輯思維」,而不是「邏輯思維」。

值得一提的是,3.0 版本在英文詞匯方面,對觀眾更加友好。例如在醫(yī)學(xué)領(lǐng)域,「INI」對應(yīng)的是「國際神經(jīng)科學(xué)研究所」的中文譯稱。以往,機(jī)器同傳的結(jié)果會直接顯示「INI」,普通聽眾很可能不太清楚其具體含義,基于機(jī)器對知識圖譜進(jìn)行拓展查詢,在搜狗的專業(yè)中英文知識庫中,就可以找到與之相應(yīng)的中文解釋。

語境引擎是搜狗同傳3.0取得突破的關(guān)鍵

2B 最終落向 2C

「我們認(rèn)為未來面向人和機(jī)器交互過程中,一定是多模態(tài)的」,搜狗提倡的技術(shù)主張,使機(jī)器同傳和同類產(chǎn)品拉開了一代之差。「他們還是以同傳為主,我們已經(jīng)從語音跨到了多模態(tài),并把對于知識和語音的理解放進(jìn)去,使同傳開始具備一定的認(rèn)知能力。」

必須要承認(rèn)的是,無論是搜狗同傳還是其他玩家,大家目前距離頂級同傳的水準(zhǔn)還有很長的路要走。雖然真正到金字塔塔尖的同傳人才十分稀少,但陳偉認(rèn)為目前的機(jī)器同傳能力和頂級人工同傳相比,仍存在不小的差距。

顯然,針對極高規(guī)格的會議場景,現(xiàn)階段的機(jī)器同傳還達(dá)不到要求。不過在復(fù)雜要求不高,輔助觀眾和聽眾跨語言交流的用途中,其發(fā)揮的作用愈發(fā)明顯。因此,行業(yè)應(yīng)該要抱著向人工同傳學(xué)習(xí)的態(tài)度,「而不能說今天六級,明天八級,后天機(jī)器超越人工了,這不是特別好的心態(tài)。」

除了大會演講這種 2B 同傳場景,未來,機(jī)器同傳可向記者采訪、跨國辦公會議、中英文視頻直播、字幕翻譯等場景延展。這些應(yīng)用場景最主要的挑戰(zhàn),是怎么保證機(jī)器同傳的穩(wěn)定效果,考驗的是采集設(shè)備、網(wǎng)絡(luò)環(huán)境、識別能力等。「預(yù)計迭代到 3.5 的版本,技術(shù)沉淀后的能力,就可以向這些場景做覆蓋了。」

盡管搜狗通過技術(shù)迭代不斷地教育市場,不過機(jī)器同傳并沒有在過去一兩年迎來爆發(fā),搜狗同傳也并沒有通過大會獲取收入。其中很重要的因素在于,「跨代躍進(jìn)的效果提升,需要一個研發(fā)周期,在這個過程中不能盲目地向 B 端市場狂推。」陳偉明確指出,搜狗同傳更多的是代表了搜狗在 AI 方面的核心競爭力和技術(shù)驅(qū)動創(chuàng)新上的成果,所以「不會是一個很賺錢的行業(yè)」。

而搜狗在 AI 語音商業(yè)化的進(jìn)程,最終的指向還是 2C。陳偉預(yù)判,未來各種各樣的場合都可能用到搜狗同傳的技術(shù),通過同傳打磨的能力也可以反向用于搜狗的 C 端產(chǎn)品。「我們希望以搜狗同傳在大會場景和 B 端的經(jīng)驗、數(shù)據(jù)為基礎(chǔ),不斷打磨 2B 輸出的能力,最后反哺到 2C 端的市場中。」

責(zé)任編輯:臥蟲

圖片來源:VPhoto、搜狗

 
(文/小編)
免責(zé)聲明
本文僅代表作發(fā)布者:個人觀點,本站未對其內(nèi)容進(jìn)行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們刪除處理郵件:[email protected]
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

粵ICP備16078936號

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: [email protected]

微信公眾號: weishitui

客服001 客服002 客服003

工作時間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 欧美另类交视频 | 久久这里只有精品首页 | 性做久久久久久蜜桃花 | 色老头xxxwww作爱视频 | 日本aaaa级毛片在线看 | 九热爱视频精品视频 | 亚洲精品亚洲九十七页 | 欧美一区二区三区香蕉视 | 一级做a爱片久久毛片 | 在线色资源 | 九九99九九在线精品视频 | 亚洲黄色大片 | 欧美一级视频 | 国产精品视频免费的 | 2021最新国产成人精品视频 | 久久国产乱子伦精品免费一 | 美女久久久久久 | 色老头福影院韩国激情影院 | 99热最新网址 | 99精品国产免费久久国语 | 在线播放国产一区二区三区 | 色偷偷久久一区二区三区 | 国产精选91热在线观看 | 热久久久久久久 | 亚洲中字幕 | 中文字幕亚洲无线码在线一区 | 女人洗澡一级毛片一级毛片 | 久久久99精品 | 欧美日韩国产一区二区三区欧 | 爱爱99 | 欧美福利精品福利视频在线观看 | 欧美日本一道高清免费3区 欧美日本一道免费一区三区 | 日本不卡不码高清免费观看 | 色偷偷91综合久久噜噜 | 尤物视频在线观看视频 | 国产精品福利在线 | 色偷偷女人的天堂a在线 | 久久综合综合久久97色 | 久久精品香蕉视频 | 最新国产福利在线 | 国产精品资源在线观看 |