• <button id="kwi2e"></button>
  • <bdo id="kwi2e"><meter id="kwi2e"></meter></bdo><li id="kwi2e"><meter id="kwi2e"><th id="kwi2e"></th></meter></li>
  • <center id="kwi2e"><optgroup id="kwi2e"></optgroup></center>
      <small id="kwi2e"><delect id="kwi2e"></delect></small><span id="kwi2e"><table id="kwi2e"></table></span>
      <bdo id="kwi2e"><meter id="kwi2e"><bdo id="kwi2e"></bdo></meter></bdo><bdo id="kwi2e"><meter id="kwi2e"></meter></bdo>

      世界今熱點:萬根順:攻關語音識別技術

      時間:2022-12-23 20:37:04

      經濟觀察報 記者 周應梅 2012年,科大訊飛(002230)發布全球首個中文語音識別DNN系統,將語音識別準確率提升到80%,10年里語音識別技術突飛猛進,不斷拓寬應用場景。拿現在最常見的“實時轉寫”功能來說,這在7年前是難以實現的。

      2015年,25歲的萬根順加入科大訊飛,彼時他還是一個零基礎的新人,這些年則見證了一代又一代語音識別技術的革新,他也從參與者變成主導者。

      萬根順形容自己剛進科大訊飛時是菜鳥。7年時間里,他的成長穩扎穩打,如今他已成為科大訊飛語音識別條線研究負責人。從參與攻關科大訊飛原創的DFCNN語音識別方案,到負責起新一代語音識別技術的研發落地。


      (相關資料圖)

      保持語音識別技術領先是每個訊飛人的信念,這種精神也在萬根順這樣年輕的技術骨干中得到傳承。

      新人參與技術攻關

      萬根順剛到訊飛研究院上班的第一天,就看到員工們在辦公室激烈討論,誰也不讓誰,這個氛圍一度讓他很緊張,因此一直刻在他的腦海里。后來這樣的場景不斷發生,他才知道這就是訊飛研究院同事們工作的方式。

      2015年江蘇大學研究生畢業后,萬根順加入了訊飛研究院語音識別轉寫組,負責基礎算法研究。此前他的專業方向是圖像研究,進入語音識別領域是從零開始。

      2016年初,剛入職半年,萬根順就加入了訊飛DFCNN語音識別方案項目攻關。作為一個新人能有機會參與技術攻關,讓萬根順倍感珍惜。這次經歷也成為他職業生涯最重要的起點。

      科大訊飛原創的DFCNN語音識別方案在2016年下半年正式推出,在過往RNN識別系統基礎上整體效果提升了15%以上,在語音識別效率、口語化處理、噪音降噪等功能上有較大的改善。

      首次參與項目攻關,萬根順見證了新系統的誕生,更體會到了科大訊飛的同事們在核心技術保持國際領先的追求。

      2010年開始,科大訊飛是中國首批開展深度神經網絡語音識別技術研究的企業之一,2012年首個中文語音識別方案 DNN上線,2015年新的RNN語音識別方案開啟全面升級,2016年推出DFCNN語音識別方案。2017年至今,科大語音識別方案又經過了多次迭代,保持每年至少30%的效果提升。

      在DFCNN語音識別方案出現之前,業界最好的語音識別方案是雙向RNN語音識別,不過這個方案的算法訓練比較復雜,識別結果所需時間很長,難以在工業界推廣。在有噪音或者更復雜一些的場景,使用RNN語音識別方案會存在識別效果較差的情況。而像今天這樣的實時識別轉文字,更是難以想象。

      攻關技術期間,團隊每天的工作狀態與萬根順第一天進辦公室的場景一樣,常常伴隨著激烈的討論,為共同的目標集思廣益。他說,這是訊飛研究院同事們工作的態度,有想法直接講,不論你是新人,還是技術大牛、專家,都可以積極參與討論。

      過去科大訊飛就將語音識別和深度學習結合,在訓練策略上有多年積累。在此基礎上,DFCNN語音識別方案攻關時間僅花了半年,投入不到10個人的團隊。另外,借鑒成熟領域的模型也成為突破點。科大訊飛在攻關DFCNN語音識別方案時,就借鑒了圖像領域的算法模型,將語音信息轉化為一張張語譜圖。這很大程度上減少了輸入信息損失。

      也是在這次攻關中,多次的實驗下來,萬根順掌握了精準的分析能力。在這個項目中,萬根順還見識到了行業前輩們“敢想敢做”的態度和專業能力。“當時前輩們提出了一些設計方法,在幾年之后變成了一個主流。他們幾年前就能想到幾年后可能的發展趨勢,后續對我觸動很深。”“要大膽地去想,不要有所顧忌,只要能說服你自己的,堅持做下去一定能夠有所收獲。”這樣的理念在萬根順心里樹立起來了。

      一位技術骨干的成長

      萬根順研究語音識別時喜歡分析數據。他會花時間仔細聽音頻,去標注語音識別錯誤的一些詞或者內容,找到識別不出來的原因。此前“因5毛錢”這個句子識別錯誤就是他這樣發現的,當時他發現語音識別模型會把“因5毛錢”中的“因5毛”,識別為“鸚鵡毛”,通過這樣細微的數據,找規律后再去改進。

      找到問題后,改進方式是在語音識別系統中加一些韻律信息,“因5毛錢”和“鸚鵡毛”兩句語音的停頓方式是不一樣的。通過小細節,可以解決研究工作中的實際問題。

      2017年,萬根順作為技術負責人,實現了DFCNN語音識別方案基礎上持續升級,一年里進行了多個版本的迭代升級。

      除了參與攻關DFCNN語音識別方案外,對萬根順來講,職業生涯中比較重要的第二件事情是,2018年開始主導新一代語音識別框架的落地。

      2019年科大訊飛首個基于ED框架的語音識別方案落地。新的識別方案在輸入法、訊飛聽見、辦公本、錄音筆等多個產品中應用。

      ED框架是科大訊飛第三代語音識別方案,創新過程持續時間比較長,一直從2018年到2020年。

      萬根順坦言,從一個技術創新到真正的落地,中間經歷了無數次打磨,對個人業務能力帶來了質的提升。也是在這個過程里,萬根順對語音識別有了更深刻的認識,全面理解一個新系統,見證了追求大規模產業化落地的目標所需要面對的困難。

      二代語音識別系統分了聲學模型跟語音模型,兩個模型需要聯合起來。到第三代,是一個統一的框架,整個系統結構更加簡潔,語音輸入輸出文字直接對應,效率進一步提升,不同語種切換使用也可以識別,在用戶實用性上更加友好。

      2021年開始,萬根順再次負責無監督訓練在語音識別中的應用研究。面對不同場景設計的語音識別模型所需要的訓練數據,在加入無監督訓練功能后大大減少。

      今年訊飛研究院所發布的“唇形+語音”的多模態語音交互技術,就是引入無監督訓練的成果。基于多模態交互以及醫療認知等技術,科大訊飛還研發了一套抑郁癥定量篩查系統和老年認知障礙篩查系統。

      為了在語音識別領域保持技術領先,科大訊飛的做法是研發一代儲備一代。在研發新一代語音技術框架的時候,就會投入一部分人力去做下一代框架的預研。“中文語音識別要由中國人做到最好。”這種追求已經內化為科大訊飛員工的信念,并成了一種傳承。

      目前科大訊飛下一代語音框架的預研已經在準備,萬根順表示,下一代將更加關注用戶體驗,以及重點會解決語音識別的語義合理性,讓識別更加準確合理。

      同時,下一代系統更加強調系統自我進化的能力,例如,讓系統自動捕捉到對新詞識別效果差,然后實現自動更新。

      創新背后的機制

      萬根順從新人成長為可以獨立負責項目的技術骨干,并非一蹴而就。

      剛進入訊飛研究院,每個新人都會有一個導師。在萬根順的印象里,工作上導師會幫做一些明確的規劃。

      他記得,當時自己基礎差,導師會直接教一些工具的使用,以及為他規劃需要了解哪些方面的知識,設計實驗怎么定目標,怎么執行,“導師會事無巨細給安排好。怎么做,做到什么樣的程度。”這讓他順利度過了適應工作的階段。“一開始有了順利的過渡,往后一步一步走得更加踏實。”萬根順說。

      訊飛研究院對新人的培養除了導師制,還有輪崗機制。員工可以自愿申請,轉到同一個條線的其他方向,或跨領域輪崗,最長是半年。“訊飛鼓勵系統性的思維模式創新,輪崗的目的是讓員工掌握的知識更加全面,了解的更多,才能基于整個系統去考慮創新模式。”萬根順表示。

      在一次又一次的磨練中,能力提升是漸進式的,這樣的培養機制讓新人能慢慢成長。“當公司讓你去獨立負責一個項目時,你是有底氣的。多次參與重要項目之后,自己本身的能力有了很大提升。在共創模式下,不是一個人在戰斗,團隊有很多人在支持你。”萬根順說。

      智能語音與計算機視覺、NLP這些領域一樣已成為產業。因此關注各行各業研究進展,是訊飛研究院語音識別團隊必做的一件日常工作。萬根順說,這也是需要具備的一種思維。

      現在萬根順已經成為了新人的導師,他帶過不少新人。他強調,讓新人參與更多重點項目,而不要因為新人沒經驗就安排邊角料的工作。“給新人機會,引領式指導。有一個想法后我不會讓新人直接執行,而會先把想法分享給新員工,同時讓對方說出自己的看法,達成一致后再執行。這樣效率會提高很多。”萬根順說這是自己指導新人的方式。

      剛加入科大訊飛的兩年,萬根順給同事的印象是有拼勁,喜歡鉆研。幾年下來,萬根順的狀態更加松弛,日常與同事相處更加活潑輕松,慢慢打破設下的邊界。

      在科大訊飛的七年里,萬根順也收獲了新家庭。萬根順在這里認識了妻子,兩個人都在訊飛研究院工作。

      標簽: 語音識別技術

      來源:經濟觀察網
      0
      上一篇: 下一篇:

      最近更新

        Copyright @ 2001-2013 m.yw384.com All Rights Reserved 彩迅新聞網 版權所有 京ICP備12018864號-1

        網站所登新聞、資訊等內容, 均為相關單位具有著作權,轉載請注明出處

        未經彩迅新聞網書面授權,請勿建立鏡像 聯系我們:  291 32 36@qq.com

      營業執照公示信息

       

      主站蜘蛛池模板: 狠狠色丁香久久婷婷综合_中| 区二区三区激情综合 | 日韩亚洲国产综合久久久| 一日本道伊人久久综合影| 色综合久久综合网观看| 婷婷激情五月综合| 亚洲国产婷婷综合在线精品| 国产99久久亚洲综合精品| 国产色产综合色产在线观看视频| 天天爱天天做色综合| 亚洲综合在线另类色区奇米| 久久久综合中文字幕久久| 久久精品水蜜桃av综合天堂| 一本色道久久综合无码人妻 | 色天天天综合色天天碰| 国产亚洲综合色就色| 亚洲av日韩综合一区二区三区| 久久天天日天天操综合伊人av| 亚洲色欲www综合网| 色综合久久88色综合天天 | 色欲色香天天天综合网站 | 亚洲伊人成无码综合网 | 久久婷婷丁香五月综合五| 久久婷婷五月综合色丁香| 亚洲国产精品综合福利专区 | 国产综合精品一区二区三区| 狠狠色狠狠色综合日日五| 久久精品亚洲综合| 一本一道久久综合狠狠老| 丁香五月天综合缴情网| 国产成人精品综合| 丁香伊人五月综合激激激| 婷婷久久香蕉五月综合| 五月综合色婷婷在线观看| 国产尹人香蕉综合在线电影| 成人综合国产乱在线| 国产综合久久久久鬼色| 国产成人亚洲综合| 伊人久久大香线蕉综合影院首页| 99久久综合精品免费| 热久久综合这里只有精品电影|