人工智能時代,懂語言者“得天下”,NLP作為人工智能的“掌上明珠”,最新發(fā)展布局和未來發(fā)展趨勢究竟如何?

  8月25日,即七夕當(dāng)天,以“掌握知識、理解語言、擁有智能”為主題的百度大腦語言與知識技術(shù)峰會以直播形式召開,百度CTO王海峰、百度集團(tuán)副總裁吳甜、百度技術(shù)委員會主席吳華等大咖現(xiàn)身大會,向外界全面介紹了百度在語言與知識領(lǐng)域的整體布局、技術(shù)創(chuàng)新及產(chǎn)業(yè)實踐,并重磅發(fā)布多項全新產(chǎn)品和技術(shù)等,希望攜手學(xué)界、產(chǎn)業(yè)界合作伙伴推動語言與知識技術(shù)發(fā)展,為產(chǎn)業(yè)智能升級提供原動力。

  在這場面對上百萬人的極客大秀上,百度作為國內(nèi)乃至全球NLP領(lǐng)域的“佼佼者”,分享了很多重磅內(nèi)容,可謂AI大佬在線“劃重點”。他們到底說了啥?帶來了哪些技術(shù)干貨呢?

  亮點一:百度已打造完整NLP技術(shù)布局,持續(xù)落地提升智能化水平

  王海峰表示,“在百度語言與知識技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個趨勢,即技術(shù)發(fā)展趨勢和產(chǎn)業(yè)發(fā)展趨勢,并力爭引領(lǐng)趨勢!苯(jīng)過十余年的發(fā)展,百度已構(gòu)建完整的語言與知識技術(shù)布局,包括知識圖譜、語言理解與生成技術(shù),以及上述技術(shù)所支持的包含智能搜索、機(jī)器翻譯、對話系統(tǒng)、智能寫作、深度問答等在內(nèi)的應(yīng)用系統(tǒng),而且百度語言與知識技術(shù)碩果正源源不斷地以平臺化的方式對外輸出,在互聯(lián)網(wǎng)、金融、醫(yī)療、教育等諸多領(lǐng)域發(fā)揮作用,提升了產(chǎn)業(yè)智能化水平。

  細(xì)品一下,就是說百度語言與知識技術(shù)十年發(fā)展技術(shù)布局完善,實力硬核,這波秀肌肉值得滿分!

  image.png

  百度語言與知識的技術(shù)實力業(yè)界有目共睹,國家科技進(jìn)步獎等20多個獎項、30多項國內(nèi)外競賽冠軍、2000多項專利等,成為了百度語言與知識技術(shù)實力最好的證明。

  image.png

  技術(shù)有多難,就有多重要。語言與知識技術(shù)的重要性不容小覷。在回顧完百度語言與知識技術(shù)的進(jìn)程以及最新進(jìn)展,王海峰引出了峰會中其他三大亮點,首先是百度語言與知識產(chǎn)品的重磅發(fā)布和全新升級,其次是數(shù)據(jù)共建和算力共享計劃,最后是百度NLP“十年十人”的發(fā)布,進(jìn)一步為技術(shù)和社會進(jìn)步做出更大貢獻(xiàn)!

  亮點二:重磅發(fā)布3大新產(chǎn)品、6項全新升級,覆蓋4大NLP領(lǐng)域重點研究方向

  3、6、4這三個不起眼的數(shù)字,但對廣大開發(fā)者來說,卻一點也不普通。此次峰會,百度為進(jìn)一步降低開發(fā)者應(yīng)用語言與知識技術(shù)的門檻和成本,將多年來語言與知識技術(shù)沉淀凝聚成一系列技術(shù)平臺和產(chǎn)品對外發(fā)布。

  image.png

  其中,3大新品包括語言理解方面的語義理解技術(shù)與平臺文心ERNIE、一站式TextMind智能文檔分析平臺、以及機(jī)器翻譯方面的AI同傳會議解決方案;6項技術(shù)全面升級包括智能創(chuàng)作平臺重磅推出的智能策劃、智能采編、智能審校3大媒體場景方案,以及智能對話定制與服務(wù)平臺UNIT平臺帶來更智能的任務(wù)式對話理解、極致便捷的表格問答、融合通用對話的新引擎三大新能力升級,這些全面覆蓋理解、生成、對話、翻譯4大NLP領(lǐng)域重點研究方向。

  百度語言與知識技術(shù)多年深耕、布局全面,核心技術(shù)持續(xù)發(fā)展突破,為廣大開發(fā)人員、業(yè)務(wù)應(yīng)用者提供以語言與知識技術(shù)為核心驅(qū)動的系列產(chǎn)品,發(fā)揮應(yīng)用價值。對此,吳甜也給出了一組數(shù)據(jù):百度智能對話定制與服務(wù)平臺UNIT自發(fā)布以來,已有2.7萬多開發(fā)者積累下2.4億個知識條目,支撐了超過10萬個智能對話應(yīng)用,與用戶展開超過4200億次交互。

  亮點三:共建開源數(shù)據(jù)+豪擲億元算力,要在世界范圍建設(shè)中文信息處理影響力

  數(shù)據(jù)、算力的缺乏,特別是相較英文下標(biāo)準(zhǔn)的中文開源數(shù)據(jù)集的匱乏,成為制約中文信息處理領(lǐng)域發(fā)展的瓶頸。

  對此,王海峰指出,復(fù)雜知識表示和快速構(gòu)建技術(shù),知識與深度學(xué)習(xí)進(jìn)一步融合,深度融合感知和認(rèn)知的跨模態(tài)語義理解技術(shù),模型可解釋性和魯棒性,這四大難題仍需要繼續(xù)研究解決。但對于未來,百度充滿信心。

  會上,百度發(fā)布了“千言”數(shù)據(jù)共建計劃和價值一億元的算力共享計劃。吳華介紹到,“千言”的目標(biāo)是覆蓋豐富的任務(wù)類型,從復(fù)雜知識構(gòu)建、語義理解、知識融合、多模態(tài)融合等角度推動技術(shù)進(jìn)步,同時提供能進(jìn)行多維度綜合評價的數(shù)據(jù)集從而評價模型的全面性、泛化性、魯棒性。首期千言項目已涵蓋了7大任務(wù)、20余個中文開源數(shù)據(jù)集。在未來3年中,百度計劃面向超20個任務(wù),收集和建設(shè)不少于100個中文自然語言處理數(shù)據(jù)集。

  image.png

  而語言與知識算力共享計劃,是指百度將通過AI STUDIO平臺,提供價值一億元的算力支持,為語言與知識技術(shù)開發(fā)者助力。在未來,百度還計劃邀請“千言”數(shù)據(jù)集的使用者,百度語言與知識開源開放用戶以及更多的中文語言與知識技術(shù)開發(fā)者、研究人員免費使用這些算力。

  百度希望通過共建中文自然語言處理開源數(shù)據(jù)及算力支持,與學(xué)界、產(chǎn)業(yè)界共同推進(jìn)技術(shù)進(jìn)步?吹竭@里,百度AI技術(shù)的開放共享,確實讓開發(fā)者們感受到滿滿的中國科技實力的自豪感。

  亮點四:十年征程,不忘初心

  2010年,百度在國內(nèi)最先成立專門的自然語言處理部,在前瞻技術(shù)與產(chǎn)業(yè)格局上不斷引領(lǐng)、創(chuàng)新,十年間已成為中國NLP發(fā)展的一面旗幟。

  十年征程,百度語言與知識技術(shù)發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會上,百度推出以王海峰為代表的百度NLP“十年十人”,十年堅守,不忘初心,秉持“技術(shù)信仰”,勇攀技術(shù)高峰,矢志不渝致力于讓機(jī)器更好地理解世界、更好地服務(wù)于人。

  image.png

  此次峰會,匯聚了百度語言與知識的技術(shù)積累和產(chǎn)業(yè)實踐。不難看出,百度對整個語言與知識領(lǐng)域的布局是領(lǐng)先,且具有借鑒意義的。其實,百度的語言與知識技術(shù)實力不僅領(lǐng)先國內(nèi),在國際上也絲毫不遜色。以百度知識增強(qiáng)的語義理解框架ERNIE為例,去年年底ERNIE在國際權(quán)威的通用語言理解評估基準(zhǔn) GLUE上首次突破 90大關(guān),超越人類三個點,獲得全球第一。下圖正是全球AI三巨頭,從技術(shù)成果、研發(fā)力量、產(chǎn)品與服務(wù)三個維度展現(xiàn)了自身的語言與知識技術(shù)價值。 

  image.png

  2020年,是百度深耕語言與知識技術(shù)的第十年,更是技術(shù)成果厚積薄發(fā)的一年,站在十年發(fā)展的新起點上,百度舉辦百度大腦語言與知識技術(shù)峰會,與產(chǎn)學(xué)研各界同仁分享NLP技術(shù)變遷和發(fā)展趨勢,推動技術(shù)創(chuàng)新與產(chǎn)業(yè)實踐,加速AI技術(shù)發(fā)展及智能社會建設(shè),助力中國產(chǎn)業(yè)智能化轉(zhuǎn)型。百度AI,實力引領(lǐng),未來可期。