<th id="dtzbx"></th>


      <th id="dtzbx"><meter id="dtzbx"></meter></th>

        <menuitem id="dtzbx"></menuitem>

          <video id="dtzbx"></video><th id="dtzbx"><form id="dtzbx"><meter id="dtzbx"></meter></form></th>

            百度馬艷軍:深度學習開源框架建設前沿

            每日快訊
            2022
            05/13
            18:02
            分享
            評論

            百度馬艷軍:深度學習開源框架建設前沿

            深度學習框架被稱為“智能時代的操作系統”,是推動人工智能應用大規模落地的核心動力引擎。國家“十四五”規劃將深度學習框架列入“新一代人工智能”領域,作為前沿創新技術重點支持。近年來,國產深度學習開源框架迎來集中爆發,一眾優秀項目在產業實踐中站穩了腳跟。

            百度飛槳(PaddlePaddle)是國內首個自主研發、開源開放的產業級深度學習框架,并于去年全新發布了開源框架 2.2 版本。2022 年 4 月 29 日《極客有約》邀請到了百度 AI 技術生態總經理馬艷軍博士,同時也是 OpenI 啟智社區技術委員會委員,和大家一起暢聊開源深度學習框架建設的話題。馬艷軍總體負責產業級深度學習開源開放平臺飛槳的產品和技術研發及生態建設,主要研究方向包括自然語言處理、深度學習等,相關成果在百度產品中廣泛應用,并在 ACL 等權威會議、期刊發表論文 20 余篇,多次擔任頂級國際會議的 Area Chair。本期訪談中,馬艷軍主要圍繞飛槳平臺的技術和生態分享了自己在這一領域的經驗和觀點。

            如何看待深度學習框架

            深度學習框架非常類似于操作系統,是底層芯片指令集與上層應用之間的連接層,既要做好對底層 AI 芯片的適配、融合與優化,也要對上層應用提供數以千計的算法開發接口。它相當于人類身體的腰腹部位,是全身發力的核心支點。深度學習框架與操作系統的主要相似點還在于生態屬性。一系列軟硬件技術都要圍繞著框架緊密結合、共同發展,才能獲得良好的效果。

            在 AI 研究的早期,學術界發現很多深度學習算法可以拆分成眾多可復用的固定模塊,為了提升算法開發的效率,便開始研發深度學習框架。2015 年之后的幾年,AI 技術積累雄厚的科技企業陸續推出了 TensorFlow、PaddlePaddle、PyTorch 等框架。這些框架在產業界和科研界得到了廣泛應用,對很多應用場景都有極大的提升和推動作用。

            飛槳框架的創新

            PaddlePaddle 于 2016 年開源,是國內最早開源開放的深度學習框架,然后在 2019 年有了中文名“飛槳”。英文名稱 PaddlePaddle 來自于 PArallel Distributed Deep LEarning 的簡寫,而中文名飛槳則出自明朝朱熹的一首詩“聞說雙飛槳,翩然下廣津”,以飛槳命名也蘊含著快速發展的寓意。飛槳發源于百度公司內部的研發和業務訴求,在產業實踐中經過多年打磨,取得了突破性進展,并形成了比較成熟的開源生態。

            馬艷軍提到,各大主流深度學習框架走過的發展路線都是類似的,并且各家產品在技術上會相互借鑒、共同創新,因此會有很多相同相似的特性。與其它框架相比,飛槳最大的不同之處在于這款框架與產業應用有更緊密的結合,為生產環境做了很多細致的工作,不僅僅在算法層面開展優化,而且會專門進行框架層面的升級。以動靜統一為例,為了滿足企業場景中靈活調試和快速部署的需求,飛槳在業內最早提出動靜統一的設計并將之真正實現。所謂動靜統一,動的是靈活,靜的是高效率,既要有開發的靈活性,也要訓練部署的高效率。從本質上講,這也是打通了科研與企業兩大領域之間的聯系?;谏鲜龅讓蛹夹g架構的支撐,開發者可以很方便的將研發出來的學術算法直接應用到產業實踐中。這一設計在產業界接受度頗高,吸引了很多企業使用飛槳。類似這樣的底層框架創新還有很多,而且往往來源于企業開發者的實際業務。在這樣的良性循環中,飛槳框架逐漸走出了自己獨特的發展路線,形成了一種平臺化的深度學習開源開放生態。

            深度學習框架的應用場景

            作為更加貼近產業實踐的深度學習框架,飛槳在實際應用中非常適合各類型企業的使用。

            例如一些企業尚不具備一流的深度學習算法研發能力,在實踐中更偏向于采用業界成熟的算法,結合自己的數據和場景進行優化。針對這樣的需求,飛槳提供了一整套開發套件和工具組件,打通了典型 AI 應用開發的全流程。企業可以使用飛槳快速開發出適合自身場景的優化算法,更早在實踐中部署 AI 能力。

            還有一些企業雖然自身具備較好的研發能力,但在實踐中因為成本等因素,不愿意重復造輪子,也很適合使用飛槳獲得開箱即用的算法組合。

            另一類企業對算法的性能有很高的要求,希望獲得盡可能高的訓練和部署效率。這些企業可以使用飛槳獲得很好的性能,同時節省可觀的資源。

            除了企業用戶外,也有很多科研人員和學校師生在使用飛槳框架。過去兩年來,飛槳針對學術需求做了很多優化,尤其是如前所述實現了動靜統一后,開發調試大大簡化,提升了科研人員的使用體驗,所以最近飛槳的科研用戶比例有了不小的提升。

            在科研場景中,飛槳的用戶主要分為兩大類。其中一大類是做人工智能相關的研究,主要關注深度學習算法的開發和改進。這類需求對深度學習框架的靈活性與可擴展性有極高的要求,需要框架能夠非常靈活地定制算子,盡量通過 Python 層就實現高度定制化的功能特性。另一大類則是科學計算需求,需要深度學習框架為物理、化學、生物等科學領域的研究提供對應的能力和優化。這一類需求同樣對框架的靈活性和可擴展性有很高的挑戰。因此飛槳在過去兩年中不斷在這兩大指標上極致優化,希望能同時充分滿足企業與科研用戶的多樣化需求。

            馬艷軍提到,與操作系統相比,深度學習框架其實是更接近用戶的。因為人工智能算法本身就是和應用非常貼近的,并且深度學習應用的整個流程,包括數據準備、模型開發、訓練和部署都是業務場景中需要完成的。因此業務場景中的用戶同樣需要與深度學習框架進行大量交互,很多時候用戶本身也會參與到社區生態的開發工作中來,這種互動是在操作系統領域很難看到的。

            如何做好生態建設

            人工智能生態有一些獨有的特性,導致生態本身會有相當程度的復雜性。首先,人工智能有很強的賦能屬性,在賦能千行百業的時候,需要與行業場景深入融合才能發揮更大的作用。與眾多行業結合為產業賦能的過程中,人工智能生態自然就要與這些行業充分互動,復雜性也會大大提升。

            例如很多中小企業需要充分借力開源開放平臺實現更多跟場景結合的方案,進而服務大型企業,一定程度上起到毛細血管的作用;使用 AI 技術的頭部企業會面臨很多本行業的復雜問題,需要上述中小企業從專業角度幫助提供 AI 解決方案。再如,很多高校學生在學習階段就會開始使用人工智能生態中的各種工具,從而生態也要適應他們的很多需求。

            從開源社區的角度來看,像 OpenI 啟智這樣的社區中會有很多人工智能相關的項目,這些項目環環相扣形成網絡效應,互相協作,共同提升,最終形成繁榮的社區發展面貌。如果社區中的項目不能形成這樣的緊密聯系,那么就很難形成網絡效應,在互相促進中加速發展。

            如上所述,深度學習框架生態在發展的過程中就要同時考慮中小企業、頭部企業和高校學術界的方方面面需求,同時還要考慮到為不同的開源項目提供溝通融合的管道。飛槳在多年的發展過程中就針對這樣的需求做了很多工作,在這個過程中不斷起到“連接”各個角色的作用,例如與高校教師合作了很多項目,或者在開源社區中培育很多項目等等。這些項目為生態注入了源源不斷的創新活力,使社區能夠持續推陳出新。與此同時,包括媒體人、布道師等角色也在飛槳生態中發揮著各自的作用,大家共同努力,打造出了一個欣欣向榮的人工智能開源生態。

            在運營這樣一個生態的過程中,成功的關鍵要素就是要做好“連接”的工作,與生態共創、共享,讓生態伙伴都能從中受益。例如飛槳會與芯片廠商合作開發面向特定場景的軟硬一體解決方案,基于硬件開發很多模型庫算法,從而打通了硬件廠商與算法開發人員之間的溝通渠道。通過這種以具體項目為依托的形式,飛槳生態中的交流效率得到了顯著提升,也讓更多生態參與者能夠長期留在社區中參與貢獻并共享成果。

            這樣的生態體系就像一片生機勃勃的“熱帶雨林”,可以為許許多多的開發者提供豐富的資源。各種類型、各種背景、研究各種能力和模型的開發者都可以在這個生態中找到自己的用武之地,這也是飛槳生態最吸引人的魅力所在。

            深度學習框架的未來展望

            談到深度學習框架的未來發展這個話題,馬艷軍也有自己的一些看法。首先人工智能技術本身還有很大的發展空間,當下出現了很多不同類型的技術互相融合的趨勢,例如框架與芯片的融合、跨模態技術的融合、技術與行業場景的融合等等。這樣的融合過程中就會出現很多技術創新。

            另一方面,隨著人工智能在各個行業中展現出可觀的應用價值,相關技術需要進一步降低門檻,以便推動更多組織在實踐中有效利用人工智能。行業需要包括深度學習框架在內的更多低門檻的工具來吸引更多用戶來發揮聰明才智,讓不同類型的開發者都能充分利用人工智能的能力。

            飛槳平臺開源的幾年來,有很多開發者進入這個生態做出了自己的貢獻。就是這些貢獻幫助飛槳逐漸打磨出了很好的使用體驗。飛槳也非常珍惜和感謝他們的努力與支持。未來,人工智能框架還有很長的路要走,馬艷軍也希望更多開發者能夠與飛槳共同在開源社區成長,見證飛槳和社區共同發展邁向新的臺階。

            在本期節目中,馬艷軍也向觀眾推薦了幾本好書。首先是飛槳官方出的《零基礎實踐深度學習》,其中有很多動手實操內容,非常適合入門學習。飛槳也同包括北航的劉祥龍老師在內的多位老師合作編寫了多本著作,都很適合開發人員動手實踐,快速上手深度學習,歡迎感興趣的讀者搜索查找。

            最后也預告一下,大家可以關注即將于 5 月 20 日線上舉辦的WAVE SUMMIT 2022深度學習開發者峰會,飛槳最新的技術、產品、生態進展都會在這個峰會上發布。

            THE END
            廣告、內容合作請點擊這里 尋求合作
            免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

            相關熱點

            相關推薦

            1
            3
            午夜理理伦电影A片无码| 狼人无码精华AV午夜精品| 18禁美女黄网站色大片免费看下| 国产AV人人夜夜澡人人爽| 成人区人妻精品一区二区不卡| 出差我被公高潮A片久久| 久久久无码精品亚洲日韩京东传媒| 中文WWW新版资源在线下载| 翁熄性放纵好紧46章| 国产乱人伦精品一区二区| 无码人妻AⅤ一区二区三区| JY灌溉系统NPC| 一个人的视频WWW片免费|