谷歌AI最新博文:視頻模型中的模擬策略學習【馬哥教育新聞快報387期】
各位小伙伴下午好,今天是2019年3月27日,這里是馬哥教育新聞快報387期。
本期重點關注: 谷歌AI最新博文:視頻模型中的模擬策略學習
1、谷歌AI最新博文:視頻模型中的模擬策略學習
深度強化學習(RL)技術可用于從視覺輸入中學習復雜任務的策略,并已成功應用于經典的 Atari2600 游戲中。最近在這一領域的研究表明,即使在像 Montezuma's Revenge 這樣的游戲所展示的具有挑戰性的探索機制中,它也可能獲得超人的表現。然而,目前許多最先進方法的局限之一是,它們需要與游戲環境進行大量的交互,且這些交互通常比人類去學習如何玩得好要多得多。
近日,谷歌 AI 發布了一篇博文,討論了他們的視頻模型中的模擬策略學習模型,雷鋒網(公眾號:雷鋒網) AI 科技評論編譯整理如下。
解釋為什么人們能更有效地學習這些任務的一個假設是,他們能夠預測自己行動的效果,從而含蓄地學習一個模型,其行動順序將導致理想的結果。其一般思想是,建立所謂的博弈模型并用它學習一個選擇行為的良好策略,這是基于模型的強化學習(MBRL)的主要前提。
在「基于模型的 Atari 強化學習」中,我們引入了模擬策略學習(SimPLe)算法,這是一個 MBRL 框架,用于訓練 Atari 游戲機的代理,其效率顯著高于當前最先進的技術,只需要使用與游戲環境的約 100K 交互(相當于真人 2 小時的游戲時間)就能顯示出有競爭力的結果。此外,我們已經將相關代碼作為 Tensor2Tensor 開源代碼庫的一部分進行了開源。這個版本包含了一個預訓練的 world 模型,可以用一個簡單的命令行運行,也可以使用類似于 Atari 的界面來播放。
2、 百度大腦,“上新了”!
前不久,百度大腦推出了包括語音技術、視覺技術、自然語言處理、知識圖譜等在內的通用 AI 能力,以及開源深度學習框架方面的優化升級。與此同時,人工智能已經連續三年進入政府報告、“智能+”成為 2019 年行業的新命題。
雷鋒網了解到,百度大腦自 2016 年啟動開放以來,目前已經是服務規模最大的 AI 開放平臺。共計開放了 158 項 AI 能力,24 小時快速集成,開發者數量超過 100 萬。面向廣泛的企業和開發者提供最先進、最全面的 AI 能力,不斷降低 AI 應用落地的門檻。
語音方面
在今年 1 月的百度輸入法探索版發布會上,首次發布了領先國際的語音技術:在線語音領域全球首創的流式多級截斷注意力模型 SMLT「Streaming trancated multi-layer attention」。值得注意的是,這是首次在大規模語音識別工業界采用注意力(attention)模型。
提升識別率的同時大幅優化了解碼速度。“語音識別極速版”,擁有更快的響應速度,相對識別準確度提升 15%。此項語音能力在 API 調用方式下,實時率小于 0.1,意味著 5s 的音頻不到 500ms 即可完成識別過程,減少了識別音頻所需的耗時,提升語音交互的響應體驗。
3、 歐盟版權改革 版權方與谷歌等巨頭有喜有憂
歐洲立法者批準了一項有爭議的版權立法的初步協議,該協議可能對谷歌和 Facebook 等科技巨頭的商業模式產生深遠影響。
該法案旨在將歐盟的版權規則帶入 21 世紀,以幫助那些作品在互聯網上廣泛傳播的藝術家和出版商。
歐洲議會于周二在法國斯特拉斯堡通過了新版權指令的初步文本。但這仍然需要得到歐洲委員會部長們的批準。該委員會機構根據職責和角色將歐盟中的不同部長聚集在一起。
這項改革計劃,自 2016 年以來就一直在醞釀。該計劃使得包括 Facebook、Twitter 和谷歌在內的大型科技公司與藝術家和媒體公司展開了激烈的競爭。
谷歌的回應
據外媒報道,歐洲議會投票后,谷歌表示,周二通過的版本是對原有法律的改進。但谷歌還補充說,這仍將導致法律不確定性,并損害創意產業。
該法案中的一項條款可能導致(監管方)實施預過濾系統,阻止互聯網用戶分享包含受版權保護材料的潮流語、表情包和其他內容。
版權改革的另一部分將要求像谷歌這樣的新聞聚合服務平臺與出版商協商商業許可,以便發布文章的片段或鏈接。
在技術公司一方,谷歌和多位知名人士,如互聯網先驅蒂姆·伯納斯·李、維基百科創始人吉米·威爾士,都對新的歐盟版權指令表示不滿。在媒體一方,像前披頭士樂隊成員保羅·麥卡特尼和歌手黛比·哈里等知名藝術家都表示支持。
4、 Spotify今日宣布將收購洛杉磯播客工作室Parcast
Spotify 今天表示,將收購 Parcast,這是該公司在兩個月內收購的第三家播客公司,該公司正在努力轉型為音頻領域的奈飛。
Spotify 沒有透露交易條款,但早些時候表示,公司已在 2019 年撥出高達 5 億美元用于收購。
Parcast 成立于 2016 年,專注于“犯罪”和“神秘”主題的音頻內容。該公司推出了 18 個高級播客系列,包括“連環殺手”(Serial Killers)、“懸案謀殺”(Unsolved Murders)等主題內容。
今年 2 月,全球最受歡迎的音樂流媒體服務平臺 Spotify 同意收購播客生產商 Gimlet Media 和播客服務公司 Anchor。
【快報內容】
【今日學習必備】
【Linux面試真題】- 當用戶在瀏覽器當中輸入一個網站,說說計算機對dns解釋經過那些流程?注:本機跟本地dns還沒有緩存。
答:
a.用戶輸入網址到瀏覽器;
b.瀏覽器發出DNS請求信息;
c.計算機首先查詢本機HOST文件,看是否存在,存在直接返回結果,不存在,繼續下一步;
d.計算機按照本地DNS的順序,向合法dns服務器查詢IP結果;
e.合法dns返回dns結果給本地dns,本地dns并緩存本結果,直到TTL過期,才再次查詢此結果;
f.返回IP結果給瀏覽器;
【Python面試真題】- 簡單談下GIL -Global Interpreter Lock(全局解釋器鎖)
Python代碼的執行由Python 虛擬機(也叫解釋器主循環,CPython版本)來控制,Python 在設計之初就考慮到要在解釋器的主循環中,同時只有一個線程在執行,即在任意時刻,只有一個線程在解釋器中運行。對Python 虛擬機的訪問由全局解釋器鎖(GIL)來控制,正是這個鎖能保證同一時刻只有一個線程在運行。
>【就業喜訊】
【學員喜訊-798期】- 從建筑工程到Linux運維工程師,馬哥教育助力學員成功轉行 !
【近期開班】
Linux面授班:2019年4月29日(北京)
Linux網絡班:2019年5月4日(網絡)
Python面授班:2019年6月24日(北京)
Python網絡班:2019年3月30日(網絡)