機(jī)器的心臟和功能。 ArXiv每周廣播電臺(tái) :杜威,儲(chǔ)航和羅若坦本周的重要論文包括Deepmind,哈佛大學(xué)和其他機(jī)構(gòu)創(chuàng)建的3D模擬鼠標(biāo)來(lái)探索神經(jīng)網(wǎng)絡(luò),以及伯克利的數(shù)
機(jī)器的心臟和功能。 ArXiv每周廣播電臺(tái)
:杜威,儲(chǔ)航和羅若坦本周的重要論文包括Deepmind,哈佛大學(xué)和其他機(jī)構(gòu)創(chuàng)建的3D模擬鼠標(biāo)來(lái)探索神經(jīng)網(wǎng)絡(luò),以及伯克利的數(shù)據(jù)增強(qiáng)強(qiáng)化學(xué)習(xí)方法以在多種環(huán)境下獲得SOTA結(jié)果。 本周重要論文Deepmind中的與哈佛大學(xué)和其他機(jī)構(gòu)一起創(chuàng)建了3D模擬鼠標(biāo)來(lái)探索神經(jīng)網(wǎng)絡(luò),伯克利的數(shù)據(jù)增強(qiáng)強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn)了在多種環(huán)境下的SOTA結(jié)果。
目錄:
論文1:虛擬嚙齒動(dòng)物的深層神經(jīng)行為學(xué)作者:Josh merel,Diego aldarondo,Bence olveczky等論文鏈接:https://openreview.net/pdf? Id = syxrxrxr4kps摘要:人工神經(jīng)網(wǎng)絡(luò)是目前最先進(jìn)的人工智能。 它是一種由多層神經(jīng)元互連組件組成的機(jī)器學(xué)習(xí)算法,“神經(jīng)元”首先受到大腦結(jié)構(gòu)的啟發(fā)。 盡管人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元肯定無(wú)法在真實(shí)的人腦中發(fā)揮作用,但越來(lái)越多的研究人員認(rèn)為,將兩者一起研究不僅可以幫助我們理解神經(jīng)科學(xué),而且可以幫助構(gòu)建更智能的AI。
deepmind和哈佛大學(xué)的研究人員探索了這個(gè)想法。 第一個(gè)模擬考試是鼠標(biāo)3D模型,可以在模擬環(huán)境中通過(guò)神經(jīng)網(wǎng)絡(luò)進(jìn)行控制。 同時(shí),他們使用神經(jīng)科學(xué)技術(shù)來(lái)分析小鼠的大腦生物學(xué)活性,從而了解神經(jīng)網(wǎng)絡(luò)如何控制小鼠的行為。
虛擬鼠標(biāo)的構(gòu)造過(guò)程。
展開(kāi)虛擬小鼠的全文,以執(zhí)行以下四個(gè)任務(wù):跳過(guò)間隙,在迷宮中尋找食物,從山上逃脫以及在前爪中準(zhǔn)確地?fù)羟颉?
虛擬小鼠的行為分析。
建議:該論文已被ICLR 2020會(huì)議接受為焦點(diǎn)論文。
論文2:極端模型壓縮的量化噪聲訓(xùn)練
作者:Angela Fan,Pierre stock,Armand joulin和其他論文鏈接:https://arxiv.org/pdf/2004.07320.pdf摘要:修剪和蒸餾是兩種常見(jiàn)的方法 在模型壓縮中使用了一些方法,這些方法可以通過(guò)減少網(wǎng)絡(luò)權(quán)重的數(shù)量來(lái)減少參數(shù)。 另一種方法是“量化”。 不同之處在于,它通過(guò)減少每權(quán)重的位數(shù)來(lái)壓縮原始網(wǎng)絡(luò)。 流行的后處理量化方法(例如標(biāo)量量化)使訓(xùn)練網(wǎng)絡(luò)的浮點(diǎn)權(quán)重由低精度表示形式(例如固定寬度整數(shù))表示。 這些后處理量化方法的優(yōu)點(diǎn)是壓縮效率非常高,并且可以加速對(duì)硬件推理的支持。 但是缺點(diǎn)是,由這些近似值引起的誤差會(huì)在前向傳播的計(jì)算過(guò)程中累積,從而導(dǎo)致性能顯著下降。 現(xiàn)在,來(lái)自Facebook的研究人員提出了
的新模型,即量化噪聲量化量化技術(shù),該技術(shù)可以將模型壓縮到極限,同時(shí)在實(shí)際應(yīng)用程序部署中保持高性能。 在這項(xiàng)研究中,研究人員提出了一種僅量化權(quán)重子集而不是整個(gè)網(wǎng)絡(luò)的壓縮方案。 在每個(gè)前向傳播中,僅對(duì)網(wǎng)絡(luò)的隨機(jī)部分進(jìn)行量化,并且大多數(shù)權(quán)重將通過(guò)無(wú)偏梯度進(jìn)行更新。
使用/不使用量化噪聲訓(xùn)練的兩種情況。 研究人員在訓(xùn)練過(guò)程中將量化噪聲應(yīng)用于權(quán)重子集,從而提高了量化模型的性能。 在不使用量化噪聲訓(xùn)練,使用量化噪聲微調(diào)和使用量化噪聲訓(xùn)練的三種不同設(shè)置下,自適應(yīng)輸入體系結(jié)構(gòu)的混亂和Roberta精度的變化。 可以看出,直接使用量化噪聲訓(xùn)練可以實(shí)現(xiàn)最低的混亂度和最高的準(zhǔn)確性。
建議:此方法可以在訓(xùn)練過(guò)程中使用更簡(jiǎn)單的量化方案,這對(duì)于具有可訓(xùn)練參數(shù)的量化模塊(例如乘積量化器(PQ)算法)非常有用。
論文3:長(zhǎng)期關(guān)注短距離的Lite變壓器
作者:張武,劉志堅(jiān),宋嵩論文鏈接:https://arxiv.org/pdf/2004.11886v1.pdf摘要:盡管發(fā)布不到3年前, 變壓器已成為自然語(yǔ)言處理(NLP)領(lǐng)域不可或缺的一部分。 然而,這種流行的算法需要非常高的計(jì)算能力來(lái)實(shí)現(xiàn)足夠的性能,這對(duì)于受計(jì)算能力和電池嚴(yán)格限制的移動(dòng)終端是不夠的。 麻省理工學(xué)院和上海交通大學(xué)的研究人員提出了一種高效的移動(dòng)NLP架構(gòu)Lite轉(zhuǎn)換器,這是在邊緣設(shè)備上部署移動(dòng)NLP應(yīng)用程序的一大進(jìn)步。 這項(xiàng)研究由麻省理工學(xué)院電氣工程與計(jì)算機(jī)科學(xué)助理教授韓松領(lǐng)導(dǎo)。
lite變壓器體系結(jié)構(gòu)(a)和注意權(quán)重的可視化,而傳統(tǒng)注意(b)過(guò)分強(qiáng)調(diào)了局部關(guān)系建模。建議:ICLR 2020已收到該論文。
文件4:長(zhǎng)尾識(shí)別的裝飾表示和分類器
作者:康秉義,謝賽寧,Yannis kalandidis等論文鏈接:https://openreview.net/ pdf? Id = r1grtcvfvb摘要:根據(jù)長(zhǎng)尾巴分布的圖像識(shí)別任務(wù),當(dāng)前的研究和實(shí)踐提出了損失重加權(quán),數(shù)據(jù)集重采樣,對(duì)尾部少量樣本進(jìn)行過(guò)采樣等幾種解決方案。 ,過(guò)多的樣本采樣或遷移學(xué)習(xí)。 新加坡國(guó)立大學(xué)和Facebook AI的研究人員提出了一種新穎的解決方案:在學(xué)習(xí)分類任務(wù)的過(guò)程中,他們通常將分類特征表示(通常默認(rèn)是從分類器中聯(lián)合學(xué)習(xí))解耦,并尋求適當(dāng)?shù)谋硎疽宰畲蟪潭鹊販p少分類器的負(fù)面影響。 長(zhǎng)尾樣本分類。
本研究系統(tǒng)地探討了不同樣本均衡策略對(duì)長(zhǎng)尾數(shù)據(jù)分類的影響,并進(jìn)行了詳細(xì)的實(shí)驗(yàn)。 結(jié)果表明:a)在學(xué)習(xí)高質(zhì)量類別表示時(shí),數(shù)據(jù)不平衡可能不會(huì)成為問(wèn)題; b)在學(xué)習(xí)了上述表示之后,即使應(yīng)用了最簡(jiǎn)單的樣本均衡采樣方法,也可能僅通過(guò)調(diào)整分類器就可以學(xué)習(xí)非常魯棒的長(zhǎng)尾樣本分類模型。 在這項(xiàng)研究中,表示學(xué)習(xí)和分類器學(xué)習(xí)分別被分離和擴(kuò)展。
這項(xiàng)研究在多個(gè)開(kāi)放的長(zhǎng)尾巴分類數(shù)據(jù)集上修改了頭類別和尾類別的決策邊界,并使用不同的采樣策略進(jìn)行了交叉訓(xùn)練實(shí)驗(yàn)。 以上是不同分類器之間的比較結(jié)果。
到位LT,Imagenet LT和inanaturalist2018這三個(gè)開(kāi)放標(biāo)準(zhǔn)數(shù)據(jù)集,該研究提出的策略也實(shí)現(xiàn)了比去年同期更高的分類準(zhǔn)確性,并取得了新的SOTA結(jié)果。
建議:分別通過(guò)表示學(xué)習(xí)和分類器學(xué)習(xí)找到合適的表示,以最大程度地減少長(zhǎng)尾樣本分類的負(fù)面影響,這為長(zhǎng)尾分類提供了新思路。 該論文已被ICLR 2020接收。
論文5:貝葉斯深度學(xué)習(xí)和概率概化
作者:Andrew Gordon Wilson,Pavel izmailov論文鏈接:https://arxiv.org/pdf/2002.08791.pdf摘要 :貝葉斯方法的主要區(qū)別特征是邊緣化,而不是使用單個(gè)設(shè)置權(quán)重。 特別地,貝葉斯邊緣化可以提高現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性和校準(zhǔn)。 本文中,來(lái)自紐約大學(xué)的兩名研究人員表示,深度整合可以為近似貝葉斯邊緣化提供有效的機(jī)制,他們提出的方法通過(guò)在成本較低的情況下在吸引盆地中邊緣化來(lái)進(jìn)一步改善預(yù)測(cè)分布。 此外,研究人員還研究了模糊分布對(duì)神經(jīng)網(wǎng)絡(luò)權(quán)重所隱含的先驗(yàn)功能,并從概率的角度解釋了此類模型的泛化性能。 從這一觀點(diǎn)出發(fā),研究人員解釋了神經(jīng)網(wǎng)絡(luò)泛化的神秘而獨(dú)特的結(jié)果,例如使用隨機(jī)標(biāo)簽擬合圖像的能力,并表明這些結(jié)果可以通過(guò)高斯過(guò)程再現(xiàn)。 此外,他們還表明,貝葉斯模型通?梢詼p少兩次下降,從而可以提高單調(diào)性能和靈活性。 最后,從貝葉斯的角度解釋了PDC的回火問(wèn)題。 從
概率的角度概括。
類似于真實(shí)預(yù)測(cè)分布。
的貝葉斯模型可以減輕平均的雙下降。
建議:本文的第一版于2020年2月提交,這是第二版的修訂版。 該論文已被ICML 2020接收。
論文6:makeittalk:說(shuō)話者感知的講話頭動(dòng)畫
作者:Yang Yang,Dingzeyu Li,Jose Echevarria和其他論文鏈接:https://arxiv.org/pdf/2004.12992v1.pdf摘要:今天我們開(kāi)始研究adobe,提出了一種名為makeittalk的新模型,該模型不僅可以使真實(shí)的人頭說(shuō)話,而且可以使卡通,油畫,素描和人像在白天動(dòng)態(tài)變化。 這項(xiàng)研究提出了一種新方法,該方法可以基于單個(gè)面部圖像和語(yǔ)音生成令人驚嘆的語(yǔ)音狀態(tài)頭部動(dòng)畫。 先前的方法通常學(xué)習(xí)音頻和原始像素之間的直接映射以創(chuàng)建揚(yáng)聲器的臉部,并且該方法將輸入音頻信號(hào)的內(nèi)容與揚(yáng)聲器的信息分開(kāi)。 音頻內(nèi)容穩(wěn)定地控制嘴唇和周圍臉部區(qū)域的運(yùn)動(dòng),而說(shuō)話者信息確定面部表情和說(shuō)話者頭部運(yùn)動(dòng)的細(xì)節(jié)。
此方法的另一個(gè)重要組成部分是預(yù)測(cè)可以反映說(shuō)話者動(dòng)態(tài)的面部特征點(diǎn)。 基于中間表示,該方法可以合成說(shuō)話者面部的全動(dòng)態(tài)逼真的視頻。 這種方法還可以將藝術(shù)品,草圖,2D卡通人物,Riman和Doodle轉(zhuǎn)換成可以說(shuō)話的動(dòng)態(tài)視頻。 本研究中的makeittalk方法的
管道。
預(yù)測(cè)卡通圖像和動(dòng)畫以及真實(shí)面孔動(dòng)畫。 Makeittalk不僅可以合成面部表情,還可以合成不同的頭部姿勢(shì)。 將
的效果與當(dāng)前SOTA方法的效果進(jìn)行了比較。
建議:通過(guò)對(duì)該方法的定量和定性評(píng)估,結(jié)果表明,與以前的SOTA方法相比,該方法可以生成更高質(zhì)量的語(yǔ)音狀態(tài)頭部動(dòng)畫。
論文7:使用增強(qiáng)數(shù)據(jù)進(jìn)行增強(qiáng)學(xué)習(xí)
作者:Michael Laskin,kimin Lee,Aravind Srinivas和其他論文鏈接:https://arxiv.org/pdf/2004.14990.pdf摘要:本文來(lái)自于美國(guó)大學(xué)的研究人員 加利福尼亞州伯克利市提議對(duì)增強(qiáng)數(shù)據(jù)(縮寫為RAD)使用增強(qiáng)學(xué)習(xí),這可以增強(qiáng)任何RL算法
美國(guó)國(guó)家航空航天局已發(fā)出近10億 Dell的新款Precision 7000系列移 蘇寧中華第一店的“倒退”顯示出 Microsoft Surface go 2已通過(guò)En 如何連接裝修工人的訂單接收平臺(tái) 這21個(gè)應(yīng)用程序是非法的! 您可 YouTube每分鐘產(chǎn)生32000美元的廣 頻頻挖角高管抱怨午夜,魅族的應(yīng) 當(dāng)場(chǎng)推翻原版! AI不承認(rèn)上帝, 數(shù)字基礎(chǔ)共享視頻介紹了VRS可變 北通云企業(yè)照明站,3分鐘發(fā)布一 100智能大廈 新聞:2020年13英寸Macbook Pro 閱讀對(duì)最近查詢的回應(yīng):全面推動(dòng) 餐飲業(yè)的創(chuàng)新,變革和利潤(rùn)保證 國(guó)家緊急響應(yīng)為2級(jí)或以下; 特斯 巴菲特:尚未找到感興趣的公司 Apple的新消息專利:重新編輯發(fā) 沒(méi)有贏得原始的跑步成績(jī),并且沒(méi) 長(zhǎng)鑫家用DDR4內(nèi)存芯片/顆粒處理 在原始的win10中搜索其他瀏覽器 巴菲特的Alpha:使用機(jī)器學(xué)習(xí)量 圖片預(yù)覽界面中的新增長(zhǎng)焦點(diǎn)圖片 巴菲特:麝香做得很棒,但不會(huì)投 閱讀:作家座談會(huì)于5月6日啟動(dòng), 原始IOS 13.5 beta 3帶來(lái)了有關(guān) 中國(guó)人民銀行:恢復(fù)生產(chǎn)的狀況正 原裝國(guó)內(nèi)最差的手機(jī)系統(tǒng):華為的 比亞迪與華為合作! 趙長(zhǎng)江:特 經(jīng)典gal“ MUV luv”將發(fā)布在Ste