強化學(xué)習(xí)的進展速度遠(yuǎn)遠(yuǎn)低于深度學(xué)習(xí)。 雖然OpenAI Five和谷歌的AlphaGo等有值得注意的新聞突破辞友,但實際情況下的強化學(xué)習(xí)實踐并未發(fā)生栅哀。
正如谷歌AI的團隊在這篇博文中提到的那樣震肮,開發(fā)這類算法需要大量的實驗而沒有任何明確的方向。 不幸的是留拾,大多數(shù)現(xiàn)有的框架都沒有這種靈活性戳晌。 如果你在這個領(lǐng)域工作或研究過,你就知道重現(xiàn)現(xiàn)有方法有多困難(如果不是不可能的話)痴柔。
因此沦偎,為了幫助加速研究,并希望讓社區(qū)更多地參與強化學(xué)習(xí)咳蔚,Google AI團隊開放了一個名為Dopamine的TensorFlow框架豪嚎,旨在通過使其更靈活和可重復(fù)性來創(chuàng)建研究。 根據(jù)團隊的官方文檔谈火,他們的設(shè)計原則是:
簡單的實驗:幫助新用戶運行基準(zhǔn)實驗
靈活的開發(fā):為新用戶提供新的創(chuàng)新想法
緊湊和可靠:為一些較舊和更流行的算法提供實現(xiàn)
可重復(fù):確保結(jié)果可重復(fù)
意識到新人們根據(jù)基準(zhǔn)檢查結(jié)果的重要性侈询,研究人員還發(fā)布了整個培訓(xùn)數(shù)據(jù)。 它可用作Python pickle文件糯耍,JSON文件和用戶可以可視化每個訓(xùn)練迭代的網(wǎng)站扔字。
我們對此有所了解
請注意,DeepMind對多巴胺的研究與Google AI的這項工作無關(guān)温技。 雖然兩者都在很大程度上植根于強化學(xué)習(xí)革为,但Google AI通過公開采購的方式參與了整個社區(qū)。 它肯定有助于它以TensorFlow為基礎(chǔ)荒揣,這是深度學(xué)習(xí)社區(qū)中每個人都熟悉的框架篷角。
強化學(xué)習(xí)可能是一個令人生畏的主題焊刹,但我鼓勵大家嘗試一下系任。 這個領(lǐng)域仍然具有潛力,并將在未來幾年取得很大進展虐块。 這是一個很好的入門資源俩滥,您也可以參考我們的文章了解初學(xué)者。
如果你想更加了解TensorFlow贺奠,或者說想實踐一下人工智能項目霜旧,谷歌的另一款工具或許可以幫到你,也就是谷歌的AIY Projects 項目儡率。
在2017 年上半年挂据,谷歌宣布了一個新的開源計劃--AIY Projects(AIY計劃),其目標(biāo)是讓每個Maker(創(chuàng)客)都能DIY自己的 AI 人工智能產(chǎn)品儿普,讓更多人能學(xué)習(xí)崎逃、探索并體驗人工智能。AIY 全稱是 Artificial Intelligence Yourself眉孩,顧名思義就是利用 AI 來進行的 DIY 功能套件个绍。借助 AIY 項目勒葱,創(chuàng)客可以利用人工智能來實現(xiàn)更像人與人交流的人機交互。谷歌目前為 AIY Projects 推出了兩款硬件產(chǎn)品--AIY Voice Kit 和 AIY Vision Kit巴柿。
AIY Vision Kit(視覺套件)是一套簡單的計算機視覺系統(tǒng)凛虽,可運行 3 種基于 TensorFlow 的類神經(jīng)網(wǎng)路模型應(yīng)用程序。
這次 AIY 計劃推出兩款新品广恢,Edge TPU 是谷歌專用的 ASIC 芯片凯旋,專為在 Edge 運行 TensorFlow Lite ML 模型而設(shè)計, 用來處理 AI 預(yù)測部分。它的特點是比訓(xùn)練模型的計算強度要小钉迷。而且 Edge TPU 還可以自己運行計算瓦阐,不需要與多臺強大計算機相連,因此應(yīng)用程序可以更快篷牌、更可靠地工作睡蟋。它們可以在傳感器或網(wǎng)關(guān)設(shè)備中與標(biāo)準(zhǔn)芯片或微控制器共同處理 AI 工作。針對Edge TPU的新設(shè)備是:AIY Edge TPU Dev 開發(fā)板和 AIY Edge TPU 加速器枷颊,二者皆采用 Google 的 Edge TPU 芯片戳杀。