強化學習

OpenAI試圖訓練AI代理玩捉迷藏遊戲，但他們對所學知識感到震驚

OpenAI在一個簡單的“捉迷藏”遊戲中訓練了代理，並在此過程中學習了許多其他技能。

本文匯總了深度學習相關的重要知識點，通過長圖和 PDF 的方式呈現給大家，歡迎各位 PM 下載。

本文就是面向所有人的機器學習科普大全，涉及所有機器學習相關的關鍵知識點。

本文展示了DP可以為一些簡單但經典的控制問題帶來什麼，我們通常會使用強化學習（RL）。基於DP的模型不僅學習了比RL更有效的控制策略，而且還能更快地訓練數量級。

強化是一類機器學習，其中代理通過執行動作來學習如何在環境中行為，從而繪製直覺並查看結果。在本文中，您將學習如何理解和設計強化學習問題並在Python中解決

如果您是公司的決策者，我希望這篇文章足以說服您重新思考您的業務，看看是否可以使用強化學習

與其他領域相比，機器學習/人工智能現在似乎有更高頻率的超級有趣的發展。

對於大腦的工作原理，我們知之甚少，但是我們知道大腦能通過反覆嘗試來學習知識。我們做出合適選擇時會得到獎勵，做出不切當選擇時會受到懲罰，這也是我們來適應環境的方式。如今，我們可以利用強大的計算能力，在軟件中對這個具體過程進行建模，這就是強化學習。

Facebook的人工智能研究機構FAIR剛剛開源並公開發表的聊天機器人就開始擁有了跟人類進行協商談判、進行討價還價的能力。通過監督學習+強化學習，這個聊天機器人不僅能理解字詞和語義的對應關係，還能針對自己的目標制定策略，跟別人進行協商討論達成一致。

在這篇文章中，我們將幫助你更好的理解監督學習、非監督學習和強化學習的定義的內涵，並從更廣闊的視角中闡述它們與機器學習之間的聯繫。深入理解它們的內涵不僅有助於你在這一領域的文獻中盡情的徜徉，更能引導你敏銳地捕捉到AI領域的發展和技術進步的氣息。