【如此便一生】研究生-幡然悔悟的第15天

繁简轉換
[繁]
[简]

選擇背景顏色

選擇字體大小
[特大]
[大]
[中]
[小]

[回報錯誤]

《如此便一生》研究生-幡然悔悟的第15天

　　悔悟個屁。。

　　我TM又開始玩亞索了，真是賤的

　　說一下要乾的事情，縷一下思路吧

　　——————————————————————————

　　強化學習之前已經看的差不多了，我覺得可以找個開源的代碼研究一下

　　然後就開始寫代碼了

　　論文需要修改，按照老師的要求

　　代碼還有兩個要跑

　　t一直有問題，出在結果不正常，debug效果不好，但是現在實驗室服務器開了，我決定在實驗室搞【問題應該是解決了，必須要從forward裡return，所以大小除以4即可】

　　f跑到很慢，直接用實驗室的跑，應該就不慢了

　　sampler我換掉了，所以需要修改代碼

　　network也改了

　　先從代碼開始改吧

　　————————————————————————————

　　被蠢逼隊友連坑2把，想到又一天沒學習了，怒刪遊戲

　　凌晨1點了，不想睡覺，懷著怒氣開始學習，寫代碼的速度都變快了

　　玩亞索還能提高打字速度，驚了

　　管他呢，老子乾正事去了，幹嘛浪費生命帶那些蠢貨上分呢?————————————————————————————

　　TODO:

　　1. co跑出來效果比m差，這不太合理，我覺得需要重新跑co

　　2. f在實驗室跑一下看看速度【順利，但是報了一個以前已經見過的錯誤，已經修改了】

　　3.修改論文的abstract、intro、以及cauchy的介紹

　　4.強化學習代碼閱讀【代碼能夠順利跑起來，但是還仔細研究】

　　5.我確實要確定好，如何設計我的state，以及編寫好交互環境，還需要確定，我到底是做模擬實驗還是真實的實驗，可以先從的模擬的做起，站點地點信息我應該都有了，隨便生成一些站點，以及用戶，應該還是容易的。另外我覺得沒必要用什麽芝加哥的數據了，直接用紐約的，這樣我不需要重新跑舊的代碼，直接拿那個結果作為baseline就能對比了，但是生成方式，我需要確認一下，大致上我都還記得，能夠重新寫出來。

　　——————————————————————————

鍵盤左右鍵 ← → 可以切換章節