悔悟個屁。。
我TM又開始玩亞索了,真是賤的
說一下要乾的事情,縷一下思路吧
——————————————————————————
強化學習之前已經看的差不多了,我覺得可以找個開源的代碼研究一下
然後就開始寫代碼了
論文需要修改,按照老師的要求
代碼還有兩個要跑
t一直有問題,出在結果不正常,debug效果不好,但是現在實驗室服務器開了,我決定在實驗室搞【問題應該是解決了,必須要從forward裡return,所以大小除以4即可】
f跑到很慢,直接用實驗室的跑,應該就不慢了
sampler我換掉了,所以需要修改代碼
network也改了
先從代碼開始改吧
————————————————————————————
被蠢逼隊友連坑2把,想到又一天沒學習了,怒刪遊戲
凌晨1點了,不想睡覺,懷著怒氣開始學習,寫代碼的速度都變快了
玩亞索還能提高打字速度,驚了
管他呢,老子乾正事去了,幹嘛浪費生命帶那些蠢貨上分呢?————————————————————————————
TODO:
1. co跑出來效果比m差,這不太合理,我覺得需要重新跑co
2. f在實驗室跑一下看看速度【順利,但是報了一個以前已經見過的錯誤,已經修改了】
3.修改論文的abstract、intro、以及cauchy的介紹
4.強化學習代碼閱讀【代碼能夠順利跑起來,但是還仔細研究】
5.我確實要確定好,如何設計我的state,以及編寫好交互環境,還需要確定,我到底是做模擬實驗還是真實的實驗,可以先從的模擬的做起,站點地點信息我應該都有了,隨便生成一些站點,以及用戶,應該還是容易的。另外我覺得沒必要用什麽芝加哥的數據了,直接用紐約的,這樣我不需要重新跑舊的代碼,直接拿那個結果作為baseline就能對比了,但是生成方式,我需要確認一下,大致上我都還記得,能夠重新寫出來。
——————————————————————————