【年近三十，科技立業】第五十四章我覺得純扯！

繁简轉換
[繁]
[简]

選擇背景顏色

選擇字體大小
[特大]
[大]
[中]
[小]

[回報錯誤]

《年近三十，科技立業》第五十四章我覺得純扯！

　　“你們怎麽看?”

　　黃仁勳的話音剛落，就有一個聲音傳出來:“我覺得純扯！”

　　說話的是英偉達高級技術官，克裡斯·馬拉喬夫斯基，他接著這麽說道:“將小參數AI模型作為決策核心替代原本自由的神經網絡節點，在理論上就不可能行得通。”

　　“如果說原本的模型是一個線團，我們跑的很順，像這麽一搞，完全成了一團亂麻了！

　　“訓練效率不僅得不到提升，還造成了極大的困惱，就我目前的測試而言，百萬參數模型訓練時的損失已經高達70%。

　　“而且，模型越大，損失也越大。到GPT4的水準，能損失到只剩千分之一不到。

　　“換句話說，如果要用這種方式訓練GPT4，要消耗原本一千倍的算力資源！什麽狗屁的死思考模型?將一萬個小參數模型放一起，就類比人了?扯淡吧！”

　　克裡斯聽起來怨氣頗深，自從卷耳智能科技的一百二十多項專利申請披露以來，克裡斯這幾天那是沒有睡過一個好覺，別說類思維了，他感覺自己都快沒有思維了。

　　不過，他得出的結論跟黃仁勳的想法是不謀而合的。

　　“可是耳語……”但一提到耳語，他們又都沉默了。

　　因為耳語事實存在，效果他們都看到了，那麽就一定存在一個方案能夠做到。是選擇相信紀弘的一番亂扯，還是繼續無頭蒼蠅一般的亂撞，都不是一個好的選擇。

　　“還是要做！我們別無選擇不是嗎?”黃仁勳如此說道。

　　“我們只是硬件供應商，這些東西讓搞AI的頭疼去不行嗎?”克裡斯如此說道:

　　“你現在不是在中國嗎?是否考慮去見一見卷耳智能科技的創始人，論GPU，全世界沒有任何一家公司能比得上我們，這不是天然的合作者嗎?”

　　克裡斯是葡萄牙人，他不懂國人的思維，而黃仁勳是懂一些的，心裡也是不斷的搖頭，如果有可能，他早就去了。

　　但卷耳智能科技第一個找上摩爾科技的時候他就知道，英偉達肯定是沒戲的。倒不如指望OpenAI能夠知恥而後勇，趕緊趕上來。

　　“不過還是去見見吧，就算不成，也沒有什麽損失不是嗎?”黃仁勳尋思，來都來了，這裡離河州也不算太遠。

　　……

　　別說英偉達這種業內企業了，就算是八竿子打不著的網友們，這個夜晚也都選擇不眠。

　　時間已是深夜，科技圈還熱鬧的很，簡直就像過大年。

　　而“今年”的“春晚”只有一個主角，那就是類思維模型。

　　“一百多項專利我全都整理了，紀大在河州大學智算中心項目的啟動儀式上講的那番話，我也反覆琢磨過。

　　“據此，我設計了一套實施方案【從0開始訓練一套類思維大模型】，源程序上傳到Gitee碼雲上了，地址是:https:‖*****king。有興趣的可以下載下來一起試試，共同探討。”

　　“我試了，根本不行啊，這效率，還不如直接從0搭建GPT呢！”

　　“你廢話，專利文件肯定不可能給你披露細節的，這需要你一點點一點點的慢慢去試去調整，才能達到最佳。”

　　“能達到嗎?我怎麽覺得這就是個坑呢?我用數學模型做了一下評估，所有條件都考慮進去，看多少參數的小模型替代神經網絡節點，結果是多少你們知道嗎?答案是1。”

　　專業的IT社區都是業內人士，尤其是今天，CSDNBlog人工智能分區更是一群AI領域大佬的聚集地。

　　答案是1代表什麽意思，他們再明白不過了——那就是現有神經網絡模型的效率就是最高的，任何改變都只會影響效率，而不會提高效率。

　　“把你的計算過程貼出來，我們一起看看……”

　　“好！”這個人名為孫博，畢業於信息科技大學本科，國科大碩士、博士，現為科學院自動化所人工智能基礎前沿理論研究室研究員。

　　……

　　紀弘也在窺屏，他是CSDN的老用戶了，也經常會在裡面發一些東西，今天從河州大學回來以後，也是照例進來看了看。

　　正好就看到這群人在討論類思維模型的事兒，也就一直在盯著。

　　當孫博把所有的計算過程貼出來的時候，他也是第一時間就下載了下來。

　　計算過程極為複雜，涉及到微分、積分、線性代數、離散數學、最優化理論、信息論等一大堆學科的交叉。

　　如果不是最近能力一直在+0.1+0.1的不斷在提升著，這麽複雜的東西他都有可能看不懂。

　　“這人不簡單呐！”好久之後，紀弘才感歎著，不知道是哪位大佬，有沒有機會挖過來?

　　這麽想著，紀弘挑了一些純理論且不涉及機密的東西給他私信了過去:“我看博主水平非常高，對這個方向有興趣嗎?有機會可以聊聊。”

　　發過去之後，紀弘就沒再管他，又在窺屏了。

　　還別說，專業的論壇不太經常冒泡的還真有幾個大牛，今天趁著這個“團圓夜”全都出來了，紀弘就看到好幾個。

　　“看樣子確實是的，這個理論行不太通啊！”一位名為“人工智能雜談”的博主說話了:

　　“這樣我就放心了，我還以為卷耳智能科技是傻的，這麽機密的東西都敢往外放。原來是假的，那就對了！”

　　“也不盡然是假的，小模型肯定不行，但是如果能解決一個最優化理論的問題，用一個新的東西代替這位微模型，那……”

　　孫博對前沿理論的研究很深，總覺得類思維模型有點兒意思，而且跟自己思考的一個最優化理論問題有所牽連，說不定這就是他那個問題得到了解決的成功過。

　　不過，正敲著字兒呢，他突然反應過來，自己這不是在和同事探討問題，而是在玩技術論壇。

　　這是玩兒High了呀！這東西可不能往外發，也是急忙刪除了這段文字，並檢查了一番自己的電腦。

　　最後回道:“嗯，確實是假的，不過就算是假的，不試一試，你心裡不癢癢嗎?”

　　“還真是！不管真的假的，耳語系統已經事實存在了，怎麽來的?不試一試肯定不會甘心的，我先跑跑看，說不定效率雖然低，但是真實效果卻非常好呢?數學計算出來的結果不一定就絕對符合事實！”

　　“嘿嘿……”

　　紀弘笑著，這就是陽謀。

　　在自己並沒有其他思路的情況下，誰能不去試一試呢?哪怕明知道這是個坑！

　　相信英偉達啊、OpenAI啊，尤其是OpenAI肯定會試一試的——白白消耗他們一大批算力資源，不管是從哪兒挪來的，那也是好事兒一樁！

鍵盤左右鍵 ← → 可以切換章節