還不登入嗎?
(-3-)是不是要下跪求你們?
趕快為了可愛的管理員登入喔。
登入可以得到收藏功能列表
還能夠讓我們知道你們有在支持狂人喔(*´∀`)~♥
《年近三十,科技立業》第五十四章 我覺得純扯!
  “你們怎麽看?”

  黃仁勳的話音剛落,就有一個聲音傳出來:“我覺得純扯!”

  說話的是英偉達高級技術官,克裡斯·馬拉喬夫斯基,他接著這麽說道:“將小參數AI模型作為決策核心替代原本自由的神經網絡節點,在理論上就不可能行得通。”

  “如果說原本的模型是一個線團,我們跑的很順,像這麽一搞,完全成了一團亂麻了!

  “訓練效率不僅得不到提升,還造成了極大的困惱,就我目前的測試而言,百萬參數模型訓練時的損失已經高達70%。

  “而且,模型越大,損失也越大。到GPT4的水準,能損失到只剩千分之一不到。

  “換句話說,如果要用這種方式訓練GPT4,要消耗原本一千倍的算力資源!什麽狗屁的死思考模型?將一萬個小參數模型放一起,就類比人了?扯淡吧!”

  克裡斯聽起來怨氣頗深,自從卷耳智能科技的一百二十多項專利申請披露以來,克裡斯這幾天那是沒有睡過一個好覺,別說類思維了,他感覺自己都快沒有思維了。

  不過,他得出的結論跟黃仁勳的想法是不謀而合的。

  “可是耳語……”但一提到耳語,他們又都沉默了。

  因為耳語事實存在,效果他們都看到了,那麽就一定存在一個方案能夠做到。是選擇相信紀弘的一番亂扯,還是繼續無頭蒼蠅一般的亂撞,都不是一個好的選擇。

  “還是要做!我們別無選擇不是嗎?”黃仁勳如此說道。

  “我們只是硬件供應商,這些東西讓搞AI的頭疼去不行嗎?”克裡斯如此說道:

  “你現在不是在中國嗎?是否考慮去見一見卷耳智能科技的創始人,論GPU,全世界沒有任何一家公司能比得上我們,這不是天然的合作者嗎?”

  克裡斯是葡萄牙人,他不懂國人的思維,而黃仁勳是懂一些的,心裡也是不斷的搖頭,如果有可能,他早就去了。

  但卷耳智能科技第一個找上摩爾科技的時候他就知道,英偉達肯定是沒戲的。倒不如指望OpenAI能夠知恥而後勇,趕緊趕上來。

  “不過還是去見見吧,就算不成,也沒有什麽損失不是嗎?”黃仁勳尋思,來都來了,這裡離河州也不算太遠。

  ……

  別說英偉達這種業內企業了,就算是八竿子打不著的網友們,這個夜晚也都選擇不眠。

  時間已是深夜,科技圈還熱鬧的很,簡直就像過大年。

  而“今年”的“春晚”只有一個主角,那就是類思維模型。

  “一百多項專利我全都整理了,紀大在河州大學智算中心項目的啟動儀式上講的那番話,我也反覆琢磨過。

  “據此,我設計了一套實施方案【從0開始訓練一套類思維大模型】,源程序上傳到Gitee碼雲上了,地址是:https:‖*****king。有興趣的可以下載下來一起試試,共同探討。”

  “我試了,根本不行啊,這效率,還不如直接從0搭建GPT呢!”

  “你廢話,專利文件肯定不可能給你披露細節的,這需要你一點點一點點的慢慢去試去調整,才能達到最佳。”

  “能達到嗎?我怎麽覺得這就是個坑呢?我用數學模型做了一下評估,所有條件都考慮進去,看多少參數的小模型替代神經網絡節點,結果是多少你們知道嗎?答案是1。”

  專業的IT社區都是業內人士,尤其是今天,CSDNBlog人工智能分區更是一群AI領域大佬的聚集地。

  答案是1代表什麽意思,他們再明白不過了——那就是現有神經網絡模型的效率就是最高的,任何改變都只會影響效率,而不會提高效率。

  “把你的計算過程貼出來,我們一起看看……”

  “好!”這個人名為孫博,畢業於信息科技大學本科,國科大碩士、博士,現為科學院自動化所人工智能基礎前沿理論研究室研究員。

  ……

  紀弘也在窺屏,他是CSDN的老用戶了,也經常會在裡面發一些東西,今天從河州大學回來以後,也是照例進來看了看。

  正好就看到這群人在討論類思維模型的事兒,也就一直在盯著。

  當孫博把所有的計算過程貼出來的時候,他也是第一時間就下載了下來。

  計算過程極為複雜,涉及到微分、積分、線性代數、離散數學、最優化理論、信息論等一大堆學科的交叉。

  如果不是最近能力一直在+0.1+0.1的不斷在提升著,這麽複雜的東西他都有可能看不懂。

  “這人不簡單呐!”好久之後,紀弘才感歎著,不知道是哪位大佬,有沒有機會挖過來?

  這麽想著,紀弘挑了一些純理論且不涉及機密的東西給他私信了過去:“我看博主水平非常高,對這個方向有興趣嗎?有機會可以聊聊。”

  發過去之後,紀弘就沒再管他,又在窺屏了。

  還別說,專業的論壇不太經常冒泡的還真有幾個大牛,今天趁著這個“團圓夜”全都出來了,紀弘就看到好幾個。

  “看樣子確實是的,這個理論行不太通啊!”一位名為“人工智能雜談”的博主說話了:

  “這樣我就放心了,我還以為卷耳智能科技是傻的,這麽機密的東西都敢往外放。原來是假的,那就對了!”

  “也不盡然是假的,小模型肯定不行,但是如果能解決一個最優化理論的問題,用一個新的東西代替這位微模型,那……”

  孫博對前沿理論的研究很深,總覺得類思維模型有點兒意思,而且跟自己思考的一個最優化理論問題有所牽連,說不定這就是他那個問題得到了解決的成功過。

  不過,正敲著字兒呢,他突然反應過來,自己這不是在和同事探討問題,而是在玩技術論壇。

  這是玩兒High了呀!這東西可不能往外發,也是急忙刪除了這段文字,並檢查了一番自己的電腦。

  最後回道:“嗯,確實是假的,不過就算是假的,不試一試,你心裡不癢癢嗎?”

  “還真是!不管真的假的,耳語系統已經事實存在了,怎麽來的?不試一試肯定不會甘心的,我先跑跑看,說不定效率雖然低,但是真實效果卻非常好呢?數學計算出來的結果不一定就絕對符合事實!”

  “嘿嘿……”

  紀弘笑著,這就是陽謀。

  在自己並沒有其他思路的情況下,誰能不去試一試呢?哪怕明知道這是個坑!

  相信英偉達啊、OpenAI啊,尤其是OpenAI肯定會試一試的——白白消耗他們一大批算力資源,不管是從哪兒挪來的,那也是好事兒一樁!
鍵盤左右鍵 ← → 可以切換章節
章節問題回報:
翻譯有問題
章節內容不符
章節內容空白
章節內容殘缺
上下章節連動錯誤
小說很久沒更新了
章節顯示『本章節內容更新中』
其他訊息