陸媒傳DeepSeek可改適配中國國產GPU晶片,繞開輝達CUDA護城河

繞開輝達護城河 陸媒傳DeepSeek可改適配中國國產GPU晶片

外媒報導,深度求索(DeepSeek)在研發大模型時繞過了輝達的軟硬體整合技術「統一計算架構」(CUDA)這道AI技術護城河,這種用新的演算法高效利用硬體層面加速,能提高模型效果。只要有足夠擅長寫PTX語言的內部開發者,就能讓大陸開發的AI模型更容易適配中國國產GPU晶片,這讓美國不少AI巨頭們感受到極大的威脅。

據《快科技》報導,DeepSeek真的繞過了輝達的計算架構CUDA,北京航空航太大學黃雷副教授接受採訪時表示,繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細細微性的操作。

這是真的嗎?
若是真的,輝達恐怕還沒跌完
在股市裡永遠要尊重跟你看法不同的人,因為你賺的錢就是他賠的錢
一定要避開美國晶片卡脖子。
N社卡走線進中國的水很深,$$很嚇人
其他政治語言就不用多談了
$$是不會騙人的
如果這麼簡單?
Intel或是AMD為什麼繞了這麼久還沒繞過去

給你一個關鍵字CUDA,
自己上網查一下吧
jerryho282
simonni DS如果是偷,你應該將你發現"偷"的部份發布出來讓大家公評啊!而不是造謠!
simonni
jerryho282 都自己開發的?放屁!
DeepSeek真的好可怕,老美-鼠定了



更多DeepSeek應用,甚至可以,單機跑、免連網,免nvda顯卡

晚上再來好好研究,不管晚上了,白天開盤,怎麼辦

jerryho282
我iphone 16就己經安裝了,再加上kimi,設計個人專用的蛇年拜年圖卡
alffu
+1,真的厲害,不要問政治,超強
CUDA工具這麼重要美國為什麼不封鎖中國使用CUDA 發展 AI呢???

禁輝達高階顯卡有漏洞那禁止CUDA不更快....不用CUDA就沒法發展AI嗎
颯氣大A wrote:
如果這麼簡單?Intel...(恕刪)


《轉載》

網路上傳deepseek繞過了英偉達cuda,我跟大家講一下deepseek到底做了什麼。

英偉達嚴格來說是一個平台性公司,並不止是硬件,硬件只不過是一個載體,它的護城河是cuda計算平台,所有高性能並行計算的祖師爺,只要你用英偉達的顯卡做高性能計算,就要透過cuda計算平台。

你說用AMD的顯示卡,哀,它沒有生態呀,就像android和windowsphone那麼大的差別。你買蘋果手機,不是買的硬件,而是IOS整個生態,這個生態也是用戶黏性的核心,cuda也是如此,你搞高效能運算,週邊的配套生態工具都是cuda的,你總也不能自己再開發一套出來,就像你一個開發電商的會去再造個JAVA的輪子嗎? 英偉達打來十年的領先時間。 所以各大公司都被英偉達狂宰,有苦難言。

總之一句話,英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態,你想寫個demo用啥都行,你想上生產除了英偉達別無選擇,這就是過去十年AI圈的現實 。 天下苦達子久矣。

deepseek開源以後利用Meta二十分之一的成本,完成了比Meta性能好十倍的大模型,達到了與全球領先chatgpt最新版本相當的實力。

deepseek不僅公佈了開源了程式碼,公開了測試方式與數據,還發表了全新架構的論文,這相當於一把梭了。

各路人馬一開始不相信,然後開始扒deepseek,用deepseek的源代碼,測試數據,樣本等可以完全復現一次deepseekR1的訓練過程,成本就是那麼低,這讓所有人都閉嘴了。

有點從不服的心態變成你是挺牛逼的意思了,接著研究細節,然後從論文中發現了deepseek改造了英偉達底層的cuda生態,用比cuda更底層的ptx語言重寫了cuda的硬件邏輯,讓其中有20個流處理器硬體做了CUDA規定的以外的事,彌補了閹割版顯示卡在網路通訊上的不足,相當於繞過英偉達的管理平台與運算生態,直接給英偉達的硬體發號施令 。

這是英偉達股價崩盤的核心邏輯,英偉達的最大護城河讓人挖開了一個洞。 英偉達是個霸氣十足的太歲,deepseek在他的頭上動土了。

deepseek可以這麼做,就代表別人也可以這麼做。 有人問了那之前沒人能想到嗎?

這個問題很好,之前一定有大神想過,但是有很多問題導致無法實現。 一是在大模型剛出現的時候,一片藍海,大家空間無限大,大家都在攻城略地,速度和效率是最大優先級,沒人給你時間去搞底層語言編程這玩意,特別是美國人,花錢能解決的事不叫個問題,不就是美元嘛,印就完了,錢有得是,英偉達的顯卡隨便買,誰腦子有洞給自己找這麻煩?

中國不一樣,被美國制裁的只能用閹割卡,還不能隨便買,資源極度匱乏,必須用最小的硬體壓榨出最大的性能出來,只能劍走偏鋒。 所以用ptx繞過cuda這件事只會發生在中國,不可能發生在美國,邏輯不允許!

第二點是大語言模型的發展進入了一個全新的時期,工作效率理解力推理能力精度都有了質的飛躍,deepseek是用deepseek推理模型本身完成了海量的ptx代碼優化工作,這才使deepseek的新版本有可能繞過CUDA完成程式指令集的巨量任務。 ptx是變種的組合語言,如果用真人寫以現在的資料量累死也寫不完,但是AI它效率高呀,怎麼寫也不累……

英偉達現在的危機是怎麼給投資人說cuda依然在未來的幾十年的地位無法被撼動,但顯然他們還沒找到答案。 誰能想到AI的教宗竟然被AI給革了命,這找誰說理去。

再強調一遍,國運不在於人,而在於勢,美國的勢沒了,這才是最恐怖的
CogChern
CUDA跟PTX都是Nvidia提出的沒錯,CUDA程式碼也是要先編寫成PTX程式碼,再交給GPU轉成可以在硬體上執行的機器碼。DeekSeek做的確實就是繞過了CUDA的過程,直接編寫PTX程式碼。
bulldog2005
專利訴訟是沒有用的。現在的情況是DeepSeek“沒有”用到CUDA,而是使用了更下層的PTX,而且沒有改動任何硬件,你不能因爲人家不用去告對方吧?
hightime wrote:
deepseek是用deepseek推理模型本身完成了海量的ptx代碼優化工作,這才使deepseek的新版本有可能繞過CUDA完成程式指令集的巨量任務
目前好像有人在用deepseek把deepseek模型代碼修改搬到其他家顯卡上。
bulldog2005
AMD第一個將DeepSeek納入自己的系統,然後華爲,現在大批廠商都不斷接入。問題是DS沒算力了,就算再省,也要有,不是嗎?
kevin721202
bulldog2005,算力還是要,但cuda壟斷已經被打破了,這對美股還蠻傷的
中國最讓全球側目的是建立一條龍的全產業鍊,當美國全力封鎖中國的科技進步時,反倒讓中國國內產業蓬勃發展自成一格。

deepseek可以使用華為的昇騰晶片,而華為晶片由中芯代工將整個AI產業鍊統包,或許效能不如西方重金砸出來的台積+輝達晶片,但生命總會找到出口!中小型國家跟資源相對少的團體可以輕鬆進入AI產業,共同分享這個有望改變世界的技術。
自主、自研、自足,這是正道不用靠別人自足自給一條龍~~
關閉廣告
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!