1150分

樓主

個人積分：1150分

文章編號：91064474

陸媒傳DeepSeek可改適配中國國產GPU晶片，繞開輝達CUDA護城河

繞開輝達護城河陸媒傳DeepSeek可改適配中國國產GPU晶片

外媒報導，深度求索(DeepSeek)在研發大模型時繞過了輝達的軟硬體整合技術「統一計算架構」(CUDA)這道AI技術護城河，這種用新的演算法高效利用硬體層面加速，能提高模型效果。只要有足夠擅長寫PTX語言的內部開發者，就能讓大陸開發的AI模型更容易適配中國國產GPU晶片，這讓美國不少AI巨頭們感受到極大的威脅。

據《快科技》報導，DeepSeek真的繞過了輝達的計算架構CUDA，北京航空航太大學黃雷副教授接受採訪時表示，繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發，從而實現更加細細微性的操作。

這是真的嗎? 無法冷靜

若是真的，輝達恐怕還沒跌完

在股市裡永遠要尊重跟你看法不同的人，因為你賺的錢就是他賠的錢

2025-02-03 1:41 #1

文章關鍵字

陸媒傳 DeepSeek 護城河中國 GPU晶片 cuda

海綿u

20分

2樓

海綿u

個人積分：20分

文章編號：91064509

一定要避開美國晶片卡脖子。

ODE

460分

3樓

ODE

個人積分：460分

文章編號：91064542

N社卡走線進中國的水很深,$$很嚇人
其他政治語言就不用多談了
$$是不會騙人的

颯氣大A

4359分

4樓

颯氣大A

個人積分：4359分

文章編號：91064691

如果這麼簡單？
Intel或是AMD為什麼繞了這麼久還沒繞過去這我不行

給你一個關鍵字CUDA，
自己上網查一下吧沒有不敬的意思

jerryho282

simonni DS如果是偷,你應該將你發現"偷"的部份發布出來讓大家公評啊！而不是造謠！

2025-02-03 15:57

simonni

jerryho282 都自己開發的？放屁！

2025-02-04 2:06

alffu

6561分

5樓

alffu

個人積分：6561分

文章編號：91064741

DeepSeek真的好可怕，老美-鼠定了

更多DeepSeek應用，甚至可以，單機跑、免連網，免nvda顯卡

晚上再來好好研究，不管晚上了，白天開盤，怎麼辦

jerryho282

我iphone 16就己經安裝了,再加上kimi,設計個人專用的蛇年拜年圖卡

2025-02-03 11:19

alffu

+1，真的厲害，不要問政治，超強

2025-02-03 18:54

riklin

6508分

6樓

riklin

個人積分：6508分

文章編號：91065175

CUDA工具這麼重要美國為什麼不封鎖中國使用CUDA 發展 AI呢???

禁輝達高階顯卡有漏洞那禁止CUDA不更快....不用CUDA就沒法發展AI嗎

hightime

136分

7樓

hightime

個人積分：136分

文章編號：91065210

颯氣大A wrote:
如果這麼簡單？Intel...(恕刪)

《轉載》

網路上傳deepseek繞過了英偉達cuda，我跟大家講一下deepseek到底做了什麼。

英偉達嚴格來說是一個平台性公司，並不止是硬件，硬件只不過是一個載體，它的護城河是cuda計算平台，所有高性能並行計算的祖師爺，只要你用英偉達的顯卡做高性能計算，就要透過cuda計算平台。

你說用AMD的顯示卡，哀，它沒有生態呀，就像android和windowsphone那麼大的差別。你買蘋果手機，不是買的硬件，而是IOS整個生態，這個生態也是用戶黏性的核心，cuda也是如此，你搞高效能運算，週邊的配套生態工具都是cuda的，你總也不能自己再開發一套出來，就像你一個開發電商的會去再造個JAVA的輪子嗎？英偉達打來十年的領先時間。所以各大公司都被英偉達狂宰，有苦難言。

總之一句話，英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態，你想寫個demo用啥都行，你想上生產除了英偉達別無選擇，這就是過去十年AI圈的現實。天下苦達子久矣。

deepseek開源以後利用Meta二十分之一的成本，完成了比Meta性能好十倍的大模型，達到了與全球領先chatgpt最新版本相當的實力。

deepseek不僅公佈了開源了程式碼，公開了測試方式與數據，還發表了全新架構的論文，這相當於一把梭了。

各路人馬一開始不相信，然後開始扒deepseek，用deepseek的源代碼，測試數據，樣本等可以完全復現一次deepseekR1的訓練過程，成本就是那麼低，這讓所有人都閉嘴了。

有點從不服的心態變成你是挺牛逼的意思了，接著研究細節，然後從論文中發現了deepseek改造了英偉達底層的cuda生態，用比cuda更底層的ptx語言重寫了cuda的硬件邏輯，讓其中有20個流處理器硬體做了CUDA規定的以外的事，彌補了閹割版顯示卡在網路通訊上的不足，相當於繞過英偉達的管理平台與運算生態，直接給英偉達的硬體發號施令。

這是英偉達股價崩盤的核心邏輯，英偉達的最大護城河讓人挖開了一個洞。英偉達是個霸氣十足的太歲，deepseek在他的頭上動土了。

deepseek可以這麼做，就代表別人也可以這麼做。有人問了那之前沒人能想到嗎？

這個問題很好，之前一定有大神想過，但是有很多問題導致無法實現。一是在大模型剛出現的時候，一片藍海，大家空間無限大，大家都在攻城略地，速度和效率是最大優先級，沒人給你時間去搞底層語言編程這玩意，特別是美國人，花錢能解決的事不叫個問題，不就是美元嘛，印就完了，錢有得是，英偉達的顯卡隨便買，誰腦子有洞給自己找這麻煩？

中國不一樣，被美國制裁的只能用閹割卡，還不能隨便買，資源極度匱乏，必須用最小的硬體壓榨出最大的性能出來，只能劍走偏鋒。所以用ptx繞過cuda這件事只會發生在中國，不可能發生在美國，邏輯不允許！

第二點是大語言模型的發展進入了一個全新的時期，工作效率理解力推理能力精度都有了質的飛躍，deepseek是用deepseek推理模型本身完成了海量的ptx代碼優化工作，這才使deepseek的新版本有可能繞過CUDA完成程式指令集的巨量任務。 ptx是變種的組合語言，如果用真人寫以現在的資料量累死也寫不完，但是AI它效率高呀，怎麼寫也不累……

英偉達現在的危機是怎麼給投資人說cuda依然在未來的幾十年的地位無法被撼動，但顯然他們還沒找到答案。誰能想到AI的教宗竟然被AI給革了命，這找誰說理去。

再強調一遍，國運不在於人，而在於勢，美國的勢沒了，這才是最恐怖的

CogChern

CUDA跟PTX都是Nvidia提出的沒錯，CUDA程式碼也是要先編寫成PTX程式碼，再交給GPU轉成可以在硬體上執行的機器碼。DeekSeek做的確實就是繞過了CUDA的過程，直接編寫PTX程式碼。

2025-02-03 11:33

bulldog2005

專利訴訟是沒有用的。現在的情況是DeepSeek“沒有”用到CUDA，而是使用了更下層的PTX，而且沒有改動任何硬件，你不能因爲人家不用去告對方吧？

2025-02-03 12:17

kevin721202

5612分

8樓

kevin721202

個人積分：5612分

文章編號：91065401

hightime wrote:
deepseek是用deepseek推理模型本身完成了海量的ptx代碼優化工作，這才使deepseek的新版本有可能繞過CUDA完成程式指令集的巨量任務

目前好像有人在用deepseek把deepseek模型代碼修改搬到其他家顯卡上。

bulldog2005

AMD第一個將DeepSeek納入自己的系統，然後華爲，現在大批廠商都不斷接入。問題是DS沒算力了，就算再省，也要有，不是嗎?

2025-02-03 12:19

kevin721202

bulldog2005，算力還是要，但cuda壟斷已經被打破了，這對美股還蠻傷的

2025-02-03 12:26

shihan29

152分

9樓

shihan29

個人積分：152分

文章編號：91065439

中國最讓全球側目的是建立一條龍的全產業鍊，當美國全力封鎖中國的科技進步時，反倒讓中國國內產業蓬勃發展自成一格。

deepseek可以使用華為的昇騰晶片，而華為晶片由中芯代工將整個AI產業鍊統包，或許效能不如西方重金砸出來的台積+輝達晶片，但生命總會找到出口！中小型國家跟資源相對少的團體可以輕鬆進入AI產業，共同分享這個有望改變世界的技術。

ovonel

7216分

10樓

ovonel

個人積分：7216分

文章編號：91065544

自主、自研、自足，這是正道不用靠別人自足自給一條龍~~

陸媒傳DeepSeek可改適配中國國產GPU晶片，繞開輝達CUDA護城河

小惡魔新聞台

小惡魔廣編特輯

陸媒傳DeepSeek可改適配中國國產GPU晶片，繞開輝達CUDA護城河

小惡魔新聞台

小惡魔廣編特輯

今日熱門文章 網友點擊推薦！

今日熱門文章　網友點擊推薦！