忘東忘西 wrote:
PTX依然是NVIDIA...(恕刪)
沒那麽難。
例如AMD,直接開放ROCm平臺以及HIP編程模型還有ONNX格式,只要DeepSeek稍微轉化就可以直接使用。
升騰的部分也差不多。
反正基礎就是開放底層讓DeepSeek直接調用資源就可以了。
hightime wrote:
第二點是大語言模型的發展進入了一個全新的時期,工作效率理解力推理能力精度都有了質的飛躍,deepseek是用deepseek推理模型本身完成了海量的ptx代碼優化工作,這才使deepseek的新版本有可能繞過CUDA完成程式指令集的巨量任務。 ptx是變種的組合語言,如果用真人寫以現在的資料量累死也寫不完,但是AI它效率高呀,怎麼寫也不累……