空间规划的原则是什么 华泰证券: DeepSeek有望加快模子考试与CUDA解耦
发布日期:2025-02-22 08:00 点击次数:84
e公司讯,华泰证券盘考以为,DeepSeek在V3中使用了比较CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提议的Triton编程话语高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU话语,包括AMD的rocm以及国产算力芯片话语,如寒武纪的念念元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA教唆集。LLM的考试短期内虽未统共脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力依然很好的适配了DeepSeek-R1 等国产模子,并得到了高效推理的成果,华泰证券以为,陪伴国际算力的受限,针对国产算力的优化或将有捏续弘扬,值得青睐。