塔岸网

华为与DeepSeek联手会发生什么

热度:8℃ 发布时间:2025-02-06 07:32:10

快科技2月5日消息,华为(昇腾+CANN)+Deepseek,能解决英伟达GPU+CUDA的“卡脖子”吗?

据tomshardware等多家媒体报道,华为最新的AI处理器昇腾910C(Ascend 910C)的推理性能已达NVIDIA H100 GPU的六成。

华为与DeepSeek联手会发生什么

根据DeepSeek 研究人员的测试,在推理任务中,昇腾910C性能可达H100的60%。据悉,升腾910C采用chiplet封装,第二代7nm级(N+2)工艺,整合约530亿个晶体管。 

虽然昇腾910C并非当前最强AI芯片,但它有助于降低中国对NVIDIA GPU的依赖。

此外,通过手动优化CANN内核,其效率可以进一步提高。DeepSeek对昇腾处理器及其 PyTorch存储库的原生支持允许以最小的的资源代价,实现CUDA到CANN的无缝转换,从而更容易将华为的硬件集成到AI工作流程中。

华为与DeepSeek联手会发生什么

据了解,DeepSeek的支持为华为芯片带来了关键优势:从第一天起就支持华为昇腾芯片,自主维护PyTorch仓库,只需一行代码就能将CUDA转换为CANN;而且性能优化潜力巨大,通过定制优化可达到更高性能。

据华为官网介绍,CANN(Compute Architecture for Neural Networks)是昇腾针对AI场景推出的异构计算架构,对上支持多种AI框架,对下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供高效易用的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。

华为与DeepSeek联手会发生什么

据了解,CANN分社区版和商用版。前者是快速提供新特性的体验版,供开发者提前试用;而后者是满足商用标准的稳定版本。

目前,CANN社区版已经来到了8.0.0.alpha003版本,针对Ascend C进行了特性增强。而商用版CANN 8.0.RC3版本也已经发布,新增适配7个操作系统,简化了CANN安装流程。

华为与DeepSeek联手会发生什么

DeepSeek的Yuchen Jin表示,长期训练可靠性是中国处理器的一个关键弱点。

主要是NVIDIA硬件和软件生态系统的深度集成,该生态系统已经发展了二十多年。虽然推理性能可以优化,但持续的训练工作负载需要华为的硬件和软件堆栈进一步改进。

而随着AI模型架构向Transformer收敛,CUDA和PyTorch编译器的重要性将降低。DeepSeek团队的加入将显著降低对NVIDIA的依赖,大幅节省成本。

华为与DeepSeek联手会发生什么

无独有偶。此前有消息称,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。

最新发现显示,DeepSeek使用英伟达的H800芯片训练时,使用英伟达底层硬件指令PTX(Parallel Thread Execution)语言,而非高级编程语言CUDA。

这样意味着DeepSeek绕过了CUDA,使用更底层的编程语言做优化。

对于程序开发人员来说,CUDA是一种更加友好的高级语言,开发者只需要专注于程序和算法最相关的运行逻辑,而不太需要考虑具体的程序是如何在GPU等硬件上具体如何执行计算的,从而能够降低开发难度。

而PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread / Warp级别的调整。这种编程非常复杂且难以维护,所以行业通用的做法是使用CUDA这样的高级编程语言。

换句话说,DeepSeek把优化做到了极致。

北京航空航天大学副教授黄雷表示,绕过CUDA可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。假如它之后使用国产GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达GPU硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。

(window.slotbydup = window.slotbydup || []).push({ id: "u6501951", container: "_brvvnx0iwme", async: true });
  • 科技资讯推荐
更多+
当前视点!国轩高科百亿高端正极材料项目投产

当前视点!国轩高科百亿高端正极材料项目投产

(相关资料图)11月8日上午,国轩高科子公司合肥国轩科宏新能源科技有限公司(下称“国轩科宏”)正极材料投产仪式在合肥庐江高新区举行,这也是庐江的首个百亿项目。该项目位于合肥市庐江县国轩材料基地,主要产品为国轩高科自主研发的单体电芯能量密度≥210Wh/kg的高性能磷酸铁锂正极材料,应用于高端新能源汽...

11-15

当前热点-10月销量榜出炉!排名发生剧变,这个品牌近乎腰斩

当前热点-10月销量榜出炉!排名发生剧变,这个品牌近乎腰斩

(资料图片仅供参考)进入11月,电哥依旧为大伙儿整理了10月销量榜单,看看这一期的排名和你预想中有多少差别吧:有意思是:又有新人加入了榜单,有的品牌表现极为稳定,当然也少不了波动非常剧烈的选手。Tips:排名统计时间截止到11月3日,未公布品牌尚未纳入榜单另外,电哥也附上9月榜单(截止10月2日统计...

11-15

快报:我国汽车行业发展环境持续向好 10月份汽车销量同比增长6.9%

快报:我国汽车行业发展环境持续向好 10月份汽车销量同比增长6.9%

(相关资料图)来源:人民网原创稿人民网北京11月10日电(记者王连香)今日,中国汽车工业协会发布10月汽车工业产销情况,数据显示,10月,汽车产销延续平稳发展态势。当月产销分别达到259.9万辆和250.5万辆,环比下降2.7%和4%,同比增长11.1%和6.9%。由于车辆购置税减征政策的持续发...

11-15

世界今头条!量子世界中的平行宇宙到底是什么样子的?

世界今头条!量子世界中的平行宇宙到底是什么样子的?

(资料图)平行世界是否真实存在?另外一个世界的你自己是不是已经过上了非常幸福的生活,已经走上了人生的巅峰,而处在这个世界的你正在受尽社会的毒打。这种平行宇宙的理论到底是怎么来的呢?为什么科学家又会定义平行宇宙的存在呢?我们今天一起来了解一下量子世界中的平行宇宙到底是什么样子的?我们大家都知道在量子世...

11-15

上市公司拟投建超22万吨电池专用外壳材料项目

上市公司拟投建超22万吨电池专用外壳材料项目

(资料图)11月8日晚,甬金股份(603995)公告,拟设立全资子公司“浙江镨赛新材料科技有限公司”,投资建设“年产22.5万吨柱状电池专用外壳材料项目”,计划总投资额约14亿元。该项目分两期建设,其中一期工程建设期12个月,建成年加工7.5万吨柱状电池外壳专用材料生产线,二期工程建设期18个月,建...

11-15

网友评论
评论
发 布

更多科技资讯