要搞清楚cuda是什么,先要明白cpu和gpu的区别。



cpu架构有复杂的控制单元和巨大缓存。



这种设计是为了处理复杂逻辑运算。这要求cpu必须有很强的单核性能。



但cpu物理核心数量有限,就算最高端的服务器cpu,面对海量简单计算时,也会因为线程数量限制而排队。



快看网的推荐算法,本质是海量矩阵乘法。



这些计算本身不复杂,不需要多强逻辑推理,但数量极其庞大。



让cpu去算矩阵,是高射炮打蚊子,效率极低,而且容易把服务器撑爆。



gpu架构完全不同。



gpu没有复杂控制单元,内部塞满了成百上千个简单的流处理器。



这些流处理器只能做基础运算。



但因为数量庞大,它们可以同时并行处理海量数据。



这完美契合了ai算法和推荐系统需要的大规模并行计算。



可是,硬件再强,也需要软件驱动。



在cuda出现前,程序员想用显卡算力做非图形渲染的通用计算,简直是噩梦。



他们必须把非图形数据,强行伪装成图形像素数据,通过复杂图形api通道传给显卡。



等显卡算完,还要把输出像素数据反向解析回通用数据。



这种操作极其繁琐,写错一行代码,就会导致程序崩溃。



所以,空有强大并行算力,却没人能轻易用在非游戏领域。



直到黄仁勋做出大胆决定,推出cuda。



cuda全称是计算统一设备架构。



它本质是一个软件开发平台和编程模型。



英伟达在每张显卡底层嵌入了cuda硬件指令集,同时在软件层面推出一整套编译器、库文件和开发工具。



cuda最伟大也最可怕的地方在于,它允许程序员直接用最普及的c语言,调用显卡底层算力。



程序员不再需要学晦涩的图形api,也不需要伪装数据。



只要会写c语言,只要装了cuda开发包,就能轻松把一段并行计算代码跑在英伟达显卡上。



这极大降低了gpu通用计算门槛。



华尔街投资人不理解,为什么一家卖硬件的公司,要养几千软件工程师维护一个免费给开发者用的平台。



但黄仁勋顶住压力,强行推广cuda。



他甚至跑到各大学计算机系,免费发支持cuda的显卡,鼓励学生用cuda做科研计算。



这是一个极度长远的阳谋。



随时间推移,越来越多程序员习惯用cuda。



各种基于cuda的科学计算库、深度学习框架开始在开源社区生长。



当2025年大模型时代爆发,全球科技公司都需要海量算力训练ai时,他们发现一个绝望的现实。



所有成熟ai算法,所有好用的深

本章未完,点击下一页继续阅读

(1/3)

章节目录

带着手机重生,目标科技教父所有内容均来自互联网,零点小说网只为原作者没钱又任性的小说进行宣传。欢迎各位书友支持没钱又任性并收藏带着手机重生,目标科技教父最新章节