来源:DeepHub IMBA本文约6400字,建议阅读12分钟在本文将演示 PyTorch 2.0新功能的使用,以及介绍在使用它时可能遇到的一些问题。
PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢?PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。
2025年09月23日
来源:DeepHub IMBA本文约6400字,建议阅读12分钟在本文将演示 PyTorch 2.0新功能的使用,以及介绍在使用它时可能遇到的一些问题。
PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢?PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。
2025年09月23日
PyTorch是python的机器学习库,简洁高效,实际应用中非常流行。今天我们详细讲解一下,PyTorch中的张量。
1、什么是张量?
张量的概念大家可以去了解一下。pytorch中的张量,是指某种形式组成的不同维数的矩阵。
2、构造含有数据的张量torch.tensor()函数
看一个例子。
2025年09月23日
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发及AI大模型算法学习视频及资料,尽在官网-聚客AI学院大模型应用开发微调项目实践课程学习平台
2025年09月23日
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
面对数以亿计的图片数据,到底该用什么样的方法才能快速搞实验?
2025年09月23日
原作 Dylan Djian
栗子棋 编译整理
量子位 出品 | 公众号 QbitAI
遥想当年,AlphaGo的Master版本,在完胜柯洁九段之后不久,就被后辈AlphaGo Zero (简称狗零) 击溃了。
从一只完全不懂围棋的AI,到打败Master,狗零只用了21天。
而且,它不需要用人类知识来喂养,成为顶尖棋手全靠
2025年09月23日
IT之家 10 月 2 日消息,据 PyTorch 新闻稿,PyTorch 旗下架构优化库 torchao 现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率,IT之家附 GitHub 页面地址(点此访问)。
据介绍,torchao 提供了一系列优化工具集,可以帮助 LLaMA 3 等流行的 AI 模型提升性能,其支持 float8、int4 等低精度数据类型,能够有效减少硬件开销和 RAM 用量。
2025年09月23日
杨净 发自 凹非寺
量子位 报道 | 公众号 QbitAI
如何提升PyTorch“炼丹”速度?
最近,有一位名叫Lorenz Kuhn的小哥,分享了他在炼丹过程中总结的
2025年09月23日
AI自动生成的苹果芯片Metal内核,比官方的还要好?
Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。
更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速,其中一些工作负载甚至比基准快了数百倍
2025年09月23日
明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI
你是否也有这样的困惑:
“看了无数个入门教程,这个门还是没跨进去……”
这一次,你可能终于有救了!