GPU

开源日报 | 大模型国家队发力了;RLHF新平替;ICQ即将关停;中国大模型混战终结者;MoE是一门妥协的艺术

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.5.27 今日要点 虚幻引擎代码规范禁止使用脏话、禁止slave、master 一位网友近日分享了 E…

行业内首次实现国产 GPU 从 0 到 1 的端到端 AI 大模型实训

摩尔线程、无问芯穹今天联合宣布,双方已经正式完成基于国产全功能 GPU 千卡集群的 3B 规模大模型“MT-infini-3B”实训,该模型基于摩尔线程国产全功能 GPU MTT …

Hugging Face ZeroGPU 计划正式发布——提供价值一千万美元的免费共享 GPU

在人工智能技术领域,GPU 资源一直是推动研究和应用的关键因素。然而,GPU 的成本和可用性对于许多研究人员和开发者来说却是一个显著的障碍。 在 Hugging Face,我们希望…

ZLUDA在AMD GPU上看到了CUDA的新活动

早在二月份,我就写过AMD悄悄地资助了在ROCm库上构建的AMD GPU的CUDA实施。这是ZLUDA的一个化身,最初是使用oneAPI Level Zero为英特尔GPU实现的C…

如何通过NVIDIA GPU到Fedora 40 Proxmox VE虚拟机

如果您将NVIDIA GPU转换为Fedora 40 Proxmox VE虚拟机,您将获得许多好处,例如: 将虚拟机的显示直接流式传输到连接到NVIDIA GPU的监视器上。 将U…

新进展!openKylin 成功适配 JM9100 GPU Mesa 驱动

长沙景美集成电路设计有限公司(以下简称“景美”)作为openKylin(开放麒麟)社区共建伙伴,在加入社区后组建了GPU SIG组,并邀请了格兰菲、摩尔线程等GPU厂商陆续加入并贡…

NVIDIA的开放GPU Linux内核驱动程序将很快成为Turing&更新的GPU

虽然我们都在等待NVIDIA R555系列Linux驱动程序测试版,根据Wayland改进(显式同步)等之前的信息,该测试版预计最快将于下周推出,但NVIDIA R5 60系列Li…

以加速 compaction 和 scan 为例:谈 GPU 与 LSM-tree 的优化

作者:胡琳「北京大学智能学院在读博士生,博士期间在北京大学数据管理组从事GPU加速图算法的研究,在图算法加速领域取得了一定的成果,发表在SIGMOD等知名会议上,将继续在图计算领域…

由于不断增加的固件膨胀,从Initramfs弹出GPU驱动程序

目前,Fedora/Red Hat没有立即做出任何更改,但所需GPU固件文件的大小不断增加,这导致Linux发行版供应商重新考虑将GPU内核图形驱动程序作为initramfs的一部…

TUXEDO电脑推出Linux笔记本电脑功能。。。

这一最新版本是第一款预装Ryzen和Linux新CPU的笔记本电脑。 TUXEDO Computers从不回避做一些大胆的事情,这也就不足为奇了,他们是第一家开发由AMD的Ryze…

如何在Fedora 40上安装适用于Intel GPU的OpenCL+

OpenCL是一个用于在GPU上运行计算任务的开源库。OpenCL使用您计算机上安装的GPU硬件(即Intel iGPU)为支持的应用程序(即LibreOffice)启用3D硬件加…

Radeon GPU Profiler 2.1添加Radeon GPU Analyzer互操作性

AMD的GPUOpen团队今天发布了Radeon GPU Profiler 2.1软件,该软件现在与Radeon GPU Analyzer具有互操作性。 Radeon GPU Pr…

Linux 6.10添加英特尔低延迟提示,大幅提高GPU计算的GT频率

继针对Linux 6.10和更早版本的Adaptive Snyc SDP的Xe DRM驱动程序更新、Lunar Lake显示支持以及在下一个内核版本的几周前发送的i915拉取的更多…

Red Hat的漫长,生锈的道路为Nova作为新司机的继任者

Red Hat的显示驱动程序团队最近一直在为Nova设计计划,这是一个新的即将开发的Linux DRM内核驱动程序,以Rust编写,用于开源NVIDIA图形支持,作为支持GPU系统…

Krita 2024 规划:更多地关注 GPU 加速和 AI

Krita 项目团队发文对 2023 年的工作进行了回顾;同时透露了项目 2024 年的一些工作规划,其中包含了一些 2023 年未完成的事项以及新的内容。 首先提到了就是在 20…

Mesa 24.1增加对英特尔数据中心GPU Flex 170G的支持

2022年发布的英特尔数据中心GPU Flex系列产品是数据中心GPU Flex 140和数据中心GPU Flex 170,而现在英特尔的开源Mesa OpenGL和Vulkan驱…

Krita在2024年更多地关注GPU加速和人工智能

Krita开源图形编辑器和数字艺术程序正在考虑在2024年可能添加一些人工智能功能,以及可能的GPU加速和其他新功能。 首先,Krita开发人员承认他们最终需要将Qt5工具包移植到…

NVIDIA R550 Linux驱动程序开放内核模块在GeForce GPU上运行良好

随着近期 NVIDIA 550.54.14 Linux驱动程序发布R550系列现在已经稳定了。NVIDIA R550 Linux驱动程序的一个显著变化是,在使用作为其驱动程序包一部…

无需GPU,轻松搭建本地大语言模型(LLM)服务:OpenAI接口与C#/Python实现

一、引言随着自然语言处理(NLP)技术的快速发展,大语言模型(LLM)成为了研究和应用的热点。然而,搭建LLM服务通常需要高性能的GPU资源,这对于个人开发者和小型企业来说可能是一…

Mesa 24.1将提高每个系统支持超过8个Vulkan GPU的限制

如果您的每个系统运行九个或更多的GPU,梅萨24.1 下个季度发布的Vulkan API将提高每个系统8个DRM设备的限制,现在理论上每个系统允许256个GPU。 Mesa Vul…

字节跳动打造 MegaScale:用于训练 LLM 的单一“万卡集群”

字节跳动联合北京大学的研究团队在 arXiv 上发表论文,介绍他们用于训练大语言模型的生产系统 MegaScale。该团队为 MegaScale 搭建了超过 10000 块 GPU…

了解一下CPU 、TPU、GPU、DPU、QPU

随着AI的火爆,CPU 、TPU、GPU、DPU、QPU这些缩略词整天在各种媒体里面飞来飞去。本文主要解释这些处理器,以及他们的优缺点。CPU(中央处理器)CPU就像计算机的“大脑…

英特尔让它更容易复制Linux GPU挂在真正的硬件上

从事开源Mesa OpenGL/Vulkan驱动程序代码的英特尔工程师目前使用模拟器重放捕获的错误状态/GPU挂起,但新的补丁建议允许重放实际硬件上的GPU挂起。反过来,这有望帮助…

AMDGPU LLVM添加GFX 9/10/11“通用目标”构建一次即可在多个GPU上运行(&)

今天合并到主线LLVM的代码正在为跨GFX9、GFX10和GFX11 GPU系列的通用目标概念做准备。在后续工作中,这些通用目标的目标是允许编译代码一次,然后在给定硬件系列中的多个…

CPU vs GPU:不仅仅是一字之差

当今科学技术的飞速发展,社会已经迈入了信息时代的智能化阶段。人脸识别、智能客服、个性化推荐等应用已经深入到日常生活的各个方面。这些看得见的应用背后,是看不见的算力在默默地支撑着。在…

厉害,美国人又搞了一个垄断的生态系统

去年AIGC大火,程序员都把注意力放在了最上层,而忽略了提供算力的最底层:GPU。不过这也正常,就像很少人直接针对CPU编程一样,直接针对GPU编程的人也不多。但是了解一下GPU编…

如何在CPU或GPU上应用热糊

热糊、热化合物或热接口材料(TPM)有助于冷却您的CPU和GPU。如果你是一个游戏玩家,你必须意识到它的重要性。你需要确保它们没有干燥,并被彻底涂抹。这篇文章将展示如何将热粘贴应用…

GPU Artifacting:含义,测试,示例

你有没有注意到你的显示器上有大的圆点和一些奇怪的条纹?好的,这种屏幕的失真被称为GPU伪装。在这篇文章中,我们将看到什么是GPU人工处理,它的测试和例子。什么是GPU人工处理?GP…

芯瞳正式加入 openKylin,为社区贡献高质量的国产 GPU 解决方案!

近日,芯瞳半导体技术(山东)有限公司(以下简称“芯瞳”),签署openKylin社区CLA(Contributor License Agreement 贡献者许可协议),正式加入o…

“Panthor”DRM驱动程序将为较新的ARM马里GPU提供支持

最近由Boris Brezillon在Collabora开发的是Panthor,这是一个新的直接渲染管理器(DRM)驱动程序,用于支持较新的ARM马里图形处理器。 Panthor用…

AMD发布Radeon GPU Profiler 2.0、RGA 2.9和其他GPU Open工具

继昨天的大型AMD人工智能活动之后,他们推出Instinct MI 300 A/MI 300 X和ROCm 6.0今天,AMD工程师发布了Radeon GPU Profiler 2…

GPU架构与渲染性能优化

Labs 导读在开发图形渲染应用时,渲染性能优化是一个绕不开的主题,开发者往往遵循一些优化准则来构建自己的应用程序,包括数据合并、模型减面、减少采样次数、减少不必要渲染等。本文结合…

英特尔与Granite Rapids、Falcon Shores&他们的开放软件堆栈@SC23

随着SC23超级计算大会今天在丹佛拉开帷幕,英特尔刚刚解除了对一些披露的禁令。 英特尔没有宣布SC23的任何新产品,但正在谈论他们现有的一些CPU、GPU和AI产品,并继续调侃他们…

借助Python库CuPy,发掘GPU的威力

译者 | 布加迪审校 | 重楼CuPy简介CuPy是一个Python库,与NumPy和SciPy数组兼容,为GPU加速计算而设计。通过将NumPy换成CuPy语法,您可以在英伟达C…

此效果需要在After Effects或Premiere Pro中进行GPU加速

您是否在Premiere Pro或After Effects中遇到此效果需要GPU加速错误消息?一些用户报告说,他们在为剪辑添加效果时不断收到此错误提示。如果你也面临同样的错误,这…

RADV驱动程序丢弃RDNA1/RDNA2 GPU的NGG流输出代码

而最初的AMD Navi GPU 下一代几何 (NGG)支持, 它被一些GPU借用了 并且最初在顶点和几何图形处理方面并没有达到计划的效果。Mesa Radeon Vulkan驱动…

GNOME静音对新技术的实验性零拷贝支持

Ubuntu桌面开发人员Daniel Van Vugt一直致力于在GNOME的Mutter合成器中为离散GPU提供零拷贝支持,以提供更快的性能。到目前为止,这似乎与Nouveau开…

英特尔发布支持Xe GPU加速的OSPRay Studio 0.13

以最近发布的 OSPRay 3.0 有了最初的GPU加速支持,OSPRay Studio现在已经针对这个新版本进行了更新。作为提醒,OSPRay Studio是英特尔的开源交互式可…

Ubuntu's Mir支持混合图形/多GPU

Canonical继续投资Mir作为他们的Wayland合成器和一组平台抽象接口,使其更容易 物联网和其他“智能”设备运行 在Ubuntu核心之上。最近,和平号的开发人员一直在努力…

英特尔发布具有初始GPU加速功能的OSPRay 3.0

遵循其他英特尔oneAPI组件,如 Embree 和 OpenVKL 通过SYCL引入GPU加速,今天英特尔发布了开源的OSPRay 3.0,为这个便携式光线跟踪引擎推出了最初的G…