并行计算

首页 标签 并行计算
# 并行计算 #
关注
5415内容
|
7小时前
|
基于EM算法的混合Copula MATLAB实现
混合Copula模型通过组合多个Copula函数(如Gaussian、Clayton、Gumbel、Frank)描述复杂相关性结构,EM算法用于估计模型参数(权重和各Copula参数)。以下是MATLAB实现的核心步骤:
中科天机开放华中2.5公里气象及全球12公里沙尘数据集:支持时空序列AI模型训练
FlagOS Skills 1.0正式上线魔搭Skills中心,是首个面向异构AI芯片的AI Agent专业技能库,覆盖模型迁移、算子开发、性能调优等场景,赋能Claude Code、Cursor等工具直接支持国产芯片开发。
大模型推理性能翻倍秘籍:计算巢PD分离快速部署指南
阿里云计算巢模型市场提供开箱即用的大语言模型PD分离(Prefill-Decode分离)部署方案,基于ACS集群与专家并行优化,3分钟极速上线Qwen、Deepseek等MoE模型,吞吐提升1.5–2倍,零运维、高可用、企业级监控一应俱全。
Python 多线程从入门到精通:零基础也能学会的并发编程
本教程来源http://www.phdhk.cn系统讲解Python多线程:从线程/进程概念、GIL限制,到threading模块实操(创建、启动、join、Lock同步),涵盖I/O密集型任务实战对比与避坑指南,助你高效应对并发开发需求。(239字)
InCoder-32B开源:320亿参数工业代码基座,保住通用代码能力,工业代码全线领先
北航联合发布InCoder-32B工业代码大模型,专攻芯片设计、GPU内核、嵌入式、编译器与3D建模等硬核领域。基于250万条真实执行验证数据训练,全量权重开源,通用能力不降反升,多项工业基准大幅领先。
|
3天前
| |
大模型应用:大模型运行全流程解析:从初始化加载→计算→结果输出.69
本文系统解析大模型推理全流程:从硬盘加载权重、CPU内存预处理、GPU显存计算,到自回归生成与自然语言解码。涵盖硬件协同(硬盘→内存→GPU)、软件步骤(分词、注意力、采样、后处理)及资源调度优化,揭示其软硬协同的本质。
|
4天前
|
基于神经网络的YOLO目标检测算法
基于神经网络的YOLO目标检测算法在C语言中的实现需要结合深度学习框架的底层优化与硬件加速技术。
|
5天前
| |
大模型应用:GPU的黑盒拆解:可视化看透大模型并行计算的底层逻辑.67
本文深入解析GPU核心架构与大模型算力优化原理,涵盖SM流式多处理器、显存、显存控制器、PCIe接口等关键组件,详解线程级/指令级并行及张量核心加速机制,并通过全流程耗时分析与任务拆分可视化,揭示“数据传输是主要瓶颈”的核心结论,助力高效部署大模型。
|
6天前
| |
大模型应用:多卡集群跑满14B模型:大模型推理算力应用实践.66
本项目面向10台RTX 4090集群,优化Qwen-14B大模型推理:通过NF4量化压缩显存、动态批处理(基于Amdahl定律)提升GPU利用率至85%+、多卡模型并行均衡负载,解决卡顿、显存溢出与调度不均问题,支撑日均10万次高并发稳定服务。
免费试用