并行计算

首页 标签 并行计算
# 并行计算 #
关注
5370内容
|
2天前
| |
大模型应用:LlamaIndex 与 LangChain 深度集成构建本地化RAG系统.25
本文详解LlamaIndex与LangChain协同构建本地化RAG系统:以Qwen1.5-1.8B-Chat为基座,通过轻量化验证与工程化落地两阶段示例,实现文档索引、语义检索、提示编排与问答生成全链路本地化,兼顾准确性、可控性与可扩展性。
|
5天前
|
拒绝群发感!我用LoRA“调教”出懂分寸的AI,把大模型人情世故拉满了
本文分享如何用LoRA微调+4-bit量化,将Qwen3-32B大模型压缩至单卡RTX 4090可运行,打造“懂人情、有分寸”的春节祝福AI秘书。通过关系感知数据构建与思维链禁用,让AI祝福从套路化走向个性化、有记忆点的真挚表达。
LLaDA2.1 正式开源,可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限
蚂蚁研究院发布LLaDA2.1,首创“可纠错编辑(ECE)”机制,突破扩散语言模型(dLLM)速度与质量瓶颈:推理达892 TPS,支持极速/质量双模式,并集成业界首个dLLM强化学习框架EBPO。开源即用,迈向真正可用的下一代大模型。
|
8天前
|
【优化调度】基于遗传算法的公交车调度排班优化的研究与实现(Matlab代码实现)
【优化调度】基于遗传算法的公交车调度排班优化的研究与实现(Matlab代码实现)
|
8天前
|
基于梯度优化算法(GBO)整定PID参数(Matlab、Simulink仿真)
基于梯度优化算法(GBO)整定PID参数(Matlab、Simulink仿真)
|
8天前
|
考虑微电网灵活性的含分布式电源配电网二阶锥松弛最优潮流优化研究(Matlab代码实现)
考虑微电网灵活性的含分布式电源配电网二阶锥松弛最优潮流优化研究(Matlab代码实现)
batch size、sequence length 对显存的非线性影响
本文揭示大模型训练OOM的根源:batch size与sequence length并非独立线性因子,而是以乘法甚至平方(如attention的O(L²))方式非线性放大中间态显存。显存不是“用完”,而是被临界点“触发”崩溃。工程调优应优先关注单样本“重量”(length),而非盲目试探batch。
|
11天前
|
阿里云服务器多少钱一年?2026年新版阿里云服务器配置与价格表解析
在云计算应用日益普及的当下,阿里云服务器凭借稳定的性能、灵活的配置选择和覆盖广泛的地域支持,成为个人开发者、中小企业及大型企业数字化转型的重要基础设施。2026年,阿里云对服务器产品线进行了全面优化,推出了涵盖轻量应用服务器、ECS云服务器、GPU服务器等多个系列的产品,各系列在配置规格、价格定位和适用场景上形成了清晰的区分,满足不同用户的多样化需求。本文基于官方公布的配置参数与价格信息,对2026年阿里云服务器的产品体系、核心配置、价格标准及适用场景进行详细解析,为用户选择合适的服务器提供参考。
免费试用