RocketMQ:底层Netty频繁OS OOM
本文记录了一例Java应用因多ClassLoader加载多个Netty的PooledByteBufAllocator导致堆外内存超限、触发OS OOM的排查过程。通过NMT、Arthas等工具分析,发现7个不同类加载器各自实例化独立的分配器,均不受MaxDirectMemorySize全局限制,最终总堆外内存远超预期。根因在于Netty使用Unsafe直接申请内存,绕过JVM监管。短期建议调低堆内存以腾出空间,长期需中间件协同优化。
MajorRAG文件内容提取实现分析(2/3)
一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法 博客地址:https://zhangcraigxg.github.io
UI-Ins:让 GUI 智能体真正“看懂”用户指令的新范式
通义实验室联合人大发布全新GUI Grounding模型UI-Ins,首创“指令即推理”范式,通过多视角动态推理实现SOTA性能,在五大基准全面领先,支持开源复现与应用。
106_模型合并:Task Arithmetic
在大语言模型(LLM)时代,模型合并技术正在成为高效整合不同模型能力的关键方法。随着开源模型的爆发式增长,如何在不进行昂贵的重新训练的情况下,将多个专用模型的知识整合到一个统一模型中,成为了研究和工业界的重要课题。Task Arithmetic作为一种新兴的模型合并方法,通过向量操作实现权重融合,为这一挑战提供了创新解决方案。
123_自监督任务变体:Causal LM详解 - GPT-style下一词预测机制与训练优化
2025年,自监督学习已成为大型语言模型(LLM)训练的核心范式,其中因果语言建模(Causal Language Modeling, CLM)作为GPT系列模型的基础训练目标,展现出了卓越的生成能力和下游任务迁移性能。与掩码语言建模(Masked Language Modeling, MLM)不同,因果语言建模专注于预测序列中的下一个词元,这种训练方式自然地适应了自回归生成的需求,为文本生成、对话系统等任务奠定了坚实基础。
128_自我监督变体:SimCLR for Text - 推导对比学习的文本应用,代码实现无标注预训练的独特目标
在大型语言模型快速发展的今天,自我监督学习已成为训练高质量模型的核心技术。然而,传统的掩码语言建模(MLM)和因果语言建模(CLM)方法存在一些局限性,如计算效率低下和上下文利用不充分等问题。对比学习作为一种新兴的自我监督学习范式,通过学习相似性和差异性来提取数据的内在表示,为语言模型预训练提供了新的思路。
89_批量推理:异步API调用
在当今数据密集型应用和大模型部署的时代,批量推理已成为提升系统性能和资源利用率的关键技术。随着深度学习模型规模的不断扩大和应用场景的日益复杂,如何高效地处理大量推理请求成为技术团队面临的重要挑战。传统的同步API调用方式在面对高并发、大规模数据处理时,往往会遇到响应延迟高、资源利用不充分等问题。异步API调用作为一种更高效的处理模式,通过非阻塞操作和并发处理能力,为批量推理场景提供了理想的解决方案。
腾讯混元 3D 世界模型家族又添新成员Voyager:支持超长距离漫游
9 月 2 日,腾讯混元宣布,其3D世界模型系列最新成员——HunyuanWorld-Voyager(简称混元Voyager)发布并开源,这将推动AI在空间智能领域的应用扩展,为虚拟现实、物理仿真、游戏开发等领域提供高保真3D场景漫游能力,加速行业应用落地。
当AI学会跑跳抓:来云栖大会,参加一场“具身智能运动会”
一副AI眼镜帮你实时智能识别、一只机器狗陪你跑跨栏、一条机械臂听你指挥、一场与机器人的点球大战——这可不是科幻电影,这是2025云栖大会即将上演的现实。
2025·全球AI攻防挑战赛启动选手招募:图、视、音三赛道逐鹿,推动AI安全技术进化
7月10日,2025·全球AI攻防挑战赛正式启动选手招募,邀请国内外的AI安全攻防精英参与全模态的AI攻防实战演练。本次大赛将重点关注数字身份交互认证安全,特别是在生活、金融和健康等场景下的应用。比赛分为图片、视频和音频三个赛道,采用攻防闭环的赛程设计,打破传统的静态攻防模式,推动安全技术的持续进化和发展。
OpenCSG中文数据集助推CMU无分词器模型登顶SOTA
语言模型正迎来划时代的技术跃迁!传统Transformer架构依赖分词器(tokenizer)的范式即将被颠覆,一种全新的端到端建模方式正在崛起。
双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件 极简验证
双 Transformer + 双神经符号做核心,用类脑突触耦合中间层做动态配对,嵌入 DeepSeek 的 Engram 和 MHC 补长程和记忆短板,也不知道行不行。
C 语言微服务架构实践:从模块化到轻量级分布式的探索
本文探讨C语言在微服务架构中的实践路径,通过“模块化拆分+进程通信”实现轻量级分布式系统,适用于嵌入式与物联网等资源受限场景,结合MQTT协议支持跨设备协作,虽缺乏高级特性,但凭借高效、低耗优势,可作为特定场景下微服务的有力补充。
Java 项目实战入门:从 0 到 1 搭建简易在线图书商城系统
本文以简易在线图书商城系统为例,详解Java Web项目从需求分析、数据库设计到部署的完整开发流程。涵盖用户管理、图书查询、购物车、订单等核心功能,采用主流框架技术栈,适合Java初学者实战入门,助力掌握企业级开发技能。
一场FullGC故障排查
本文记录了一次Java应用CPU使用率异常升高的排查过程。通过分析发现,问题由Full GC频繁触发导致,根源在于将大Excel文件解析为List<Map>结构后长期驻留JVM内存,造成堆内存膨胀、空间利用率低。结合JProfiler工具定位大对象,最终通过优化数据存储方式解决GC问题,总结出一套线上性能问题排查思路。
EFC&CTO:缓存引发数据不一致问题排查与深度解析
EFC客户端在NAS场景下因缓存架构更新引发CTO测试data mismatch问题。经排查,发现分布式缓存中版本号(dv)回退导致读取旧的NULL数据,污染pagecache并最终写坏文件系统。根本原因为慢请求返回覆盖了最新版本号,修复方案为丢弃回退的版本号。通过日志分析与流程复现确认问题,并结合内核行为深入理解POSIX接口实现细节,最终解决数据不一致难题。