今日热门论文推荐:MM-Eureka、FedRand、EasyControl、FEA-Bench

简介: 由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现代大语言模型(LLM)与人类文本的差异,尤其是在信息密集领域,展现了独特的写作风格,为ATD提供了新的见解和方法。

v2-55ac1631fa64ba3d35b4fb276a3fe9d1_1440w.gif

作者:InternLM、Qwen 等 LLM每日一览热门论文版,顶会投稿选题不迷惘。快来看看由「机智流」和「ModelScope」社区推荐的今日热门论文吧!


Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

论文链接:

https://modelscope.cn/papers/123418  

简要介绍:

由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现代大语言模型(LLM)与人类文本的差异,尤其是在信息密集领域,展现了独特的写作风格,为ATD提供了新的见解和方法。

核心图片:

image.png  


SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models

论文链接:

https://modelscope.cn/papers/125314  

简要介绍:

中国人民大学等团队提出了SEAP,一种无需训练的剪枝方法,通过选择性地保留与任务相关的参数,降低大语言模型推理成本。实验表明,SEAP在50%剪枝率下超越WandA和FLAP超20%,展现了高效性和可扩展性,为优化大规模LLM开辟了新路径。

核心图片:

image.png  


MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning

论文链接:

https://modelscope.cn/papers/125149  

简要介绍:

上海AI实验室等机构推出了MM-Eureka,将基于规则的大规模强化学习(RL)扩展到多模态推理。该模型在多模态数学任务中展现了视觉“顿悟时刻”,数据效率远超传统方法,且开源了完整pipeline,推动了多模态推理研究。

核心图片:


image.png


Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning

论文链接:

https://modelscope.cn/papers/125186  

简要介绍:

北京大学等团队提出了MMDiag数据集和DiagNote模型,旨在提升多模态大语言模型(MLLM)在多轮对话中的推理能力。受人类视觉处理启发,DiagNote通过“深思”和“注视”模块协同工作,显著提升了多模态信息整合能力。

核心图片:

image.png  


Automated Movie Generation via Multi-Agent CoT Planning

论文链接:

https://modelscope.cn/papers/124513  

简要介绍:

新加坡国立大学Show Lab提出了MovieAgent,通过多智能体Chain of Thought(CoT)规划实现自动化电影生成。给定剧本和角色库,该框架能生成连贯的多场景长视频,显著减少人工干预,开创了电影生成新范式。

核心图片:  

image.png


FedRand: Enhancing Privacy in Federated Learning with Randomized LoRA Subparameter Updates

论文链接:

https://modelscope.cn/papers/124596  

简要介绍:

由韩国研究团队开发的FedRand,通过随机选择LoRA子参数更新,增强了联邦学习(FL)的隐私保护。仅将非私有参数上传至服务器,该方法有效抵御成员推理攻击,同时保持高准确率。


EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

论文链接:

https://modelscope.cn/papers/124672  

简要介绍:

Tiamat AI等团队提出了EasyControl,为Diffusion Transformer(DiT)引入高效灵活的控制框架。通过轻量级LoRA模块和因果注意力机制,该方法提升了图像生成的效率和多样性,适用于多种应用场景。

核心图片:

image.png


FEA-Bench: A Benchmark for Evaluating Repository-Level Code Generation for Feature Implementation

论文链接:

https://modelscope.cn/papers/125249  

简要介绍:

微软亚洲研究院和北京大学合作推出了FEA-Bench,首个评估LLM在代码库级别增量开发能力的基准。基于83个GitHub仓库的PR数据,该基准揭示了LLM在特征实现任务中的挑战,推动了自动化软件工程研究。

核心图片:

image.png


AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning

论文链接:

https://modelscope.cn/papers/124998  

简要介绍:

华中科技大学等团队提出了AlphaDrive,将强化学习(RL)和推理能力融入视觉-语言模型(VLM),优化自动驾驶规划。引入GRPO奖励和两阶段训练策略,该方法显著提升了规划性能和安全性。

核心图片:

image.png


SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing

论文链接:

https://modelscope.cn/papers/123886  

简要介绍:

上海AI实验室等机构推出了SurveyForge,通过启发式大纲生成和记忆驱动的内容优化,自动化生成高质量综述论文。搭配SurveyBench基准,该框架在结构和引用质量上超越了AutoSurvey等现有工作。

核心图片:

image.png


今热门论文推荐就到这里结束啦,这些论文展现了AI在文本检测、隐私保护、自动驾驶等领域的最新突破,每一项都值得深入探索。喜欢这期内容?别忘了点赞、分享和关注我们,明天见!🌟

-- 完 --

欢迎在「机智流」公众号后台回复「cc」,加入机智流大模型交流群,与我们一起探索 AI 与人类潜能的未来,一起共赴 AI 浪潮!

目录
相关文章
|
小程序 前端开发 JavaScript
wxml与标准的html的异同
WXML(WeiXin Markup Language)是微信小程序的页面描述语言,用于描述小程序页面的结构。它与标准的 HTML 在一些方面有异同:
|
资源调度 监控 负载均衡
浅析PM2实用入门指南
PM2 是一个守护进程管理器,可以用它来管理你的node进程,负责所有正在运行的进程,并查看node进程的状态,也支持性能监控,负载均衡等功能。使用起来也是非常简单
2196 0
|
9月前
|
移动开发 Java 数据安全/隐私保护
2025年支付宝商户号获取密钥和ID的方式-操作优雅草卓伊凡
2025年支付宝商户号获取密钥和ID的方式-操作优雅草卓伊凡
1566 0
2025年支付宝商户号获取密钥和ID的方式-操作优雅草卓伊凡
|
运维 算法 安全
异常检测算法及其在安全领域的应用
【6月更文挑战第4天】在数字化时代,数据安全至关重要,异常检测算法扮演着守护者角色。它能自动学习正常行为模式,及时发现网络攻击和欺诈行为。非监督式异常检测算法尤其重要,如基于距离的方法,通过计算数据点间距离识别偏离常规的点。Python的scikit-learn库可实现这一算法。异常检测不仅应用于金融领域的欺诈检测,还广泛用于工业监控、医疗诊断和社交媒体分析,为多领域数据安全提供保障。随着技术进步,异常检测将更智能、高效,成为数据安全的重要防线。
487 2
|
存储 Prometheus 监控
|
监控 安全 物联网
5G技术的革命性进步及其对社会的影响
5G技术作为移动通信领域的革命性进步,正深刻地影响着我们的生活和社会。它不仅提供了更快的数据传输速率和更低的延迟,还将引领着各个领域的创新和发展。从移动通信、工业、医疗到智能城市,5G技术正在改变着我们的世界,为未来带来更多可能性。然而,我们也需要解决一些挑战,确保5G技术的安全和可持续发展。随着技术的不断进步,5G技术的前景依然充满希望,将为我们的社会带来更多的创新和变革。
1583 1
5G技术的革命性进步及其对社会的影响
|
安全 Java 网络安全
对象存储oss使用问题之使用oss上服务器后显示服务异常如何解决
《对象存储OSS操作报错合集》精选了用户在使用阿里云对象存储服务(OSS)过程中出现的各种常见及疑难报错情况,包括但不限于权限问题、上传下载异常、Bucket配置错误、网络连接问题、跨域资源共享(CORS)设定错误、数据一致性问题以及API调用失败等场景。为用户降低故障排查时间,确保OSS服务的稳定运行与高效利用。
2925 0
鼠标控制软件有可能和虚拟机软件产生冲突
Virtualbox虚拟机遭遇频繁卡顿和鼠标点击问题,尝试调整设置、更新Virtualbox及更换Win11操作系统未果。发现问题与X-Mouse Button Control软件冲突,卸载该软件后问题解决,推测是其功能与Virtualbox的鼠标集成存在冲突。
336 2
|
5G 索引
频域结构 | 带你读《5G 空口设计与实践进阶 》之十九
在频域,为满足多样带宽需求,NR 支持灵活可扩展的 Numerology。这相应也决定了 NR 在频域资源上的物理量度是可变的。
频域结构 | 带你读《5G 空口设计与实践进阶 》之十九

热门文章

最新文章