机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
70344内容
|
3天前
|
关于LLM-as-a-judge范式,终于有综述讲明白了
《From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge》探讨了大型语言模型(LLM)在评估和判断任务中的应用。传统方法存在不足,而LLM凭借强大的语言理解和生成能力,展现了广阔的应用前景。论文从输入输出角度定义LLM-as-a-judge,提出三维度分类体系,并汇编评估基准,指出关键挑战如偏见、可解释性和对抗性攻击,展望未来改进方向,强调其潜力与价值。论文链接:https://arxiv.org/abs/2411.16594
|
3天前
|
DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了
DeepMind提出“Socratic Learning”新范式,基于语言游戏实现大模型自我博弈学习,突破传统数据限制。该方法通过智能体与自身对话和辩论改进知识技能,具有高数据效率、强可扩展性和良好对齐性等优势,但也面临时间成本、对齐风险及领域限制等挑战。论文链接:https://arxiv.org/abs/2411.16905
|
3天前
| |
来自: 弹性计算
万亿参数模型训练神器:Kubeflow 2025量子加速版下载与TPU集群配置详解
Kubeflow 2025 是一个云原生机器学习操作系统,实现了四大突破性创新:量子混合训练(支持经典-量子混合神经网络协同计算)、神经符号系统集成(融合深度学习与逻辑推理引擎)、边缘智能联邦(5G MEC节点自动弹性扩缩容)和因果可解释性框架(集成Pearl、DoWhy等工具链)。该平台通过混合计算架构、先进的硬件配置矩阵和量子增强型安装流程,提供了从基础设施预配置到核心组件安装和安全加固的完整部署方案。此外,Kubeflow 2025 还涵盖全生命周期开发实战案例、智能运维监控体系、安全与合规框架以及高阶调试技巧,帮助用户高效构建和管理复杂的机器学习项目。
魔搭社区模型速递(3.2-3.8)
🙋魔搭ModelScope本期社区进展:1340个模型,220个数据集,🎨91个创新应用,📄 8篇内容
|
4天前
|
《DeepSeek三阶训练法:在文化创作模型中舞动套路与创新之弦》
在人工智能快速发展的背景下,DeepSeek的“三阶训练法”为文化创作类模型训练带来革新。该方法通过数据摄取、强化拓展和生成反馈三个阶段,巧妙平衡了套路化与创新性。第一阶段模型广泛学习基础套路;第二阶段引入对抗学习与多样化训练,激发多元化创作;第三阶段通过反馈优化,确保作品既符合规范又具创新性。这一方法为文化创作注入新活力,助力AI在文学、艺术等领域绽放光彩。
|
4天前
|
《DeepSeek-R1 “人性化”交互:情感计算是幕后真英雄》
在人工智能快速发展的今天,DeepSeek-R1以其卓越的“人性化”交互设计备受关注。这种设计使机器能像人类一样理解并回应情感需求,提供自然、舒适的交流体验。其背后是否依赖情感计算技术成为热议话题。情感计算通过分析语言、表情等信息,使AI感知并回应用户情绪,这与DeepSeek-R1的表现高度契合。尽管它还依赖其他技术如深度学习和多轮对话管理,但情感计算无疑为其提供了重要支持,使其在众多AI产品中脱颖而出。未来,情感计算将在AI人性化交互中发挥更大作用。
|
4天前
|
《代码生成中梯度对齐的普适性探索:余弦相似度阈值0.92是万能钥匙!》
在数字化浪潮中,代码生成技术正重塑软件开发格局。梯度对齐机制通过协调参数更新优化模型性能,余弦相似度≥0.92的阈值在特定场景(如SQL生成)表现出色,但在面向对象编程等复杂任务中可能限制灵活性。数据集规模、质量和多样性以及模型架构和训练方法也影响阈值普适性。未来需探索动态、自适应的阈值设定,以实现更高效、智能的代码生成。
|
4天前
|
基于DeepSeek的多媒体应用技术探索与实践
随着人工智能技术的快速发展,深度学习在多媒体领域的应用日益广泛。DeepSeek作为一种先进的深度学习框架,凭借高效的计算能力和灵活的模型构建方式,逐渐成为多媒体处理中的重要工具。本文将深入探讨DeepSeek在图像处理、视频分析、音频处理等方面的应用,并结合代码示例展示其技术实现。DeepSeek支持多种神经网络架构,提供丰富的预训练模型和易于使用的API,适用于图像分类、目标检测、视频分类、动作识别、语音识别等任务。未来,DeepSeek有望在多模态学习、自监督学习和模型压缩与加速等方面取得突破,推动多媒体处理技术的进一步发展。
免费试用