|
1月前
|
安全 Java 数据库连接
|

如何在Java代码中处理数据库连接异常

在Java中,合理处理数据库连接异常对程序稳定性至关重要。需捕获`ClassNotFoundException`和`SQLException`等具体异常,使用`try-with-resources`自动释放资源,结合日志记录与用户友好提示,并可引入重试机制应对网络波动,提升系统容错能力。

202 1
|
2月前
|
Docker 容器
|

创空间什么时候支持docker?

创空间目前尚未正式支持Docker,尽管界面已显示Beta选项,但暂不可用。具体上线时间请关注官方更新公告。

112 1
|
2月前
|
数据采集 自然语言处理 并行计算
|

128_自我监督变体:SimCLR for Text - 推导对比学习的文本应用,代码实现无标注预训练的独特目标

在大型语言模型快速发展的今天,自我监督学习已成为训练高质量模型的核心技术。然而,传统的掩码语言建模(MLM)和因果语言建模(CLM)方法存在一些局限性,如计算效率低下和上下文利用不充分等问题。对比学习作为一种新兴的自我监督学习范式,通过学习相似性和差异性来提取数据的内在表示,为语言模型预训练提供了新的思路。

197 2
|
2月前
|
机器学习/深度学习 监控 PyTorch
|

126_自定义损失:多目标训练 - 设计加权损失的独特平衡策略

在2025年的大型语言模型(LLM)训练领域,多目标学习已成为提升模型综合性能的关键技术之一。传统的单一损失函数训练方法逐渐显现出局限性,尤其在处理复杂的语言理解、生成和推理任务时。多目标训练通过同时优化多个互补的学习目标,能够显著提升模型的泛化能力、知识保留和任务适应性。

149 3
|
2月前
|
人工智能 监控 Kubernetes
|

77_自动化脚本:Makefile与Airflow

在当今AI大模型时代,高效的工作流管理对于模型训练、推理和部署至关重要。随着大模型规模的不断增长和复杂度的提升,传统的手动脚本管理方式已无法满足需求。自动化脚本和工作流调度系统成为构建健壮、可重复、可扩展的LLM Pipeline的关键工具。其中,Makefile作为经典的自动化构建工具,与Airflow作为现代工作流调度平台的结合,为LLM开发团队提供了强大的工作流管理能力。

110 0
|
2月前
|
人工智能 缓存 自然语言处理
|

95_跨任务提示:一次提示完成多种任务

在大语言模型(LLM)应用开发中,我们常常面临需要处理多个相关任务的场景。传统方法是为每个任务单独设计提示并调用API,这不仅增加了开发复杂度,还会导致token消耗增加和响应延迟累积。跨任务提示(Multi-Task Prompting)作为一种高效的提示工程技术,能够在单个提示中集成多个相关任务,让LLM一次调用完成多种处理需求。

108 0
|
2月前
|
人工智能 自然语言处理 安全
|

43_PaLM与Gemma:谷歌LLM演进

在人工智能发展的浪潮中,谷歌一直扮演着关键的技术引领者角色。从最初的神经机器翻译到如今的通用人工智能,谷歌通过持续的技术创新推动着自然语言处理领域的边界不断拓展。2022年,谷歌推出了革命性的PaLM(Pathways Language Model),这一模型不仅在规模上达到了前所未有的5400亿参数,更重要的是其采用了创新的Pathways训练方法,为大型语言模型的发展开辟了新路径。随后,谷歌又推出了Gemma系列开源模型,将先进的AI技术普惠给更广泛的开发者社区。

220 2
|
3月前
|
异构计算
|

资源部署与调用相关技术咨询

313 0
已解决
|
5月前
|
SQL XML 缓存
|

控制接口RT暴降80%!CompletableFuture异步编排实战代码模板

Springboot 控制接口RT暴降80%!CompletableFuture异步编排实战代码模板

164 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI 加速科学发现丨Al For Science 专场直播

AI 科学家时代正加速到来,但科研智能体真的做好准备了吗?真实科研场景中,多模态智能体能否在推理、规划与执行等关键能力上达到人类科研人员的水平?我们又该如何准确评估它们的科学认知能力和数据分析表现?

149 0
|
5月前
|
人工智能 JSON 小程序
|

【AI编程】AI+高德MCP不到10分钟搞定上海三日游

本文介绍了小白如何通过AI编程工具(如Trae)快速开发应用并实现技术变现。内容涵盖AI编程用途、工具准备、高德地图开发者权限获取、AI工具配置及实战生成旅游攻略与打印页面,帮助零基础用户轻松入门AI编程。

253 0
|
5月前
|

送福利!FlowBench客户端首批内测邀请函

魔搭AIGC搭子们,集合啦!ModelScope x FlowBench 团队

208 3
|
7月前
|
并行计算 异构计算 算法框架/工具
|

Funasr GPU2.0.0部署推理,RTF达不到0.0008,连0.0076都达不到。

223 0
来自:语音 版块
|
7月前
|
人工智能 物联网 数据处理
|

“一丹一世界”三等奖 | 曙光_麦橘超然 创作分享

“一丹一世界”三等奖 | 曙光_麦橘超然 创作分享

193 0
|
8月前
|
机器学习/深度学习 算法 NoSQL
|

记录转大模型—InitCommit

嗯,写点东西记录一下转大模型的经历。

180 14
来自: 自然语言处理  版块
|
8月前
|
人工智能 自然语言处理 运维
|

超强辅助!Bolt.diy 自然语言建站工具一键云端部署方案

Bolt.diy 是一款从创意到部署的极速开发工具,支持多语言模型(如 OpenAI、DeepSeek 等)灵活适配,满足不同任务需求。其模块化架构提供高度定制化能力,可扩展自定义服务与私有模型。全栈开发流程覆盖代码生成、调试、版本管理到一键部署,内置数据库管理与 API 自动生成功能。智能化辅助工具实时分析代码错误并提供建议,帮助开发者高效理解复杂项目。基于云原生平台 CAP 构建,支持快速部署与实时预览,适用于快速原型设计、教育及企业级开发等场景。

195 1
|
8月前
|
人工智能 文字识别 自动驾驶
|

突破自动驾驶"交规困境":高德&西交发布交规+高精地图基准MapDR,车道级交通规则在线理解,让AI更懂交规!

作为专业领先的出行和位置服务提供商,高德地图以数据准确率高、鲜度高著称。当前自动驾驶技术总是关注到矢量地图的构建,往往忽略了车道级驾驶规则的制作。对应图商而言,车道级的领航不仅需要有正确的车道级矢量表达,还要明确每条路的驾驶规则,保证引导的准确率。

295 2
|
9月前
|
机器学习/深度学习 人工智能 搜索推荐
|

今日论文推荐:DeepMesh、TULIP、Cube、STEVE及LEGION

由上海 AI 实验室、西安交通大学等机构提出的 φ-Decoding,是一种全新的推理时间优化策略。该工作通过前瞻采样和聚类技术,平衡了探索与利用的关系,显著提升了大语言模型(LLM)的推理性能。实验表明,其在七个基准测试中超越了强基线,且具备跨模型通用性和计算预算扩展性。

200 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

RWKV-7革新序列建模,Impossible Videos探索超现实,Creation-MMBench点燃创意火花: 今日论文

由 RWKV 项目(Linux Foundation AI & Data)和 EleutherAI 等机构提出的 RWKV-7 "Goose",是一种全新的序列建模架构。它在30亿参数规模上刷新了多语言任务的下游性能纪录,媲美顶级英文语言模型,同时仅需恒定内存和推理时间。核心创新包括广义delta规则和上下文学习率优化,超越了传统Transformer的表达能力。作者还开源了3.1万亿token的多语言数据集和代码,助力社区研究。

222 3
|
9月前
|
机器学习/深度学习 人工智能 算法
|

热门论文推荐:TPDiff、Block Diffusion、Reangle-A-Video、GTR

由新加坡国立大学Show Lab的Lingmin Ran和Mike Zheng Shou提出,TPDiff是一个创新的视频扩散模型框架,针对视频生成的高计算需求问题,通过分阶段逐步提高帧率优化了训练和推理效率。核心贡献包括提出“时间金字塔”方法和阶段式扩散训练策略,实验表明训练成本降低50%,推理效率提升1.5倍。

155 0
|
9月前
|
人工智能 自然语言处理 自动驾驶
|

AVD2:清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架

AVD2 是由清华大学联合多所高校推出的自动驾驶事故视频理解与生成框架,结合视频生成与事故分析,生成高质量的事故描述、原因分析和预防措施,显著提升自动驾驶系统的安全性和可靠性。

205 6
来自: 计算机视觉  版块
|
9月前
|
人工智能 自然语言处理 算法
|

打造跨语言智能工具与应用,“万卷·丝路”专项课题开放申请

随着共建“一带一路”进入高质量发展阶段,全球开发者对于多语言模型训练的需求不断增长,上海AI实验室联合大模型语料数据联盟成员发布了“万卷·丝路”多语言预训练语料库,为多语言大模型训练提供高质量数据支撑,助力全球开发者构建跨语言智能工具与应用。

211 4
|
10月前
|
自然语言处理 开发者
|

GDC2025 | 探索最前沿的开源大模型技术与创新,2025全球开发者先锋大会,上海见!

2025全球开发者先锋大会将于2月21-23日在徐汇盛大召开!大会以“模塑全球 无限可能”为主题,定位“社区的社区”,旨在促进基模、垂模、语料、算力、基金、开发者、软件服务等产业生态深度对接。

378 0
|
10月前
|
人工智能 小程序 机器人
|

GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛,来了!(预赛报名)

欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。

344 3
|
10月前
|
机器学习/深度学习 人工智能 编解码
|

FlashVideo:生成1080p视频仅需102秒,字节联合港大推出低成本高分辨率视频生成框架

FlashVideo 是字节跳动和香港大学联合推出的高分辨率视频生成框架,通过两阶段方法显著降低计算成本,快速生成高质量视频。

409 5
来自: 计算机视觉  版块
|
10月前
|
机器学习/深度学习 人工智能 API
|

Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术

介绍北大团队提出的 Aligner 模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差,提升大语言模型的性能。

432 28
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 算法
|

Edicho:多图像一致性编辑,支持即插即用无需训练,快速实现风格转换

Edicho 是蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法,基于扩散模型,支持即插即用,无需额外训练,适用于多种图像编辑任务。

251 8
来自: 计算机视觉  版块
|
11月前
|
人工智能 搜索推荐
|

PersonaMagic:人像与风格融合!快速生成个性化的头像

PersonaMagic 是一种创新的高保真人脸定制技术,通过阶段调节的文本条件策略和动态嵌入学习,能够根据单张图像生成个性化角色,广泛应用于娱乐、游戏、影视等领域。

250 25
来自: 计算机视觉  版块
|
12月前
|
机器学习/深度学习 人工智能 编解码
|

CLEAR:新加坡国立大学推出线性注意力机制,使8K图像的生成速度提升6.3倍,显著减少了计算量和时间延迟

新加坡国立大学推出的CLEAR线性注意力机制,通过局部注意力窗口设计,显著提升了预训练扩散变换器生成高分辨率图像的效率,生成8K图像时提速6.3倍。

277 18
来自: 计算机视觉  版块
|
12月前
|
人工智能 算法 决策智能
|

CompassArena上新!JudgeCopilot与新一代Bradley-Terry模型竞技体验

2024 年 5 月,上海人工智能实验室司南 OpenCompass 团队携手魔搭 ModelScope,联合推出了大模型评测平台——CompassArena(大模型竞技场),为大模型领域引入了一种全新的竞技模式。

298 6
|
3月前
|
人工智能 安全 开发者
|

全网寻!魔搭社区×小红书科技「模法师创造营」等你加入!

寻找和魔搭、@科技薯 并肩同行的「模」法师 代码之外,一起成为技术布道师!

131 1
|
3月前
|
人工智能 开发者
|

外滩大会报名 | 破局 AI 时代,洞察大模型开源开发全景、趋势与机遇

当 AI 浪潮以肉眼可见的速度重塑全球技术格局,大模型的迭代如浪涌般此起彼伏,开发者们在开源社区的每一次代码提交、每一次项目引用,都在悄然勾勒着行业未来的走向。如何在纷繁复杂的技术演进中,看清 AI 生态的全景与未来?一场围绕大模型开源开发趋势的深度对话已蓄势待发。

124 0
|
3月前
|
人工智能 开发者 异构计算
|

魔搭勋章权益全面升级,免费工位+魔搭周边+GPU时长…统统安排!

亲爱的搭搭搭塔子们~(不是)你听说了吗?现在魔搭社区要给每一位搭友发!福!利!

127 1
|
4月前
|
人工智能 云栖大会
|

9.24-9.26,与魔搭,云栖见!

2025 杭州·云栖大会,来了!9月24日至26日,杭州·云栖小镇

125 0
|
4月前
|
SQL 人工智能 自然语言处理
|

魔搭社区模型速递(8.2-8.8)

🙋魔搭ModelScope本期社区进展:📟2268个模型📁165个数据集;🎨78个创新应用📄 13篇内容

318 0
|
4月前
|
人工智能 大数据 数据库
|

8月23日南京Unstructured Data Meetup 启动

8月23日,南京场Unstructured Data Meetup 将在阿里中心·南京建邺 江苏省南京市建邺区沙洲街道新城科技园科技创新综合体A2栋举办。

115 0
|
5月前
|
SQL 分布式计算 DataWorks
|

我把ODPS当朋友用,它却一直当我命根子

本文讲述了作者在数据处理工作中与 ODPS 从“无奈使用”到“深度依赖”的真实心路历程。面对业务压力、系统崩溃、任务延迟等现实问题,ODPS 以稳定、高效的性能成为作者最可靠的“搭档”。文章通过多个实战场景,展现了 ODPS 在日常数据处理中的实用价值,也道出了技术人对“稳定”与“结果”的执着追求。

106 4
|
5月前
|
数据采集 人工智能 自然语言处理
|

OpenCSG中文数据集助推CMU无分词器模型登顶SOTA

语言模型正迎来划时代的技术跃迁!传统Transformer架构依赖分词器(tokenizer)的范式即将被颠覆,一种全新的端到端建模方式正在崛起。

120 1
|
5月前
|
人工智能 PyTorch API
|

利用OpenVINO™高效推理MiniCPM4系列模型

面壁智能正式发布端侧MiniCPM 4.0 模型,实现了端侧可落地的系统级软硬件稀疏化的高效创新。

184 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

1
今日
14487
内容
6
活动
3794
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互