|
5月前
|
负载均衡 应用服务中间件 Nacos
|

Nacos配置中心

本文详细介绍Nacos作为配置中心的实现原理与实践,涵盖配置管理、热更新、共享配置及优先级规则,并演示集群搭建与高可用部署,助力微服务架构下配置的集中化、动态化管理。

252 0
|
5月前
|
人工智能 物联网 测试技术
|

ModelScope魔搭社区发布月报 -- 25年12月

魔搭社区12月重磅更新DeepSeek 3.2、Mistral-3等模型,Z-Image-Turbo引领文生图生态,平台全面升级加速开源模型落地。

765 8
|
6月前
|
人工智能 文字识别 物联网
|

ModelScope魔搭社区发布月报 -- 25年11月

魔搭ModelScope三周年庆!见证开源大模型从追赶到领跑,11月硬核更新不断:Qwen3-VL、MiniMax-M2等新模态齐发,AIGC生态爆发,OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会,不见不散!

800 5
|
7月前
|
机器学习/深度学习 自然语言处理 前端开发
|

Ling-1T,智渊、思简

今天,我们正式发布Ling 2.0系列的第一款 旗舰非思考模型 - 拥有万亿参数的Ling-1T。推理,是智能的核心表达,更是通用智能体的认知基石。因此,我们持续扩展Ling 2.0 系列模型的自然语言推理能力。Ling-1T沿用 Li…

951 9
|
7月前
|
存储 安全 API
|

73_安全配置:LLM开发环境的全面防护指南

在2025年的AI开发环境中,大型语言模型(LLM)已成为核心技术,但伴随其广泛应用的是日益严峻的安全挑战。据统计,2025年第一季度发生的AI安全事件中,LLM环境配置不当导致的漏洞占比高达43%,造成的损失超过2.1亿美元。本文将深入探讨LLM开发环境的安全配置最佳实践,帮助开发者构建一个安全、可靠的开发环境。

811 0
|
7月前
|
存储 机器学习/深度学习 监控
|

69_云端开发:SageMaker与Colab

在2025年的大模型开发环境中,云端开发平台已经成为开发者的首选。随着大模型规模的不断扩大,本地开发环境往往难以满足训练和推理的需求,而云端平台提供了强大的计算资源、灵活的扩展能力和便捷的协作功能。在众多云端开发平台中,Amazon SageMaker和Google Colab凭借各自的优势,成为了大模型开发者最常用的两个选择。

526 0
|
8月前
|
分布式计算 测试技术 Spark
|

科大讯飞开源星火化学大模型、文生音效模型

近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。

728 2
|
9月前
|
SQL 人工智能 自然语言处理
|

魔搭社区模型速递(8.2-8.8)

🙋魔搭ModelScope本期社区进展:📟2268个模型📁165个数据集;🎨78个创新应用📄 13篇内容

686 0
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

微调与推理:解锁大模型定制化能力的核心密钥

本文深入浅出讲解大模型微调与推理的核心原理与实践:微调(如LoRA)让通用模型适配垂直场景,推理则实现价值落地。以LLaMA为例,手把手演示数据准备、平台微调、在线测试与效果评估,零代码门槛,助初学者快速打造专属AI模型。(239字)

275 1
|
3月前
|
人工智能 自然语言处理 数据可视化
|

OoderAI BridgeCode 产品白皮书——全方位赋能企业编程升级

ooderAI BridgeCode 是面向企业的AI确定性代码框架解决方案,通过自学习能力生成专属代码、无缝衔接新旧系统、优化AI时代工作流,并提供128个开源可视化组件。开源无绑定、Web化易用,助力企业降本增效、灵活转型。(239字)

591 1

什么是幂等

幂等性指操作执行一次或多次结果一致。读操作(如HTTP GET)不改变数据,天然幂等;写操作(如POST、PUT、DELETE)可能改变状态,需额外机制保障幂等。

359 1
|
5月前
|
存储 算法 BI
|

xxljob本地运行

本文介绍XXL-JOB分布式任务调度框架的部署与使用,涵盖源码获取、服务端数据库配置、客户端注册及任务调度配置,支持多种路由策略与分片广播,助力高效实现定时任务管理。

187 0
|
5月前
|
缓存 前端开发 API
|

Python 开发进阶:从初级到全栈工程师的能力提升路径

本文系统梳理了Python开发者从初级到全栈的进阶路径,涵盖框架深度应用、性能优化、架构设计、容器化部署及DevOps实践。通过分阶段技能升级与真实项目落地,助力开发者突破“脚本思维”,构建全链路工程能力,实现从“会编码”到“能交付完整系统”的质变跨越。(238字)

306 1
|
5月前
|
Dubbo 应用服务中间件 Apache
|

WebService

基于 Apache CXF 实现的 Dubbo WebService 协议,支持多连接、短连接、HTTP 同步传输,采用 SOAP 文本序列化,适用于系统集成与跨语言调用。兼容标准 WebService 服务,可实现双向互操作。需配置 Jetty 或 Servlet 容器,支持 WSDL 访问与直连调用。

272 0
|
5月前
|
缓存 前端开发 API
|

Python 开发进阶:从初级到全栈工程师的能力提升路径

本文系统梳理了Python开发者从初级到全栈的进阶路径:突破脚本思维,掌握框架原理、性能优化与工程化实践;通过分阶段技能升级与真实项目演练,逐步构建全链路开发能力,实现从“会写代码”到“独立交付完整系统”的跨越。

374 0
|
5月前
|
设计模式 算法 Java
|

Java 学习进阶书单:从基础到架构,循序渐进提升技术栈

一份涵盖Java基础、并发、JVM、算法、数据库、框架、架构等12大方向的精选书单,每本书均附精准定位与阅读建议,助力Java程序员高效进阶,少走弯路。

662 0
|
6月前
|
人工智能 前端开发 关系型数据库
|

MajorRAG 概述(1/3)

一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法

321 1
来自: 自然语言处理  版块
|
7月前
|
机器学习/深度学习 人工智能 文字识别
|

全新框架 Glyph 开源:用视觉理解文本,3–4 倍上下文压缩,近 5 倍推理提速!

清华CoAI与智谱AI提出Glyph新范式,将长文本渲染为图像,通过视觉语言模型实现高效长上下文处理。3-4倍压缩比,性能媲美主流大模型,显存占用降2/3,低成本支持百万token任务,开源可商用。

991 26
|
7月前
|
缓存 API 调度
|

70_大模型服务部署技术对比:从框架到推理引擎

在2025年的大模型生态中,高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂,如何在有限的硬件资源下实现高性能、低延迟的推理服务,成为了所有大模型应用开发者面临的核心挑战。

949 0
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

100_RLHF(人类反馈强化学习)原理与实践

在大型语言模型(LLM)的发展历程中,我们见证了模型从简单的文本生成工具,逐渐演变为能够理解复杂指令、进行多轮对话、甚至展示创造性思维的智能系统。然而,这一进化并非仅仅依靠模型规模的增大和数据量的增加,更重要的是训练方法的创新。其中,人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)作为一种革命性的训练范式,在2022年随着ChatGPT的问世而广受关注,并在随后的GPT-4、Claude、Gemini等先进模型中得到广泛应用。

916 3
|
8月前
|
机器学习/深度学习 并行计算 小程序
|

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性( Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制…

978 0
|
8月前
|
人工智能 关系型数据库 数据库
|

公募REITs专属AI多智能体查询分析项目

公募REITs专属AI多智能体查询分析项目。本项目是基于 OpenAI Agent 框架的多智能体项目,提供二级市场数据查询分析、招募说明书内容检索、公告信息检索、政策检索等多板块查询服务。支持图标绘制、文件生成。

373 2
|
9月前
|
人工智能 物联网 API
|

ModelScope魔搭25年8月发布月报

🔥 这个夏天,开源热潮比气温更燃!Qwen3、GLM4.5、混元、Wan2.2、Qwen-Image等重磅模型密集发布,MoE、多模态、Agent、生图视频全爆发,ModelScope 全程 Day0 支持,生态持续进化中!

691 0
|
9月前
|
机器人 容器 Docker
|

100%由Qwen3-Coder独立编程!工业级RAGFlow聊天机器人实战,故障诊断提速300%

RAGFlow Chatbot 是一个集成了 RAGFlow 技术的智能问答系统,专注于 LCD 彩膜制造领域的专业知识。该系统能够回答关于工艺诊断、缺陷分析、材料验证和设备优化等方面的问题,为工程师和技术人员提供快速准确的知识支持。 功能特性 🤖 基于 RAGFlow 的智能问答系统 💬 实时流式响应,支持思考过程展示 📚 对话历史记录与管理 🔍 搜索历史对话 📤 导出对话记录 🧠 深度思考模式 🌐 响应式设计,支持移动端 🌙 深色主题支持

873 0
|
10月前
|
机器学习/深度学习 前端开发 数据可视化
|

Kimi K2 开源发布:擅长代码与 Agentic 任务!

今天,月之暗面正式发布 Kimi K2 模型,并同步开源。Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。

1602 0
|
11月前
|
存储 人工智能 文字识别
|

Nanonets-OCR-s开源!复杂文档转Markdown SoTA,颠覆复杂文档工作流

Nanonets团队开源了 Nanonets-OCR-s,该模型基于Qwen2.5-VL-3B微调,9G显存就能跑。

1107 2
|
11月前
|
机器学习/深度学习 算法 API
|

MiniMax-M1开源:支持百万级上下文窗口的混合MoE推理模型!

MiniMax最新发布了全球首个开源大规模混合架构的推理模型——MiniMax-M1!

800 0
|
11月前
|
机器学习/深度学习 自然语言处理 安全
|

ACL 2025 | GALLa:用图结构增强代码大模型,让代码理解更精准!

通过级联多模态架构将代码结构图对齐到大模型表征中

839 69
来自: 自然语言处理  版块
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

PPO 应用 —— 大模型偏好优化的核心场景与落地思路

本文详解PPO算法在大模型RLHF落地中的核心应用:聚焦对话风格、客服话术、内容生成、安全合规、垂直领域及多模态六大场景,强调“偏好定制化”价值。全程无代码,提供4步落地法与3大实操要点,助力企业高效实现大模型优化。(239字)

352 11
|
3月前
|
人工智能 JSON API
|

开源开放被集成:魔搭OpenAPI上新,广泛链接社区生态

ModelScope正式推出OpenAPI与OAuth 2.0开放服务,覆盖模型、数据集、MCP及用户信息四大核心板块,支持自动化发现、集成与管理AI资源。接口遵循OpenAPI规范,提供标准REST能力与安全授权机制,助力开发者低门槛构建AI应用、CI/CD流水线及Agentic智能体系统,践行“AI基础设施即代码”理念。(239字)

557 6
|
4月前
|
运维 安全 API
|

内网系统IP离线数据库搭建与维护完整方案

本方案面向无外网内网环境,提供IP离线数据库全生命周期部署指南,涵盖规划、搭建、维护与应急,支持内网IP自定义映射、高并发查询与安全合规,实现数据自主可控、运维闭环,适配多规模企业架构。

452 1
|
5月前
|
传感器 网络协议 编译器
|

C 语言为何能稳居底层开发主流语言宝座

自1972年诞生以来,C语言凭借极致性能、直接操控硬件的能力及完善的生态,在嵌入式系统、操作系统等底层开发领域始终占据核心地位,成为近半个世纪不可替代的编程基石。

256 0
|
5月前
|
存储 编译器 开发工具
|

C 语言项目实战入门:从 0 到 1 搭建简易学生信息管理系统

本文以“简易学生信息管理系统”为例,系统讲解C语言项目开发全流程,涵盖需求分析、数据结构设计、模块化编码、文件操作与调试优化,帮助初学者掌握结构体、指针、动态内存管理等核心技能,实现学生信息的增删改查与持久化存储,夯实C语言实战基础。

361 0
|
5月前
|
存储 算法 安全
|

C 语言初学者常见 10 大误区与避坑指南

本文总结C语言初学者常见的10类错误,涵盖语法、内存管理、指针、字符串等方面,结合案例分析成因,提供实用解决方案,帮助新手建立正确编程思维,提升学习效率,夯实基础,少走弯路,顺利迈向嵌入式与底层开发。

310 0
|
5月前
|
SQL 监控 机器人
|

钉钉通知

11

320 0
|
5月前
|
XML JSON fastjson
|

JSONUtil

提供常用数据结构与JSON互转工具方法,涵盖数组、对象、Map、List、字符串及XML与JSON间的相互转换,使用Hutool、Fastjson等工具简化操作,提升开发效率。

185 0
|
5月前
|
安全 Java 开发工具
|

SpringSecurity工程搭建与验证

本文介绍如何基于阿里云脚手架快速搭建SpringBoot工程(选用2.7.6版本),并整合Spring Security。内容涵盖项目创建、代码导入、Web依赖引入、接口编写与验证,以及Security依赖添加后的登录认证测试,最终实现安全访问控制。完整代码见GitHub仓库Day01分支。

127 0
|
5月前
|
安全 Java 大数据
|

Java为何能稳居企业级开发主流语言宝座

Java自1995年诞生以来,凭借跨平台性、强大生态、高安全性与稳定性,持续领跑企业级开发。JVM实现“一次编写,到处运行”,Spring等框架提升开发效率,GC机制保障系统稳定,丰富工具链覆盖大数据、云计算等领域。加之人才储备充足、开发规范成熟,Java不断迭代适应新技术,长期占据核心地位。

392 0
|
5月前
|
SQL Dubbo Java
|

线程池:故障梳理总结

本文从故障与技术双重视角,总结线程池满导致服务不可用的典型案例与根因,涵盖数据库慢查询、连接池配置不当、超时设置缺失等问题,分享fast-fail理念、流控背压、谨慎重试等最佳实践,助力开发者提升系统稳定性。

159 0
|
5月前
|
Java 关系型数据库 MySQL
|

[MES]数据库改造H2到MySQL(☆☆)

本文介绍如何运行克隆项目代码并迁移数据库,涵盖Git、Maven、SpringBoot等技术栈。要求从Gitee克隆代码,配置JDK与Maven环境,运行项目并思考问题解决方式,最终将H2内存库迁移到MySQL,适应实际开发需求。

304 0
|
5月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍敏捷开发中工时评估方法,以“人日”为单位,针对开发、自测、联调、测试及发布各阶段提供参考周期,并列举常见需求如Excel导入导出、单表增删改查、跨服务调用等的典型人日估算,助力团队科学规划迭代进度。

198 1
|
5月前
|
SpringCloudAlibaba Java Nacos
|

SpringCloud概述

Spring Cloud是微服务一站式解决方案,具备注约大于配置、组件丰富、开箱即用等特点。其版本以地铁站命名,避免与子项目冲突。Spring Cloud Alibaba融合Nacos、Sentinel、Seata等阿里开源组件,提供更完整、经生产验证的微服务生态,成为当前主流技术选型。

426 0
|
5月前
|
存储 安全 前端开发
|

1.认识OAuth2.0

OAuth2.0是一种开放授权协议,允许第三方应用在用户授权下访问其资源,而无需获取用户账号密码。相比传统授权更安全,广泛用于第三方登录、服务间资源共享等场景,支持授权码、简化、密码及客户端四种模式,其中授权码模式最安全,适用于Web应用;简化模式适合无后端的前端应用;密码模式用于高度信任的服务间调用;客户端模式则用于系统间内部通信。Spring Security OAuth2可实现单点登录与服务权限控制。

366 0
|
5月前
|
人工智能 JSON 自然语言处理
|

短难误判率仅2%,新一代网关路由SHG,在P95不升前提下完胜RouteLLM。

在和 RouteLLM 的两档式对比中 RouteLLM 将约百分之 69.3 的短难请求路由至轻量模型,而本文提出的网关系统将短难请求中落入轻档的比例压缩到约 2.4%,整体 P95 几乎不变。实验表明,短难请求构成了一类独立且在实践中高度相关的 LLM 路由稳健性问题,而针对性的、常数级开销的守护机制可以在不增加整体成本和尾部延迟的前提下,大幅缓解这一问题。

473 0
|
6月前
|
机器学习/深度学习 编解码 JSON
|

混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA

腾讯混元推出全新开源OCR模型HunyuanOCR,仅1B参数,基于原生多模态架构,实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越,支持14种小语种翻译,广泛适用于票据抽取、视频字幕识别等应用,多项指标达业界SOTA水平。

847 8
|
7月前
|
机器学习/深度学习 人工智能 监控
|

143_成本优化:Spot实例与预留实例云资源节省计算详解与最佳实践

在云原生时代,成本优化已成为企业IT基础设施管理的核心挑战之一。随着AI和机器学习工作负载的激增,云资源成本占企业IT预算的比例持续上升,如何在保证服务质量的同时实现显著的成本节约,成为技术团队面临的紧迫问题。根据最新的Datadog云成本报告显示,截至2025年,平均有83%的容器支出被闲置资源浪费,而GPU实例支出在过去一年中增长了40%,已占计算成本的14%。在这样的背景下,深入理解和应用Spot实例和预留实例等成本优化策略,对于任何使用云服务的组织都具有重大的经济意义。

709 9
|
7月前
|
机器学习/深度学习 人工智能 安全
|

60_隐私保护模型:联邦学习变体

在当今数字化时代,数据隐私保护已成为人工智能发展中不可忽视的核心议题。随着大型语言模型(LLM)规模的不断扩大,其对训练数据的需求也呈指数级增长,这使得数据隐私与模型性能之间的矛盾日益凸显。2025年,联邦学习作为一种创新的分布式学习范式,正在重塑LLM的训练和部署方式,允许多方在保护数据隐私的前提下共同构建高性能模型。

328 0
|
7月前
|
缓存 人工智能 并行计算
|

59_实时性模型:选择低延迟LLM

在当今快速发展的人工智能领域,大型语言模型(LLM)的应用正迅速渗透到各个行业。随着企业对AI响应速度的要求不断提高,低延迟LLM的选择与优化已成为技术团队面临的关键挑战。实时聊天机器人、智能客服、自动驾驶辅助系统等场景对响应时间提出了极高的要求,毫秒级的延迟差异可能直接影响用户体验和业务效率。2025年,随着推理优化技术的突破性进展,低延迟LLM已不再是难以企及的目标,而是成为实际生产环境中的标准配置。

564 0
|
7月前
|
并行计算 PyTorch 算法框架/工具
|

74_调试技巧:OOM与性能瓶颈

在大型语言模型(LLM)的开发与部署过程中,内存溢出(Out of Memory,简称OOM)错误和性能瓶颈问题是开发者经常面临的两大挑战。随着模型规模的不断扩大(从最初的BERT、GPT-2到现在的GPT-4、Claude 3等千亿甚至万亿参数的模型),这些问题变得更加突出。据2025年最新的开发者调查报告显示,超过78%的LLM开发者在模型训练或推理过程中遇到过OOM错误,而性能瓶颈则影响了约65%的生产环境部署。

691 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4194
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互