|
12月前
|
自然语言处理 并行计算 PyTorch
|

智源开源FlagOS升级:首次实现DeepSeek-R1满血版多种芯片高效快速部署

近日,DeepSeek-R1以低训练成本实现比肩一流模型的高性能并全面开源,引发了海量部署及场景应用,推理计算需求迅猛增长。

387 6
|
12月前
|
消息中间件 缓存 弹性计算
|

纯PHP+MySQL手搓高性能论坛系统!代码精简,拒绝臃肿

本内容分享了一套经实战验证的社交系统架构设计,支撑从1到100万用户的发展,并历经6次流量洪峰考验。架构涵盖客户端层(App、小程序、公众号)、接入层(API网关、负载均衡、CDN)、业务服务层(用户、内容、关系、消息等服务)、数据层(MySQL、Redis、MongoDB等)及运维监控层(日志、监控、告警)。核心设计包括数据库分库分表、多级缓存体系、消息队列削峰填谷、CQRS模式与热点数据动态缓存。同时提供应对流量洪峰的弹性伸缩方案及降级熔断机制,并通过Prometheus实现全链路监控。开源建议结构清晰,适合大型社交平台构建与优化。

433 11
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层

本文深入解析了大模型三大核心技术:输入编码、多头自注意力机制和前馈网络层,从应用视角阐述了它们的工作原理和协同效应。输入编码负责将文本转换为富含语义和位置信息的数学表示;多头自注意力机制通过多专家团队模式建立全局依赖关系,解决长距离依赖问题;前馈网络层则通过非线性变换进行深度语义消歧。文章通过可视化示例展示了词向量的语义关系建模、注意力权重的分布模式以及前馈网络的语义过滤功能,形象地说明了大模型如何通过这三层架构实现"广泛联系-深度加工"的认知过程。

213 5
|
4月前
|
缓存 Java Nacos
|

Java微服务架构实践:从搭建到优化的全流程指南

本文介绍Java微服务架构的搭建与优化,涵盖服务拆分、Spring Cloud生态、注册发现、配置中心、容错机制及性能提升策略,助力构建高效、稳定、可扩展的分布式系统。

271 1
|
4月前
|
存储 前端开发 Java
|

Java 项目实战入门:从 0 到 1 搭建简易在线图书商城系统

本文以简易在线图书商城系统为例,详解Java Web项目从需求分析、数据库设计到部署的完整开发流程。涵盖用户管理、图书查询、购物车、订单等核心功能,采用主流框架与技术栈,贴近企业实际,助力Java初学者掌握实战技能,提升项目开发能力。

133 0
|
4月前
|
监控 Java 测试技术
|

OOM排查之路:一次曲折的线上故障复盘

本文记录了一次Paimon数据湖与RocksDB集成服务线上频繁OOM的排查历程。通过分析线程激增、内存缓慢泄漏等现象,结合MAT、NMT、async-profiler等工具,最终定位到RocksDB JNI调用导致堆外内存泄漏,并通过架构优化解决。分享排查思路与工具使用,为类似问题提供借鉴。

100 0
|
4月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍敏捷开发中关键的工时评估方法——人日估算,涵盖开发、自测、联调、测试及发布各阶段周期参考,并提供常见需求如增删改查、导入导出、跨服务调用等的人日评估标准,助力团队科学规划迭代进度。

106 0
|
4月前
|
存储 人工智能 运维
|

UModel PaaS API 架构设计与最佳实践

UModel PaaS API 通过“表-对象-元数据”三层抽象,屏蔽底层复杂性,统一可观测数据访问。支持 SPL 一键查询、实体方法调用与 AI 自主探索,降低开发门槛,提升运维效率。

100 0
|
4月前
|
边缘计算 分布式计算 安全
|

Linux 为何能稳居服务器领域主流操作系统宝座

自1991年诞生以来,Linux凭借开源、稳定、高效和完善的生态,成为服务器、云计算、嵌入式等领域的主导操作系统。其免费可定制的特性降低企业成本,高安全性与稳定性支撑金融、云服务等关键业务,资源占用低助力云计算与边缘计算高效运行,广泛兼容主流软硬件,构建起强大的产业生态,持续赋能全球数字经济发展。

187 0
|
4月前
|
NoSQL MongoDB
|

文档的插入

MongoDB支持单个或批量插入文档。使用`insert()`或`insertMany()`向集合添加数据,未指定`_id`时自动生成,支持多种数据类型,注意整型需用`NumberInt`,日期用`new Date()`,键名遵循UTF-8规范且不可重复。

156 0
|
4月前
|
存储 安全 C语言
|

C 语言实用标准库与工具函数使用指南:提升开发效率的核心技巧

本文系统梳理C语言开发中10类常用工具函数,涵盖标准库(stdio.h、string.h、stdlib.h等)核心函数与自定义工具,结合代码案例详解输入输出、字符串处理、内存管理、文件操作等场景的用法与注意事项,帮助开发者提升效率、避免常见错误。

276 0
|
4月前
|
分布式计算 安全 Java
|

Java为何能稳居企业级开发主流语言宝座

Java自1995年诞生以来,凭借跨平台性、强大生态、高安全稳定、丰富人才储备及持续迭代,在企业级开发中始终占据核心地位,广泛应用于金融、电商、大数据等领域,未来仍将保持技术主流地位。

146 0
|
4月前
|
开发者
|

业务架构图

本文介绍了业务架构图的核心概念与绘制方法,涵盖业务定义、架构分层(业务、应用、数据、技术)、分层分模块分功能的拆解逻辑,以及信息流设计,旨在帮助理解业务本质并提升客户与开发者间的沟通效率。

108 0
|
4月前
|
安全 数据安全/隐私保护
|

什么是权限管理

权限管理包含认证与授权两大核心:认证验证用户身份,授权分配操作权限。通过角色叠加实现菜单访问控制,保障系统安全,避免越权操作与数据泄露。

139 0
|
4月前
|
Java 测试技术 调度
|

小结

本文介绍XXL-JOB任务调度框架的使用,包括其核心组成、任务编写与配置方法。通过@XxlJob注解定义任务,结合Cron表达式实现定时调度,并支持BEAN和GLUE两种模式。重点讲解分片广播任务,利用分片参数实现分布式环境下任务的高效并行处理,提升系统性能与扩展性。

281 3
来自: 语音  版块
|
6月前
|
机器学习/深度学习 人工智能 文字识别
|

全新框架 Glyph 开源:用视觉理解文本,3–4 倍上下文压缩,近 5 倍推理提速!

清华CoAI与智谱AI提出Glyph新范式,将长文本渲染为图像,通过视觉语言模型实现高效长上下文处理。3-4倍压缩比,性能媲美主流大模型,显存占用降2/3,低成本支持百万token任务,开源可商用。

876 26
|
6月前
|
缓存 自然语言处理 PyTorch
|

114_预训练:Masked LM优化与动态掩码效率深度解析

在大型语言模型(LLM)的预训练阶段,训练目标函数的设计直接影响模型的学习效率和最终性能。Masked Language Modeling(MLM)作为BERT等模型采用的核心预训练任务,通过随机掩盖文本中的部分token并让模型预测这些被掩盖的token,有效地训练了模型的双向表示能力。然而,传统的静态掩码策略存在重复率高、训练效率低等问题。动态掩码技术的引入显著提升了预训练效率和模型性能。本文将全面探讨MLM优化策略,深入推导动态掩码的效率提升原理,并介绍2025年最新的MLM优化技术,为高效预训练LLM提供理论和实践指导。

653 0
|
6月前
|
存储 机器学习/深度学习 自然语言处理
|

108_连续微调:链式任务适应

在大模型时代,如何让预训练模型高效地适应多个相关任务,同时保持知识的连贯性和完整性,成为了一个重要的研究方向。连续微调(Continual Fine-tuning)作为一种新兴的微调范式,通过链式任务适应(Sequential Task Adaptation)机制,实现了模型在顺序学习多个任务时的知识保留和迁移。本文将深入探讨连续微调的核心原理、实现方法、关键技术挑战以及2025年的最新研究进展,为读者提供全面的技术指导和实践指南。

235 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

123_自监督任务变体:Causal LM详解 - GPT-style下一词预测机制与训练优化

2025年,自监督学习已成为大型语言模型(LLM)训练的核心范式,其中因果语言建模(Causal Language Modeling, CLM)作为GPT系列模型的基础训练目标,展现出了卓越的生成能力和下游任务迁移性能。与掩码语言建模(Masked Language Modeling, MLM)不同,因果语言建模专注于预测序列中的下一个词元,这种训练方式自然地适应了自回归生成的需求,为文本生成、对话系统等任务奠定了坚实基础。

544 1
|
6月前
|
机器学习/深度学习 缓存 并行计算
|

90_推理优化:性能调优技术

随着大型语言模型(LLM)规模的不断扩大和应用场景的日益复杂,推理性能已成为制约模型实际部署和应用的关键因素。尽管大模型在各项任务上展现出了令人惊艳的能力,但其庞大的参数量和计算需求也带来了严峻的性能挑战。在资源受限的环境中,如何在保持模型效果的同时,最大化推理性能,成为了研究人员和工程师们亟待解决的核心问题。

478 0
|
6月前
|
数据采集 人工智能 监控
|

61_自定义基准:构建专属评测体系

在大型语言模型(LLM)快速发展的今天,通用基准测试如MMLU、C-Eval等已成为评估模型能力的重要工具。然而,随着LLM在各个行业的深度应用,通用基准往往无法准确反映模型在特定领域、特定任务上的真实表现。2025年,构建企业或组织专属的自定义评测基准已成为大模型落地应用的关键环节。

422 0
|
7月前
|
人工智能 安全 开发者
|

全网寻!魔搭社区×小红书科技「模法师创造营」等你加入!

寻找和魔搭、@科技薯 并肩同行的「模」法师 代码之外,一起成为技术布道师!

170 1
|
7月前
|
Kubernetes Devops API
|

从零到面试高手:每个 DevOps 专业人士都必须知道的 20 个 Kubernetes 架构问答

Kubernetes 是当前 DevOps、云原生和 SRE 领域的关键技能。本文总结了 20 个高频面试问题,涵盖架构组件、工作原理及核心概念,助你轻松掌握 Kubernetes 基础,提升面试与实战能力。

360 2
|
7月前
|
监控 Devops 持续交付
|

从 DevOps 文化到以平台为中心的交付

DevOps 工程师与平台工程师在软件交付中各司其职。DevOps 强调开发与运维协作,推动自动化与文化变革;平台工程则聚焦构建自助式内部开发者平台,提升开发效率与一致性。两者相辅相成,共同加速高质量软件交付。

299 1
|
8月前
|
物联网
|

直播预告 | Qwen-lmage 技术分享+实战攻略直播

通义千问团队最新开源的图像生成模型 Qwen-Image,凭借其出色的中文理解与文本渲染能力,自发布以来获得了广泛关注与好评。

387 0
|
8月前
|
物联网 开发者
|

LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法

为了充分挖掘魔搭社区 Diffusion LoRA 模型的潜力,我们开发了一个自动 LoRA 检索与融合框架:AutoLoRA。他可以根据输入的文本提示,从 LoRA 候选池中检索到 个与提示词相关的LoRA,然后通过集成一个门控融合模块在生成图片的时候促进多个 LoRA 协同工作,充分发挥各个 LoRA 的能力。

311 0
|
8月前
|
物联网
|

API-Inference怎么使用LoRA

162 0
|
9月前
|
存储 人工智能 调度
|

上海创智学院联合无问芯穹发布Megrez2.0,本征架构突破端模型不可能三角,以终端算力撬动云端智能

终端是实现数字智能和生命智能自由交互的重要接口,持续帮助人类拓展生产能力的边界。当下,终端智能面临着“能效-空间-智能”的不可能三角:以DeepSeek-R1为例,其参数规模高达6710亿,超出了大部分笔记本电脑的内存容量;即使勉强在一台笔记本电脑上成功运行满血版模型,理论上坚持不到9分钟就会耗尽电池;如果通过蒸馏,将满血版模型压缩到更小尺寸,此时的精度损失又可能满足不了智能水平的要求。

204 0
|
9月前
|
机器学习/深度学习 人工智能 算法
|

通义WebSailor开源,首个挑战BrowseComp基准的开源网络智能体!

WebSailor网络智能体可以应用复杂场景下的检索任务,对于模糊问题可迅速在不同的网页中进行快速检索并推理验证,从而在海量信息中通过严密的多步推理和交叉验证中最终得出检索答案。

669 0
|
9月前
|
云安全 人工智能 安全
|

2025·全球AI攻防挑战赛启动选手招募:图、视、音三赛道逐鹿,推动AI安全技术进化

7月10日,2025·全球AI攻防挑战赛正式启动选手招募,邀请国内外的AI安全攻防精英参与全模态的AI攻防实战演练。本次大赛将重点关注数字身份交互认证安全,特别是在生活、金融和健康等场景下的应用。比赛分为图片、视频和音频三个赛道,采用攻防闭环的赛程设计,打破传统的静态攻防模式,推动安全技术的持续进化和发展。

165 0
|
9月前
|
人工智能 资源调度 数据可视化
|

ModelScope魔搭25年7月发布月报

七月流火,这个夏天火热的开场已然揭开。6月30号,我们在北京举办了首届魔搭开发者大会(ModelScope DevCon 2025),邀请了国内外知名的开源模型,以及头部开源工具的研发团队,与广大开发者共聚一堂进行分享。顶尖的AI 模型首次从线上 Hub走进线下盛会,为大家呈现了一场“模型全明星”盛会。同时我们还邀请了社区开发者参加我们的“搭友之夜”(aka 大规模面基大会)。大会分享场场爆满,现场只能用一句话来描述:“好~多~人~啊”,不提前占位根本挤不进去~~

479 3
|
9月前
|
数据采集 人工智能 自然语言处理
|

OpenCSG中文数据集助推CMU无分词器模型登顶SOTA

语言模型正迎来划时代的技术跃迁!传统Transformer架构依赖分词器(tokenizer)的范式即将被颠覆,一种全新的端到端建模方式正在崛起。

185 1
|
9月前
|
人工智能 自然语言处理 物联网
|

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

近日,Jina AI 正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。

1177 2
|
10月前
|
人工智能 安全 算法
|

十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

近日,国家数据局举办了2025“数据要素×”首场新闻发布会。

378 9
|
11月前
|
物联网
|

“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

“一丹一世界”三等奖 | 木刻时光·细密风 经验分享

234 7
|
12月前
|
机器学习/深度学习 人工智能 物联网
|

开源8B参数全能扩散模型Flex.2-preview:把线稿变商稿,还能边画边改!

Flex.2-preview是Ostris开源的80亿参数文本到图像扩散模型,支持512token长文本输入和多类型控制引导,内置修复功能并兼容主流AI绘画工具链。

671 3
来自: 多模态  版块
|
12月前
|
人工智能 自然语言处理 运维
|

超强辅助!Bolt.diy 自然语言建站工具一键云端部署方案

Bolt.diy 是一款从创意到部署的极速开发工具,支持多语言模型(如 OpenAI、DeepSeek 等)灵活适配,满足不同任务需求。其模块化架构提供高度定制化能力,可扩展自定义服务与私有模型。全栈开发流程覆盖代码生成、调试、版本管理到一键部署,内置数据库管理与 API 自动生成功能。智能化辅助工具实时分析代码错误并提供建议,帮助开发者高效理解复杂项目。基于云原生平台 CAP 构建,支持快速部署与实时预览,适用于快速原型设计、教育及企业级开发等场景。

300 1
|
12月前
|
存储 人工智能 数据库
|

Cloudflare推出托管式RAG服务!AutoRAG:从数据上传到索引更新全程托管,文档变动自动同步

AutoRAG是Cloudflare推出的全托管检索增强生成服务,基于自动索引和向量化技术,帮助开发者快速构建上下文感知的AI应用,无需管理底层基础设施。

396 0
|
12月前
|
机器学习/深度学习 人工智能 决策智能
|

推理速度开挂!谷歌推出 Gemini 2.5 Flash:在保持Gemini 2.5精度的同时,延迟降低到竞品的1/3

谷歌最新推出的Gemini 2.5 Flash AI模型在保持低延迟和成本效益的同时,通过引入思考能力为开发者解锁了智能代理构建、代码辅助等新应用场景。

472 1
来自: 自然语言处理  版块
|
2月前
|
人工智能 数据可视化 文件存储
|

MIT开源 首款P2P-AIBridge工具 OoderNexus 发布

Nexus是基于OoderAgent V0.6.5的可视化开发套件,旨在降低P2P AI通信门槛。它提供设备管理(路由器/NAS/智能家居)、SkillFlow编排、场景配置等示例界面,让开发者快速构建SuperAgent分发系统,实现AI能力的直观调用与扩展。(239字)

159 2
|
3月前
|
存储 算法 搜索推荐
|

生物共振:智能体领航员重塑你的生理秩序

智能体领航员,是守护“生物主权”的生理副驾:以节律导航、代谢副驾、感官复苏三大维度,实时感知并调谐身体节律、营养与感官;恪守生物隐私、直觉首发、非医疗三原则,在数字洪流中助你重拾碳基生命的自愈力与生命张力。(239字)

103 6

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

1
今日
15211
内容
6
活动
4104
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互