|
3月前
|
人工智能 数据可视化 物联网
|

[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3

本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型,仅需Kaggle免费T4显卡,速度提升2–5倍、显存节省60%;三步实现“灵魂认主”,让模型自认“AlgiebaLLM AI”,全程代码简洁,零基础可上手。

1001 7
来自: 自然语言处理  版块
|
6月前
|
人工智能 Cloud Native 前端开发
|

详细教程 PhpStorm 2025.1 安装+ 激活中文配置,附安装包

PhpStorm 2025.1 全新升级,深度支持 PHP 8.3+/8.4,强化 AI 助手、Xdebug 调试与 .env 嵌套变量,提升全栈开发效率,打造现代化 PHP 开发利器。

1206 0
|
3月前
|
缓存 架构师 前端开发
|

MiniMax M2.5 开源,低成本Agent时代来了!社区Day0部署、工具调用、推理&提示词参数实战来啦!

2月13日,MiniMax发布M2.5大模型,108天内三连更!编程(SWE-Bench 80.2%)、搜索(BrowseComp 76.3%)、办公场景全面领先,开源权重已上线ModelScope,支持API调用、本地部署及工具调用。

3786 7
|
3月前
|
人工智能 语音技术 芯片
|

MiniCPM-o 4.5 CookBook:9B 参数玩转多模态全双工交互

MiniCPM-o 4.5是9B参数多模态大模型,支持图像、视频、音频、文本输入与高质量文/语音输出。具备领先视觉理解(OpenCompass平均77.6分)、实时中英双语语音对话、全双工流式交互、高精度OCR及30+语言能力,适配CPU/GPU/国产芯片,支持本地部署与微调。(239字)

978 5
|
24天前
|
人工智能 Java 数据库
|

DeepAgents 人工介入实战|LangGraph 实现 Agent 高危工具人工审批

本文详解基于 LangChain+LangGraph+DeepAgents 实现 Python 智能体人工介入实战,配置高风险工具中断审批、状态检查点保存与恢复,支持同意 / 拒绝 / 参数编辑,对比 Spring AI Alibaba 方案,附完整可运行源码与生产落地建议。

268 0
|
5月前
|
NoSQL 算法 Java
|

项目《天机学堂》

天机学堂是一个非学历职业技能在线培训平台,核心业务为售卖课程并提供学习辅助与交互功能。技术栈涵盖SpringBoot、Redis、RabbitMQ等。本人负责需求分析、数据库设计及通用工具封装,如基于Redisson实现分布式锁组件,支持注解式加锁、锁类型切换与限流;并参与开发高性能视频进度记录系统,通过缓存+异步持久化方案实现秒级精度回放,有效降低数据库压力。

854 0
|
5月前
|
搜索推荐 物联网 异构计算
|

一张图秒生 LoRA ? Qwen-Image-i2L 诞生记

我们发布了Qwen-Image的“图生LoRA”模型,输入一张图即可端到端生成LoRA权重。通过多阶段迭代,构建了具备细节与风格保持能力的Image-to-LoRA系统,可用于高效LoRA训练初始化,推动个性化生成技术发展。

1052 0
|
18天前
|
人工智能 自然语言处理 算法
|

2026年运营岗正在分层:懂AI应用的运营和只会排期的运营差距有多大

2026年运营岗加速分层:一类陷于排期催单,另一类借AI做用户洞察、内容生成、活动复盘与工作流提效。效率、价值与晋升差距显著拉大。真正稀缺的是“AI协作力”——懂Prompt、会搭工作流、能落地RAG/Agent。推荐考取CAIE注册人工智能工程师(Level I),零基础友好、企业认可度高,助运营从执行者跃升为业务增长关键接口人。

242 1
|
3月前
|
机器学习/深度学习 存储 人工智能
|

[大模型实战 03] 拆解 Transformers:从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理(注意力机制+位置编码),在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”(Config/Tokenizer/Model),并详解Temperature与Top_p两大生成调控参数,助你真正理解并掌控大模型推理。

1081 12
来自: 自然语言处理  版块
|
7月前
|
人工智能 自然语言处理 监控
|

58_大模型评估与评测:构建科学的多维度评测体系

在大语言模型(LLM)技术飞速发展的今天,如何科学、全面地评估和评测这些模型的能力已成为学术界和工业界共同关注的核心问题。2025年,大模型生态系统呈现出百花齐放的态势,从参数规模、架构设计到应用场景都出现了多样化的发展路径。在这种背景下,单一的性能指标或评测方法已经无法满足对大模型进行全面评估的需求。

1983 0
|
5月前
|
负载均衡 算法 架构师
|

Ribbon负载均衡

本节深入讲解Ribbon实现客户端负载均衡的原理,解析@LoadBalanced注解的作用机制,介绍负载均衡分类、算法及Ribbon自定义策略与饥饿加载优化,帮助读者全面掌握Ribbon在Spring Cloud中的应用与底层逻辑。(238字)

420 0
|
1月前
|
人工智能 JSON Java
|

Spring AI Alibaba + MCP:调用MCP市场公开服务实操

本文详细讲解Spring Ai Alibaba调用MCP市场公开服务的全流程,以高德地图MCP服务为例,包含API-Key申请、客户端配置、代码实操,助力开发者快速掌握Spring Ai Alibaba与MCP服务对接技巧。

568 7
|
4月前
|
人工智能 机器人 Linux
|

保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手

OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!

10629 24
|
3月前
|
自然语言处理 测试技术 Python
|

小红书开源发布 FireRed-Image-Edit 1.0:高质量训练数据,性能屠榜三项核心评测

2月14日,小红书FireRedTeam开源FireRed-Image-Edit-1.0图像编辑模型。该模型在ImgEdit、GEdit等基准测试中全面超越现有开源方案,风格迁移(4.97分)等维度甚至优于Nano-Banana、Seedream4.0等闭源模型,支持文本保留、老照片修复、多图虚拟试衣等能力。

1268 6
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
|

Python 学习资源精选:从入门到精通的高效清单

本文系统梳理Python从入门到精通的学习路径,分阶段推荐优质资源:入门夯实语法,进阶掌握核心特性,定向深耕Web、数据、AI等领域,最终提升工程化能力。精选视频、书籍、项目与工具,助力高效学习。

1923 1
|
10天前
|
机器学习/深度学习 人工智能 安全
|

蚂蚁·安诊儿医疗大模型:6.1B激活即登顶三大医疗榜单,魔搭在线体验已开放

蚂蚁·安诊儿医疗大模型(AntAngelMed)是由浙江省卫健委与蚂蚁集团联合打造的全球首个开源千亿级医疗大模型。基于Ling-flash-2.0 MoE架构,仅激活6.1B参数即达40B稠密模型性能,推理超200 tokens/s,在HealthBench、MedAIBench等权威测评中全面领先,已开放API与权重下载。

194 3
|
24天前
|
JSON API PHP
|

韩国股票实时数据 KOSPI(主板)和 KOSDAQ(创业板)的实时行情、K 线及指数数据

StockTV API全面支持韩国股市,覆盖KOSPI主板(exchangeId=60)与KOSDAQ创业板(110),提供实时行情、K线、指数等数据。需配置countryId=11及API密钥,支持HTTP/WS双协议,含PHP对接示例与关键注意事项。

269 6
|
3月前
|
人工智能 缓存 Java
|

[大模型实战 03预备] 云端炼丹房 1:Google Colab 上手指南

本文教你用免费Google Colab(Tesla T4 GPU)解决本地显存不足、无法运行7B+大模型的痛点;通过挂载Google Drive持久化保存模型,避免运行时重置丢失;手把手配置云端环境,为后续RAG实战打下坚实基础。(239字)

890 6
来自: 自然语言处理  版块
|
5月前
|
NoSQL JavaScript 前端开发
|

如何写好一个简历项目

本文分享面试中项目经验的撰写要点,强调项目名称、周期、团队、核心业务及个人职责的规范表达,建议突出技术难点与真实业务场景,避免学生式项目,提升求职竞争力。

824 0
|
10月前
|
人工智能 JavaScript API
|

零基础构建MCP服务器:TypeScript/Python双语言实战指南

作为一名深耕技术领域多年的博主摘星,我深刻感受到了MCP(Model Context Protocol)协议在AI生态系统中的革命性意义。MCP作为Anthropic推出的开放标准,正在重新定义AI应用与外部系统的交互方式,它不仅解决了传统API集成的复杂性问题,更为开发者提供了一个统一、安全、高效的连接框架。在过去几个月的实践中,我发现许多开发者对MCP的概念理解透彻,但在实际动手构建MCP服务器时却遇到了各种技术壁垒。从环境配置的细节问题到SDK API的深度理解,从第一个Hello World程序的调试到生产环境的部署优化,每一个环节都可能成为初学者的绊脚石。因此,我决定撰写这篇全面的实

2375 67
|
4月前
|
人工智能 自然语言处理 C++
|

写小说时,Claude 4.0 和 4.5 的差别在哪里?

本文对比Claude Sonnet 4.0与4.5在小说创作中的实际表现,聚焦人物一致性、剧情连续性与长期可控性。基于Anthropic官方能力说明及多轮实测,指出4.5在多阶段续写、逻辑连贯性与风格稳定性上显著提升,更适配中长篇连载场景,助力AI写作从“能写”迈向“能长期写”。(239字)

1293 9
来自: 自然语言处理  版块
|
5月前
|
物联网 开发者
|

Z-Image Turbo LoRA训练魔法:如何保持加速生图能力

ModelScope DiffSynth团队推出Z-Image-Turbo-DistillPatch,解决LoRA训练后丢失Turbo加速问题。支持8步高质量生成,兼容标准SFT流程,即插即用,无需重训。开源地址:modelscope.cn/models/DiffSynth-Studio/Z-Image-Turbo-DistillPatch

1840 2
|
3月前
|
人工智能 边缘计算 分布式计算
|

阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!

阶跃星辰发布开源大模型Step 3.5 Flash:专为Agent设计,推理速度达350 TPS,支持256K长上下文,采用稀疏MoE+MTP-3+混合注意力架构,在数学与Agent任务上媲美闭源模型,现已全量开放使用。

2189 2
|
3月前
|
数据采集 监控 物联网
|

大模型微调实战——从数据准备到落地部署全流程

本文以7B大模型为例,手把手教你零代码完成办公场景微调:从数据清洗、LoRA轻量训练到效果验证与一键部署,全程无需GPU和编程基础,30分钟快速上手,解决“通用模型不精准、输出不可控”痛点,让大模型真正落地业务。

1422 13
|
5月前
|
存储 缓存 安全
|

One Trick Per Day

初始化Map应避免直接指定大小,建议使用Guava的newHashMapWithExpectedSize或手动计算容量。禁止使用Executors创建线程池,易导致OOM,推荐通过ThreadPoolExecutor或Guava方式,明确设置队列与线程数。Arrays.asList返回不可变集合,禁用增删操作。遍历Map优先使用entrySet或JDK8的forEach。SimpleDateFormat非线程安全,避免static共享,可使用ThreadLocal或Java 8新时间API。并发修改记录时,建议采用乐观锁(如version)或加锁机制,冲突概率低时优选乐观锁且重试不少于3次。

418 0
|
8天前
|
机器学习/深度学习 自然语言处理 数据可视化
|

可计算元认知文本分析:癌症经济学语义基线的构建与边界信号检测

本研究首次为癌症经济学建立了可计算的语义基线,揭示该学科围绕费用 保险 财务负担的政策导向核心特征,并量化了自付费用、财务毒性、保险缺口等关键边界信号。相较于传统综述,本工作从“学科如何说话”的元认知视角提供了 结构化、可复现、跨学科对齐的计量基准,为卫生政策评价、资源配置决策以及跨领域对话提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症经济学;卫生政策;文本分析

101 0
|
3月前
|
机器学习/深度学习 人工智能 算法
|

首个2步LoRA!2步实现Qwen-Image-2512高质量图片生成

阿里智能引擎推出Qwen-Image-2512-Turbo,将扩散模型压缩至仅2步生成,提速40倍——5秒内输出4张2K图,效果媲美原模型。融合Reverse-KL蒸馏、热启动与对抗学习,显著提升细节与真实性。已开源,支持ModelScope、呜哩AI及ComfyUI。

1260 1
|
3月前
|
JSON 文字识别 API
|

百度文心开源0.9B参数 PaddleOCR-VL-1.5,全球首个支持异形框定位的文档解析模型!

百度文心开源新一代文档解析模型PaddleOCR-VL-1.5:仅0.9B参数,在OmniDocBench v1.5达94.5%精度,全球首个支持异形框定位,精准识别倾斜、弯折、反光等“歪文档”,集成印章识别、多语种(含藏语/孟加拉语)及古籍解析能力,推理速度超MinerU2.5达43%。(239字)

1015 2
|
4月前
|
并行计算 监控 安全
|

高效 GPU 加速:DeepSeek-R1 系列模型在 llama.cpp 上的生产级部署指南

本文详解如何在RTX 30/40系显卡上,通过llama.cpp高效部署DeepSeek-R1-8B模型。涵盖CUDA镜像选择、GPU卸载调优、显存控制与高可用架构,结合Docker、Prometheus监控及负载均衡,实现低延迟、高吞吐的生产级推理,助力大模型落地应用。

1819 6
|
3月前
|
人工智能 算法 测试技术
|

Boss直聘开源Nanbeige4.1-3B:小模型全能新标杆

Boss直聘南北阁实验室发布Nanbeige4.1-3B:一款仅3B参数的“小而全”统一模型,首次在同规模中系统整合强推理、人类偏好对齐与深度搜索Agent能力,性能超越Qwen3-32B等大模型,已开源权重、技术报告及合成数据。

1217 5
|
7月前
|
监控 安全 数据安全/隐私保护
|

55_大模型部署:从云端到边缘的全场景实践

随着大型语言模型(LLM)技术的飞速发展,从实验室走向产业化应用已成为必然趋势。2025年,大模型部署不再局限于传统的云端集中式架构,而是向云端-边缘协同的分布式部署模式演进。这种转变不仅解决了纯云端部署在延迟、隐私和成本方面的痛点,还为大模型在各行业的广泛应用开辟了新的可能性。本文将深入剖析大模型部署的核心技术、架构设计、工程实践及最新进展,为企业和开发者提供从云端到边缘的全场景部署指南。

2066 1
|
16天前
|
物联网 测试技术
|

SenseNova U1开源:原生统一多模态理解与生成,8B参数达到同量级SOTA

商汤日日新开源SenseNova U1 Lite系列(8B参数),基于自研NEO-unify架构,原生统一多模态理解、推理与生成,摒弃VE/VAE,重构统一表征空间。性能达同量级开源SOTA,部分指标比肩大型闭源模型,并支持8步LoRA加速推理。

234 2
|
4月前
|
机器人 数据挖掘 数据处理
|

LingBot-VLA 具身大模型全面开源

蚂蚁灵波团队开源具身大模型LingBot-VLA:在GM-100真机评测中跨本体成功率提升至17.3%(+4.3%),RoboTwin 2.0仿真任务成功率超Pi0.5达9.92%;基于20,000小时多构型真机数据预训练,支持高效微调与跨平台迁移,代码、模型、数据、基准全开源。(239字)

776 0
|
4月前
|
自然语言处理 监控 物联网
|

大模型微调参数设置 —— 从入门到精通的调参指南

本文系统解析大模型微调核心参数:学习率、批次大小、训练轮次、权重衰减、LoRA秩等的作用机制与设置技巧,结合LLaMA-Factory实战演示,帮助初学者避开“黑箱”误区,在有限算力下实现高效、稳定微调。

1267 10
|
4月前
|
测试技术 API
|

小而强,GLM-4.7-Flash开源

GLM-4.7-Flash正式开源,30B总参、3B激活参数,兼顾性能与效率,支持免费调用。在编程、中文写作、翻译等多场景表现优异,已上线智谱平台,替代GLM-4.5-Flash,提供全新轻量化部署选择。

1884 1
|
25天前
|
自然语言处理 数据可视化 测试技术
|

在ModelScope上实现模型评测与压测服务化:PivotEval

魔搭推出PivotEval模型评测服务,一键完成模型效果与性能压测。无需搭建环境、下载数据集或写脚本,只需提供API地址并选择基准(如MMLU、GSM8K等),平台自动执行评测,生成交互式可视化报告,支持在线分享与本地复现。

261 4
|
1月前
|
人工智能 测试技术 Apache
|

Gemma 4 开源发布: Google 迄今最强开放模型,主打推理与 Agent 能力

Google正式开源Gemma 4系列(Apache 2.0许可),含E2B/E4B(端侧多模态)、26B MoE与31B Dense四款模型。参数效率卓越:31B位列开放模型榜第3,26B第6;边缘模型支持128K上下文、原生音视频处理,单卡/手机均可高效运行。

1170 12
|
7月前
|
存储 机器学习/深度学习 缓存
|

85_多轮对话:上下文管理与压缩

在大语言模型(LLM)的应用场景中,多轮对话已经成为最核心的交互模式之一。随着2025年LLM技术的快速发展,用户对持续、连贯、个性化的对话体验要求越来越高。然而,多轮对话面临着严峻的技术挑战:首先,LLM的上下文窗口长度虽然在不断扩展(如GPT-5已支持100K tokens),但依然是有限资源;其次,随着对话轮次增加,历史信息不断累积,导致token消耗激增;第三,过长的上下文可能导致模型对早期信息的关注度下降,影响回复质量。

1683 1
|
15天前
|
存储 缓存 人工智能
|

当 Agent 从模型调用,走向系统工程:OpenAI 和 LangChain 的两种实践

OpenAI与LangChain最新实践揭示:AI Agent 正从“模型调用”迈向“系统工程”。前者以 WebSocket 优化API链路,提速40%;后者强调Feedback驱动Trace闭环,实现持续演进。效率与进化,缺一不可。

233 8
|
2月前
|
人工智能 数据安全/隐私保护
|

五分钟配好向日葵 MCP,让 AI 替你远程安装 OpenClaw!

本文详解向日葵MCP的实战配置与应用:将远程控制能力接入AI,实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等,无需写脚本,配置简单,即刻上手。

951 13
|
5月前
|
人工智能 自然语言处理 数据挖掘
|

Python 为何能稳居全场景开发主流语言宝座

Python凭借简洁语法、丰富生态、跨平台兼容及社区与企业双重推动,成为覆盖Web开发、数据分析、人工智能等全场景的“万能钥匙”,兼具低门槛与高效率,稳居编程语言主流地位。

866 0
|
5月前
|
小程序 API
|

微信通知

本文介绍了企业微信与小程序集成下,通过API获取access_token并发送消息的完整流程。包含前置条件、请求示例、代码实现及异步调用建议,适用于企业内部系统与微信生态对接场景。(239字)

636 0
|
8月前
|
机器学习/深度学习 数据采集 人工智能
|

通义实验室Mobile-Agent-v3开源,全平台SOTA的GUI智能体,支持手机电脑等多平台交互

近日,通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl,并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造,在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录,达成全平台SOTA。

2487 2
|
10月前
|
监控 安全 NoSQL
|

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南,包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南,包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

3421 1
|
10天前
|
缓存 调度 异构计算
|

LLM 训练提速约 25% 背后:缓存、重叠与 MoE 路由优化

LLM 提速关键在两件事:少做不必要的重复工作;让不可避免的工作尽量并行发生。

127 1
|
5月前
|
存储 SQL 关系型数据库
|

第四章 数据库

本文详解MySQL核心知识点,涵盖char与varchar区别、事务ACID特性、索引结构(B+tree)、聚簇与二级索引、回表查询、索引失效场景及SQL优化策略,结合实际应用提供创建原则与性能分析方法,助力数据库高效设计与调优。

760 0
|
8月前
|
算法 测试技术 决策智能
|

美团开源发布 LongCat-Flash-Chat:专为高效智能体任务设计,推理速度超100 tokens/s

9月1日,美团正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。

835 1
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
|

书尖 AI 依托阿里云算力,重塑智能阅读与学习新方式

书尖AI是依托阿里云算力的智能阅读工具,内置自研大模型,聚合1.2亿+优质内容。支持AI精读、双人互动播客、自定义创作与音频生成,3分钟提炼全书精华,兼顾碎片听学与深度理解,操作轻量、安全稳定,让高效阅读触手可及。(239字)

145 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4192
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互