|
7月前
|
存储 数据采集 自然语言处理
|

56_大模型微调:全参数与参数高效方法对比

随着大型语言模型(LLM)规模的不断增长,从数百亿到数千亿参数,传统的全参数微调方法面临着计算资源消耗巨大、训练效率低下等挑战。2025年,大模型微调技术已经从早期的全参数微调发展到如今以LoRA、QLoRA为代表的参数高效微调方法,以及多种技术融合的复杂策略。本文将深入对比全参数微调和参数高效微调的技术原理、适用场景、性能表现和工程实践,为研究者和工程师提供全面的技术参考。

1280 0
|
7月前
|
人工智能 监控 供应链
|

51_安全性测试:提示注入与红队

在2025年,大型语言模型(LLM)已成为企业数字化转型的核心驱动力,但随之而来的安全挑战也日益严峻。数据显示,全球每月监测到超过50万次针对大语言模型的越狱攻击,这些攻击利用LLM的"黑箱"特性和自主生成能力,突破了传统安全边界。特斯拉自动驾驶系统因对抗性贴纸导致12%测试场景意外加速、加拿大航空聊天机器人误导票价信息被勒令退款、韩国初创公司因AI数据泄露被罚9.3万美元、谷歌Bard曾因错误信息导致市值缩水1000亿美元等真实案例,都凸显了LLM安全的重要性

1865 0
|
12月前
|
机器学习/深度学习 算法 测试技术
|

DeepSeek-R1-0528:小更新大升级

今天,DeepSeek R1 开源发布了其“小版本”升级——DeepSeek-R1-0528。

1498 24
|
2月前
|
数据采集 人工智能 数据可视化
|

《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。

786 11
|
5月前
|
存储 NoSQL 关系型数据库
|

4-MongoDB索引知识

MongoDB索引基于B树结构,可显著提升查询效率,避免全表扫描。支持单字段、复合、地理空间、文本及哈希索引,适用于多种查询场景,如范围查询、排序、全文搜索和分片,是优化数据库性能的关键手段。

571 0
|
7月前
|
监控 Cloud Native 网络性能优化
|

122_集群管理:Slurm配置 - 优化大规模训练调度

在2025年,大规模语言模型(LLM)的训练已经进入到超大规模时代,模型参数量达到数千亿甚至万亿级别,训练过程需要动用数百甚至数千个GPU/TPU。在这种情况下,高效的集群管理系统成为训练成功的关键基础设施。Slurm(Simple Linux Utility for Resource Management)作为目前最流行的开源作业调度系统,广泛应用于科研机构和大型科技公司的超级计算集群中。

1321 3
|
4月前
|
人工智能 Java 开发工具
|

OoderAgent 实战指南:从搭建环境到开发到开发第一个自己的skill能力

本文为 ooder SuperAgent 开源框架的实战指南,基于 MIT 协议,介绍其三层 Agent 架构(End/Route/MCP)、AI 能力标准化、P2P 服务发现及 Skillflow 编排等核心特性,并提供环境配置、技能开发、测试部署全流程实操说明。(239字)

729 6
|
4月前
|
监控 搜索推荐 物联网
|

一文读懂LoRA微调原理:大模型高效适配的核心逻辑

通过冻结大模型参数、仅训练少量低秩矩阵,实现高效微调:成本低、周期短、不破坏通用能力。适配医疗、金融等垂直场景,支持多任务复用与边缘部署,成为大模型落地首选技术。

1127 9
|
4月前
|
数据可视化 定位技术 开发工具
|

榜单不盲从:用 EvalScope 打造你的专属场景评测

本文介绍如何通过EvalScope构建自定义评测指数,突破通用榜单局限,结合业务需求定义权重,实现模型在真实场景中的价值评估,助力选出真正适配业务的“最佳模型”。

703 6
|
5月前
|
运维 监控 Python
|

Python 微服务架构实践:从模块化到轻量级分布式

本文详解Python微服务落地路径:从模块化拆分、轻量框架封装,到服务通信、注册发现,再到Docker容器化部署与监控运维,系统阐述中小团队如何以低成本实现“低耦合、快迭代”的分布式架构。

566 0
|
5月前
|
SQL 关系型数据库 MySQL
|

MySQL 为何能稳居开源数据库主流宝座

自1995年发布以来,MySQL凭借轻量高效、易用友好、生态完善、灵活扩展四大优势,成为全球最受欢迎的开源关系型数据库。广泛适配各类开发语言、开源项目与云平台,支持从个人博客到大型电商的全场景应用,持续稳居DB-Engines排名前列,是Web开发的“标配”与开源数据库的“常青树”。(238字)

394 0
|
5月前
|
存储 缓存 Java
|

自定义注解

本文介绍Java自定义注解的实现原理与应用,结合Spring AOP完成日志拦截,并通过过滤器实现登录权限控制。涵盖注解定义、元注解说明及实际代码示例,适用于日志、验证、缓存等场景。

375 0
|
7月前
|
人工智能 测试技术 API
|

智谱旗舰模型GLM-4.6开源发布,代码能力对齐Claude Sonnet 4

作为GLM系列的最新版本,GLM-4.6是系列最强的代码Coding模型(较GLM-4.5提升27%)

2153 14
|
7月前
|
存储 机器学习/深度学习 人工智能
|

46_LLM幻觉问题:来源与早期研究_深度解析

大型语言模型(LLM)在自然语言处理领域展现出了令人惊叹的能力,能够生成连贯的文本、回答复杂问题、进行创意写作,甚至在某些专业领域提供见解。然而,这些强大模型的一个根本性缺陷——幻觉问题,正成为限制其在关键应用中广泛部署的主要障碍。幻觉(Hallucination)指的是LLM生成的内容与事实不符、上下文矛盾、逻辑错误,或者完全虚构信息的现象。

800 0
|
7月前
|
存储 机器学习/深度学习 监控
|

67_Transformers库进阶:模型加载与配置优化

随着大型语言模型(LLM)技术的迅速发展,Hugging Face的Transformers库已经成为LLM开发和应用的标准工具包。作为一个开源的深度学习库,Transformers提供了丰富的预训练模型、统一的接口设计以及强大的生态系统,使得研究人员和开发者能够便捷地构建、训练和部署各类语言模型。2025年,Transformers库已经发展到5.x系列,不仅支持最新的GPU架构和量化技术,还提供了更完善的分布式训练能力和内存优化方案。

995 1
|
3月前
|
JSON 人工智能 Shell
|

用 4B 小模型做Code Agent的SubAgent?这个开源项目做到了

LocoOperator-4B 是 LocoreMind 推出的 4B 开源蒸馏模型,专为代码库探索优化:本地运行、零 API 成本,结构化工具调用(Read/Grep/Glob/Bash 等)准确率达 100%。它替代 Code Agent 中的子智能体,显著降本增效。(239 字)

742 18
|
5月前
|
SQL 分布式计算 运维
|

XXLJOB:超长定时任务慢节点优化实践

本文针对ODPS大宽表任务运行缓慢问题,通过定位耗时卡点、解决数据倾斜与计算堆积,提出视图落表、节点拆分、前置裁剪、中表关联等优化方案,最终将任务产出时间提前4小时以上,显著提升效率并降低回刷成本。

395 0
|
5月前
|
存储 安全 算法
|

Java学习避坑指南:初学者常犯错误与解决方案

初学者常犯十大Java学习误区,如死记语法、混淆面向对象思维、忽视异常处理等。本文逐一剖析错误根源,并提供“原理+实践”双维解决方案,助你夯实基础、规范代码、提升项目能力,实现高效进阶。

626 0
|
5月前
|
设计模式 人工智能 架构师
|

面对"祖传代码"不敢动?用这条指令让AI做你的首席重构架构师

面对"屎山"代码不敢动?本文介绍了一套专业的AI重构指令,化身拥有15年经验的首席架构师。它能精准识别代码异味,提供基于设计模式的重构方案,并生成验证清单,帮助开发者安全高效地偿还技术债务。

568 7
|
5月前
|
Java 测试技术 调度
|

小结

本文介绍XXL-JOB任务调度框架的使用,包括其核心组成、任务编写与配置方法。通过@XxlJob注解定义任务,结合Cron表达式实现定时调度,并支持BEAN和GLUE两种模式。重点讲解分片广播任务,利用分片参数实现分布式环境下任务的高效并行处理,提升系统性能与扩展性。

419 3
来自: 语音  版块
|
10月前
|
机器学习/深度学习 人工智能 编解码
|

智谱AI发布新版VLM开源模型GLM-4.1V-9B-Thinking,引入思考范式,性能提升8倍

视觉语言大模型(VLM)已经成为智能系统的关键基石。

1536 0
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
|

基于YOLO11的交通违规检测系统(Python源码+数据集+Pyside6界面)

本文基于YOLO11构建交通违规检测系统,涵盖23类目标(车辆、信号灯、标志等),详解数据制作(ROI裁剪优化尺度)、模型改进(C3k2、C2PSA、轻量Detect头)及训练可视化全过程,并集成PySide6实现GUI应用,助力工业落地。

636 12
来自: 计算机视觉  版块
|
2月前
|
机器学习/深度学习 人工智能 文字识别
|

小红书开源FireRed-OCR,2B 参数登顶文档解析榜单

小红书FireRed团队开源的FireRed-OCR(仅20亿参数),在OmniDocBench v1.5端到端评测中以92.94%综合得分登顶,超越Gemini 3.0 Pro等大模型。专注解决文档解析中的“结构幻觉”问题,通过三阶段训练+格式约束强化学习,精准还原表格、公式、多栏等复杂结构。Apache 2.0协议,ModelScope开源,支持本地商用部署。(239字)

945 22
|
4月前
|
数据采集 编解码 自动驾驶
|

世界模型 LingBot-World,正式开源!

蚂蚁灵波团队开源世界模型LingBot-World,专为交互式仿真设计。其核心LingBot-World-Base具备高保真、强动态、长时序一致性(支持近10分钟稳定生成)和实时交互能力(≈16FPS,延迟<1秒),依托可扩展数据引擎,从游戏环境学习物理与因果规律,打造具身智能、自动驾驶等领域的“数字演练场”。

1441 1
|
4月前
|
人工智能 文字识别 安全
|

目前最火的 AI 助手 Clawdbot 又又又改名了 并且发布新版本

OpenClaw(原Clawdbot/Moltbot)是火爆开源AI助手,支持飞书、WhatsApp、Telegram等20+平台,数据全本地、可调OCR/数据库/Shell命令。新版本新增Twitch等渠道、KIMI等模型及图片交互,安全强化升级。GitHub星标超10万!

3806 1
|
4月前
|
机器学习/深度学习 测试技术 数据中心
|

九坤量化开源IQuest-Coder-V1,代码大模型进入“流式”训练时代

2026年首日,九坤创始团队成立的至知创新研究院开源IQuest-Coder-V1系列代码大模型,涵盖7B至40B参数,支持128K上下文与GQA架构,提供Base、Instruct、Thinking及Loop版本。采用创新Code-Flow训练范式,模拟代码演化全过程,提升复杂任务推理能力,在SWE-Bench、LiveCodeBench等基准领先。全阶段checkpoint开放,支持本地部署与微调,助力研究与应用落地。

1391 2
|
5月前
|
运维 关系型数据库 Linux
|

Linux 高效学习指南:从入门到运维的科学路径

本文提供Linux高效学习路径,倡导“场景驱动”学习法,避免死记硬背。涵盖四大阶段:1周入门掌握核心命令,2周深化理解系统原理,2周实战部署LNMP服务,长期进阶自动化运维。强调动手实操、问题驱动与循序渐进,助力快速构建完整知识体系,成为具备实战能力的运维人才。

714 0
|
5月前
|
存储 安全 Java
|

鉴权.1

本文介绍基于JWT与Spring Security的鉴权实现方案,涵盖Token认证流程、pom依赖配置、安全类WebSecurityConfig设置、JWT生成与验证、自定义认证组件等内容,结合代码示例完成前后端分离场景下的安全控制。

415 0
|
5月前
|
Java 调度 数据库
|

搭建XXL-JOB

XXL-JOB由调度中心和执行器两部分组成。调度中心负责任务调度与管理,支持动态配置、监控告警;执行器部署在微服务中,接收调度请求并执行任务。通过SpringBoot集成xxl-job-core,配置注册地址后可自动注册到调度中心,实现分布式任务调度。

1473 4
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

53_多模态LLM:图像理解的新范式

在人工智能技术快速发展的今天,单一模态的语言模型已经无法满足日益复杂的应用需求。2025年,多模态大型语言模型(MLLM)的崛起标志着AI技术进入了一个新的发展阶段,特别是在图像理解与文本生成的结合方面取得了突破性进展。本文将深入剖析多模态LLM的技术原理、架构设计、性能评估及实际应用案例,探讨视觉-语言融合技术如何重塑AI应用的边界,以及在未来发展中面临的挑战与机遇。

972 0
|
8月前
|
存储 人工智能 文字识别
|

PDF解析迎来技术革新!阿里新产品实现复杂文档端到端结构化处理

前言9月24日云栖大会现场,由阿里巴巴爱橙科技数据技术及产品团队自主研发的 PDF解析神器正式亮相并同步开源模型。这款基于Logics-Parsing模型构建的AI工具直指当前PDF解析领域的技术痛点,显著提升复杂文档的结构…

1259 0
|
9月前
|
编解码 自然语言处理
|

通义万相开源14B数字人Wan2.2-S2V!影视级音频驱动视频生成,助力专业内容创作

今天,通义万相的视频生成模型又开源了!本次开源Wan2.2-S2V-14B,是一款音频驱动的视频生成模型,可生成影视级质感的高质量视频。

1990 29
|
5月前
|
关系型数据库 应用服务中间件 Linux
|

Linux 实用命令与工具使用指南

本文详解在CentOS 7上搭建LNMP环境的完整流程,涵盖网络配置、组件安装、Nginx与PHP联动设置、网站部署及常见问题排查,帮助新手从零掌握Web服务器搭建核心技能。

617 0
|
5月前
|
数据采集 数据可视化 数据挖掘
|

Python 高效学习指南:从入门到全场景的科学路径

Python学习应避免贪多求全,遵循“筑基→深化→定向→实战”四阶段路径:先掌握核心语法与编程思维,再深入面向对象与代码质量,随后聚焦Web、数据或自动化方向,最后通过项目整合技能。强调实践闭环与工程化思维,助力从入门迈向实用开发。

550 0
|
5月前
|
安全 数据库 数据安全/隐私保护
|

1.RememberMe简介及用法

RememberMe功能并非简单保存用户名密码,而是通过服务端生成令牌(Token),借助Cookie实现关闭浏览器后仍保持登录状态。勾选“记住我”后,系统在响应头设置remember-me令牌,后续请求自动携带该令牌验证身份。为提升安全性,可将Token持久化至数据库并增加二次校验机制,防止令牌泄露带来的安全风险。

340 0
|
7月前
|
传感器 人工智能 API
|

仅100多元,他给视障人群装上AI“眼睛”

上海两名开发者为验证AI助盲实效,亲手打造百元AI眼镜,蒙眼实测过马路、识盲道,并开源项目鼓励更多人参与。技术导航,人心照亮。

1619 6
|
1月前
|
数据采集 人工智能
|

OmniScience:大规模科学多模态数据集重磅上线

OmniScience是深势科技开源的科研图像理解数据集,含150万高质量“图-文-上下文”三元组、500万子图,覆盖10大科学领域。依托Uni-Parser与多模态大模型重描述,显著提升AI对科学图表的深层语义理解能力。

233 3
|
3月前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|阿里云 AI 技术加持,与喜马拉雅听书体验深度对比

在阿里云AI赋能下,书尖AI实测展现三大优势:1.2亿册全品类书库、双人互动式AI播客、2分钟极速提炼书籍精华,并依托阿里云TTS实现自然听书体验。相较喜马拉雅,其AI深度解读与定制化能力更胜一筹。(239字)

654 9
|
5月前
|
人工智能 安全 前端开发
|

写单元测试太痛苦?教你用DeepSeek/通义千问一键生成高质量测试代码

单元测试难写且枯燥?本文分享一套经过验证的AI生成指令,将DeepSeek/通义千问化身为10年经验的测试专家。支持自动Mock、全场景覆盖和参数化测试,让代码质量保障从"体力活"变成高效的"指挥活"。

1192 3
|
6月前
|
人工智能 安全 搜索推荐
|

杭州AI开源生态大会·魔搭社区开发者嘉年华全回顾

11月22日,杭州AI开源生态大会暨“魔搭社区”开发者中心启用仪式在云谷中心举行。大会汇聚超3000名开发者,发布“两张清单”与AI开源政策包,启用首个线下开发者空间,推动开放、共建、共创的AI生态发展。

1115 10
|
7月前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

118_LLM模型量化与压缩:从理论到2025年实践技术详解

大型语言模型(LLM)在自然语言处理领域取得了前所未有的成功,但模型规模的快速增长带来了巨大的计算和存储挑战。一个典型的大型语言模型(如GPT-4或LLaMA 3)可能包含数千亿甚至万亿参数,需要数百GB甚至TB级的存储空间,并且在推理时需要大量的计算资源。这种规模使得这些模型难以在边缘设备、移动设备甚至资源有限的云服务器上部署和使用。

1356 3
|
7月前
|
机器学习/深度学习 算法 PyTorch
|

125_训练加速:FlashAttention集成 - 推导注意力优化的独特内存节省

2025年,大型语言模型的训练面临着前所未有的挑战。随着模型参数量和序列长度的不断增加,传统注意力机制的内存瓶颈问题日益突出。FlashAttention作为一种突破性的注意力算法,通过创新的内存访问模式和计算优化,显著提升了训练效率和内存利用。

816 3
|
8月前
|
API 网络安全
|

调用Dashscope接口时报错

840 1
|
9月前
|
编解码 算法 测试技术
|

MiniCPM-V4.0开源,多模态能力进化,手机可用,还有最全CookBook!

今天,面壁小钢炮新一代多模态模型 MiniCPM-V 4.0 正式开源。依靠 4B 参数,取得 在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩,且 实现了在手机上稳定、丝滑运行。此外,官方也正式开源了 推理部署工具 MiniCPM-V CookBook,帮助开发者面向不同需求、不同场景、不同设备,均可实现开箱即用的轻量、简易部署。

1303 0
|
3月前
|
机器学习/深度学习 存储 自然语言处理
|

蚂蚁集团 Ling-2.5-1T 开源:万亿参数,重新定义"又快又强"

Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型(MIT协议),以“效率×效果”为核心:万亿参数、63B激活,首创混合线性注意力架构,支持百万token上下文;推理吞吐大幅提升,AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。

810 4
|
3月前
|
存储 API 数据库
|

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Zvec 是一款开源(Apache 2.0)轻量级嵌入式向量数据库,专为终端侧设计,具备开箱即用、资源可控、极致性能与完整向量能力四大优势,支持标量-向量混合查询、CRUD、崩溃恢复等生产级特性,让端侧RAG如SQLite般简单可靠。(239字)

666 7
|
3月前
|
机器学习/深度学习 缓存 前端开发
|

讨论下llm的prefix caching机制

本文探讨LLM推理中Prefix Caching机制的原理与实践:解释为何将动态内容(如React循环中的tool call结果)放在system prompt会破坏缓存命中,导致成本激增;强调应将变量部分置于user prompt末尾,以最大化复用system+固定user前缀的KV缓存,显著降本提效

627 7
|
4月前
|
自然语言处理 物联网 计算机视觉
|

从 Image-to-LoRA 到 In-Context Edit

阿里发布Qwen-Image-Edit-2511-ICEdit-LoRA模型,通过上下文内编辑技术,利用“编辑前后图像对”实现图像编辑能力迁移。该模型仅需少量样本即可训练,支持风格、光照、表情等复杂编辑,并可拓展至图像分割等视觉任务,未来将持续优化与应用探索。

725 6
|
6月前
|
开发框架 人工智能 测试技术
|

字节推出VeAgentBench + veADK,打造可评估、可复现的智能体开发新范式

字节跳动推出VeAgentBench与veADK,打造智能体“开发-评估”闭环。VeAgentBench是覆盖教育、金融、法律等四大场景的开源评估基准,veADK为高效易用的开发框架,支持工具调用、RAG与记忆管理,助力AI智能体可度量、可复现、可落地。

1069 11
|
7月前
|
机器学习/深度学习 缓存 人工智能
|

45_混合专家模型:MoE架构详解

在大语言模型的发展历程中,参数规模的扩张一直被视为提升性能的主要途径。然而,随着模型参数达到数百亿甚至数千亿级别,传统的密集型模型架构面临着计算资源、训练效率和推理速度等诸多挑战。2025年,混合专家模型(Mixture of Experts,MoE)已成为突破这些限制的关键技术路径。

1341 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4192
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互