|
26天前
|
消息中间件 缓存 API
|

DeepSeek-V4 核心能力落地与实战应用指南:从底层机制到多智能体架构复盘

本文以SaaS架构师视角,深度解析DeepSeek-V4在真实生产环境中的工程落地:聚焦上下文缓存优化、强约束JSON输出、多智能体协同调度,并分享高并发下的三大避坑实战指南,助力开发者高效构建AI原生应用。

633 6
|
26天前
|
编解码 自然语言处理 文字识别
|

LLaDA2.0-Uni 开源: 打破 AR 桎梏,dLLM定义原生多模态统一新范式

LLaDA2.0-Uni是全球首个开源的多模态MoE离散扩散大模型(dLLM),以16B参数统一实现图像理解、生成与编辑。突破性采用全离散扩散建模,摆脱自回归依赖,支持并行解码与任意分辨率;语义视觉Token+定制Diffusion Decoder,8步即出高质量图。已在21项基准登顶,全面开源。

273 1
|
29天前
|
机器学习/深度学习 缓存 测试技术
|

DeepSeek-V4开源:百万上下文,Agent能力比肩顶级闭源模型

DeepSeek-V4正式开源!含V4-Pro(1.6T参数)与V4-Flash(284B参数)双版本,均支持百万token上下文。首创混合注意力架构,Agent能力、世界知识与推理性能全面领先开源模型,数学/代码评测比肩顶级闭源模型。

3478 10
|
1月前
|
人工智能 运维 前端开发
|

Kimi K2.6开源:编码能力比肩闭源顶级模型,支持300智能体协同

Moonshot AI开源Kimi K2.6,主打长时编码、智能体协同与前端设计生成。在Terminal-Bench 2.0、SWE-Bench Pro等基准上达开源SOTA,逼近GPT-5.4与Claude Opus 4.6;智能体集群扩展至300个子智能体、4000协调步。

1143 6
|
1月前
|
数据采集 人工智能
|

OmniScience:大规模科学多模态数据集重磅上线

OmniScience是深势科技开源的科研图像理解数据集,含150万高质量“图-文-上下文”三元组、500万子图,覆盖10大科学领域。依托Uni-Parser与多模态大模型重描述,显著提升AI对科学图表的深层语义理解能力。

233 3
|
1月前
|
机器学习/深度学习 算法 机器人
|

逐际动力开源 FluxVLA Engine:专为具身智能打造的标准化VLA工程底座

逐际动力开源FluxVLA Engine——面向具身智能的标准化VLA工程底座。它以统一配置、标准接口、模块解耦、加速部署为核心,解决数据碎片化、代码高耦合、仿真-真机迁移难三大瓶颈,支持VLM/VLA全栈任务,开箱即用部署于UR、ALOHA、TRON2等多平台。

266 0
|
1月前
|
大数据 弹性计算 固态存储
|

ECS下载魔搭大数据集卡住

144 0
来自:计算机视觉 版块
|
1月前
|
机器学习/深度学习 自然语言处理 数据可视化
|

可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

背景:科学研究中的“范式”往往是隐性的、难以量化的;而研究论文正是范式的全部语言载体。 目的:构建细胞生物学的语义基线,并系统检测该领域的边界信号(阈值、开关、检查点等),验证可计算元认知框架在生物学中的适用性。 结论:本文首次在细胞生物学构建了系统的语义基线,证实了可计算元认知框架的跨学科可迁移性;所得到的动词 术语 边界词库为后续流行病学、临床医学等领域的跨域对齐提供了可复用的基准。

363 5
|
1月前
|
数据采集 人工智能 机器人
|

戴盟联合数十家头部机构,发布全球最大规模含触觉全模态物理世界数据集

4月15日,戴盟机器人发布全球最大含触觉全模态具身数据集Daimon-Infinity,年内规模将达数百万小时、近十亿条数据。首批10000小时高质量开源数据已上线魔搭社区,覆盖80+真实场景、2000+任务,显著提升模型训练效率10倍。

335 2
|
1月前
|
数据采集 人工智能 自然语言处理
|

人机共享技能库为基础的可控本地安全助理平台

**摘要:** 即使零token也能手机多平台联动电脑运行脚本自由安全地运行各种技能工具脚本,通过"自行预设"的关键词来触发运行脚本的方法达到绝对安全、高效、和自由完全掌控平台的碾压核心优势!打造十分适合机关单位、内网环境、私有部署场景的安全助理,选择不走云端ai通道!当然也可以自由选择本地部署的人工智能ai,即使没有ai照样能跑!比沙箱模式更加安全高效和极其节省成本的终极理想设定! **关键词:** 本地化助手;人机协作;技能共享;隐私计算;自动化办公

166 2
|
1月前
|
人工智能 JSON Java
|

Spring AI Alibaba + MCP:调用MCP市场公开服务实操

本文详细讲解Spring Ai Alibaba调用MCP市场公开服务的全流程,以高德地图MCP服务为例,包含API-Key申请、客户端配置、代码实操,助力开发者快速掌握Spring Ai Alibaba与MCP服务对接技巧。

568 7
|
1月前
|
人工智能 测试技术 Apache
|

Gemma 4 开源发布: Google 迄今最强开放模型,主打推理与 Agent 能力

Google正式开源Gemma 4系列(Apache 2.0许可),含E2B/E4B(端侧多模态)、26B MoE与31B Dense四款模型。参数效率卓越:31B位列开放模型榜第3,26B第6;边缘模型支持128K上下文、原生音视频处理,单卡/手机均可高效运行。

1171 12
|
1月前
|
机器学习/深度学习 自然语言处理 算法
|

OpAgent开源:登顶 WebArena,蚂蚁集团开源全模态网页智能体

蚂蚁集团推出Web智能体OpAgent,仅凭自然语言指令即可在真实网站(如亚马逊)自主完成搜索、识别、加购等复杂操作。其采用视觉驱动理解、在线强化学习与模块化协作架构,在WebArena基准达71.6%任务成功率,刷新SOTA。已开源OpAgent-32B-INT4量化模型,显著降低推理门槛。

340 3
|
2月前
|
JSON API PHP
|

使用PHP对接美股股票市场API 实时数据、IPO和K线(Kline)的PHP对接方案

StockTV API 面向开发者,提供美股实时行情、历史K线(5分钟至1月)、IPO日历等数据,支持HTTP/WS双接入,全接口返回标准JSON,含纽交所(ex=1)与纳斯达克(ex=2)标识。(239字)

682 8
|
2月前
|
人工智能 数据安全/隐私保护
|

五分钟配好向日葵 MCP,让 AI 替你远程安装 OpenClaw!

本文详解向日葵MCP的实战配置与应用:将远程控制能力接入AI,实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等,无需写脚本,配置简单,即刻上手。

951 13
|
2月前
|
机器学习/深度学习 JSON 自然语言处理
|

DeepSeek 双百万 token 窗口对话数据的量化对比分析

本文基于第一个百万 token 窗口(以下简称 窗口 1)与第二个百万 token 窗口(以下简称 窗口 2)的完整对话数据,采用量化对比的方法,系统揭示两套对话在轮次、文本长度、语种构成以及估算 token 消耗方面的显著差异。研究发现,尽管窗口 2 的轮次和总字数均低于窗口 1,但其每轮对话的文本密度与估算 token 消耗显著更高。结合窗口 2 在生成 5 篇深度分析文章过程中的实际经验,本文提出“长文本生成的隐性 token 消耗”假说,并引用近期相关研究提供理论支撑。该假说为理解大模型在真实工程环境中的行为提供了新视角,也为用户在设计跨窗口连续工程时的指标控制与迁移提供了可操作的参考

433 12
|
2月前
|
缓存 JSON API
|

玩转纳斯达克与纽交所:美股数据 API 对接全指南

本文手把手教你用StockTV API对接美股(NYSE/NASDAQ)实时行情、专业K线及IPO数据,支持WebSocket极速推送、多维技术指标与全交易所覆盖,助你快速构建低延迟量化交易或金融App。(239字)

486 8
|
2月前
|
人工智能 数据库 Docker
|

基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录(1 274 201 tokens,3 673 轮),系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层 的五层分析框架,完整呈现了一位非 AI 专业背景的研究者(医学、心理学与人文领域)在完全依赖云端免费模型的条件下,从环境搭建到心源框架的完整工程轨迹。 主要发现如下: 1. 技术投入曲线显示,405 次命令/脚本集中在中期(第 1225–2448 轮),与英文占比高峰(43.4 %)完全吻合; 2. 三阶段演进从前

466 5
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

随着大模型长上下文能力的普及,tiktoken 及其他 BPE based 分词器已成为评估文本 token 数的标准工具。然而,其在中英文混合长文本中的实际压缩规律仍缺乏实证验证,业界普遍使用的经验公式(如中文字符 × 1.6)尚未在大规模语料上得到检验。本文基于 DeepSeek 百万 token项目中提纯后的对话数据(.jsonl,1 077 046 tokens,3 673 轮)采用反向推算方法,首次在真实中文长文本上量化了tiktoken 的压缩系数。主要发现: 1️⃣ 中文实际系数约为 1.16,远低于经验公式的 1.6,导致整体 token 估算高出20.9 %; 2️⃣ 对话呈

479 6
|
2月前
|
编解码 物联网 数据处理
|

LTX-2.3开源: 视频生成引擎级升级

Lightricks开源LTX-2.3音视频大模型:重建VAE提升细节锐度,文本连接器扩容4倍增强Prompt遵循,大幅优化I2V运动自然性与音频质量,并首次原生支持1080×1920竖版视频生成。22B参数,支持文生视频、图生视频等多任务。

3873 4
|
2月前
|
机器学习/深度学习 编解码 运维
|

红外小目标检测新突破!异常感知检测头AA-YOLO:节俭又鲁棒,小样本也能精准识别

本文提出AA-YOLO:首个将统计异常检验嵌入YOLO检测头的方法,通过指数分布建模背景,显式识别小目标为统计异常,显著降低误报率;仅需10%数据即达90%全量性能,参数比EFLNet少6倍,轻量高效;在噪声、跨域、跨模态下鲁棒性强,且可无缝适配各类YOLO及实例分割网络。

484 5
来自: 计算机视觉  版块
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
|

基于YOLO11的交通违规检测系统(Python源码+数据集+Pyside6界面)

本文基于YOLO11构建交通违规检测系统,涵盖23类目标(车辆、信号灯、标志等),详解数据制作(ROI裁剪优化尺度)、模型改进(C3k2、C2PSA、轻量Detect头)及训练可视化全过程,并集成PySide6实现GUI应用,助力工业落地。

636 12
来自: 计算机视觉  版块
|
2月前
|
机器学习/深度学习 开发者 内存技术
|

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源!

阶跃星辰开源Step 3.5 Flash——迄今最强开源Agent基座模型,含Base/Midtrain权重及Steptron全栈训练框架,支持预训练、SFT与强化学习,专为智能体设计。已登OpenRouter榜首,获社区广泛好评。(239字)

654 22
|
2月前
|
网络协议 编译器 C语言
|

C语言深度解析:内存对齐与结构体填充的底层逻辑

C语言中,内存对齐是CPU硬件强制要求的底层规则,直接影响结构体大小、访问性能与硬件兼容性。合理排列成员可减少填充、节省内存;滥用`#pragma pack`则易致崩溃或性能暴跌。嵌入式、网络协议与跨平台开发必备核心知识。(239字)

368 14
|
2月前
|
数据采集
|

以deepseek 百万token窗口为上限,建立上下文窗口的“信噪比”量化标准

大模型窗口token计算的三层框架模式

315 10
|
2月前
|
机器学习/深度学习 人工智能 文字识别
|

小红书开源FireRed-OCR,2B 参数登顶文档解析榜单

小红书FireRed团队开源的FireRed-OCR(仅20亿参数),在OmniDocBench v1.5端到端评测中以92.94%综合得分登顶,超越Gemini 3.0 Pro等大模型。专注解决文档解析中的“结构幻觉”问题,通过三阶段训练+格式约束强化学习,精准还原表格、公式、多栏等复杂结构。Apache 2.0协议,ModelScope开源,支持本地商用部署。(239字)

945 22
|
2月前
|
人工智能 并行计算 算法
|

video-subtitle-remover(VSR)--开源AI去字幕方案深度解析

VSR(video-subtitle-remover)是一款开源AI视频去字幕工具,支持本地运行,无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型,可智能检测并擦除硬字幕/水印,保持原分辨率与画质。兼容CUDA/DirectML,适配NVIDIA/AMD/Intel显卡,兼顾隐私性、可控性与高性能。

2327 6
来自: 计算机视觉  版块
|
2月前
|
人工智能 自然语言处理 数据可视化
|

别再用 LangChain 搭 RAG 了:Dify 和 n8n 哪个才是你真正需要的

本文对比LangChain、Dify与n8n在AI工作流构建中的定位差异:LangChain是高自由度但调试成本高的代码框架;Dify专注RAG与对话,开箱即用;n8n擅长跨系统AI自动化。附七牛云模型接入指南与避坑提示。

1252 6
|
2月前
|
机器学习/深度学习 人工智能 边缘计算
|

转行AI需谨慎:那些半途而废的人,都忽略了这几点。

2025年AI岗位需求暴增543%,但超六成转行者半年内放弃。本文揭示五大陷阱:盲目跟风忽视赛道适配、混淆工具使用与真实能力、碎片化学习缺实战闭环、急功近利轻视伦理、为高薪而非兴趣出发,并指出科学路径才是破局关键。(239字)

664 12

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4192
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互