|
1天前
|
人工智能 自然语言处理 搜索推荐
|

蚂蚁百宝箱正式发布AI构建能力:自然语言一键生成企业级智能体,助力业务创新提效

5月21日,蚂蚁百宝箱上线全新AI构建能力,支持自然语言一键生成智能体、营销活动与场景化Skill,深度融合行业资产与工程化能力,零代码、高可用、可交付。新用户注册即赠海量tokens,速体验!

62 1
|
1天前
|
存储 缓存 人工智能
|

理解 KV Cache:LLM 推理为什么能越写越快

LLM生成时首token慢、后续快,源于推理的两阶段:Prefill(全量计算prompt,建KV Cache)耗算力;Decode(逐token生成)复用缓存的Key/Value,仅需轻量计算。KV Cache以显存换速度,是实现流式输出的核心机制。

56 0
|
1天前
|
人工智能 JSON API
|

Open Code的部署以及API调用教程

OpenCode AI 是一款开源AI开发工具,支持快速集成各类大模型。只需三步:1)全局安装 `npm install -g opencode-ai`;2)配置 `opencode.json`(含Canopy Wave等API密钥);3)运行 `opencode` 命令,通过 `/connect` 连接模型,即刻开始智能编码。

88 1
|
2天前
|
传感器 人工智能 运维
|

AR 工业巡检技术详解与企业推荐

AR工业巡检融合增强现实与物联网技术,通过空间定位、虚实叠加、远程协同,实现设备巡检可视化、标准化、智能化。显著提升效率30%-50%,降低误检率与培训成本,已广泛应用于电力、石化、轨交等领域。(239字)

56 1
|
2天前
|
人工智能 安全
|

做一个 review-first 的企业 AI 项目,想征集真实业务场景

Helm 是聚焦企业AI落地的开源项目,打造企业经营控制单:将企业内部会议/邮件/CRM等信号、生成建议,但所有关键动作(审批、外发、写回)必须人工确认。现诚邀20位伙伴贡献真实场景,共建边界清晰、安全可控的企业AI实践。

56 0
|
2天前
|
编解码 自然语言处理 文字识别
|

HiDream-O1开源:8B参数像素级统一Transformer

HiDream-O1-Image是HiDream.ai开源的8B参数像素级统一生成模型,摒弃VAE与分离文本编码器,首创UiT架构实现文本、图像、任务条件在共享token空间端到端联合建模。支持2048×2048高清生成、多镜头/多语言渲染、指令编辑与主体个性化,在GenEval等基准刷新SOTA。含50步未蒸馏版与28步Dev加速版,并集成推理驱动提示代理。

90 3
|
3天前
|
人工智能 安全 搜索推荐
|

我用 PAI/Codex 理解 Harness Engineering:Agent 工作环境到底怎么搭

从工程师视角出发,带你过一遍 Harness Engineering

88 2
|
3天前
|
人工智能 安全 Shell
|

Harness Engineering 被讲烂之后,Agent 工程真正难的是什么?

看 Anthropic、OpenAI、Gemini 的 Harness 都在做啥?

104 1
|
3天前
|
机器学习/深度学习 自然语言处理 数据可视化
|

可计算元认知文本分析:癌症社会科学研究语义基线的构建与边界信号检测

本研究首次为癌症社会科学提供了可计算的语义基线,揭示该领域以不平等、社会决定因素与健康素养为核心的政策导向特征,并量化了不平等、歧视、健康素养等边界信号的学术覆盖率。相较于传统综述,本工作从“学科如何说话”的元认知视角提供结构化、可复现、跨学科对齐的计量基准,为健康公平监测、政策评估与跨领域协同提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症社会科学;健康不平等;文本分析

70 3
|
4天前
|
IDE 前端开发 开发工具
|

Google 的 IDE 演进小史

本文回顾Google IDE演进史:从工程师各用所爱(Vim/Emacs/IntelliJ/VS Code),到因超大规模代码库(google3)催生云端IDE Cider,再升级为融合VS Code前端的Cider V。其核心不是统一工具,而是以云化语言服务重构开发体验,将IDE升维为连接代码库、构建、审查与AI的工程杠杆。

97 0
|
4天前
|
机器学习/深度学习 编解码 自然语言处理
|

LLM 训练能不能少跑一点?Nous Research 的 TST 方法

Nous Research提出Token-Superposition Training(TST),一种不改模型架构、分词器、优化器或推理形式的预训练加速方法:训练前期将连续token平均为“叠加token”并预测下一组token,提升单位算力的数据吞吐;后期切回标准自回归训练。实验显示,在10B-A1B模型上可达2.5倍训练加速,显著降低GPU小时消耗。

78 1
|
4天前
|
人工智能 开发工具 开发者
|

终端里跑 3D 老鼠,桌面窗口成摆锤;AI 大佬新公司估值百亿起

上周技术圈的信息挺杂,但有几条线索值得放在一起看。 一边,AI 产品继续往具体工作流里走:Claude Code 开始支持 Agent View,OpenAI 把 Codex 带到移动端;另一边,开发者社区继续整活:有人给 Claude Code 做实体旋钮,有人做 Claude 用量桌面仪表盘,还有人把终端做成能显示 3D 老鼠的玩具。

99 1
|
4天前
|
机器学习/深度学习 人工智能 算法
|

用好 Codex Goal,关键就这三步

Codex 新增 /goal 命令,支持目标驱动的Agent式循环:设定可量化目标(如“运行时间降20%且测试全通过”)、构建短反馈闭环、用PLAN/EXPERIMENTS等Markdown文件持久化记忆。三要素缺一不可,方能真正释放长任务自动化潜力。

227 1
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
|

书尖 AI 借力阿里云云端算力,打造全新智慧阅读学习模式

书尖AI是依托阿里云算力、搭载自研大模型的智慧阅读平台,整合1.2亿+正版学习资源,支持智能精读、双人有声共读、个性化文稿创作与语音配音,数分钟提炼全书精华,兼顾碎片化学习与深度研读,操作简洁、安全可靠。(239字)

68 4
|
5天前
|
人工智能 JavaScript API
|

实战分享:生产级AI Agents 7天内上线完成网站主页/域名/Agent Workflow/ 部署和出海打榜

实战分享: 从0到1的一周时间上线生产级AI Agent:Craftsman-Agent(一句话生成3D组装方案,支持乐高/Minecraft/特斯拉车衣设计)和CoachOwl(AI协同日程编排工具,支持目标管理、多Agent协作与自动任务调度),打榜均上线Product Hunt,技术栈涵盖Gemini/Qwen、FastAPI、3D渲染API及DeepNLP OneKey Gateway,部署于AI Agent A2Z 平台*.aiagenta2z.com,获得部署托管网站和子域名。

144 2
|
5天前
|
存储 人工智能 JSON
|

日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命

本文提出AI时代“日抛型软件”新范式:日抛非终点,而是进化起点。基于AISTUDIO双线架构(Build链即时生成+Designer链持久沉淀),实现“双遗产”——参数权重持续优化(越用越懂用户)与领域知识动态沉淀(生成越来越专业),推动软件从消耗品跃升为认知引擎。(239字)

106 0
|
5天前
|
人工智能 自然语言处理 文字识别
|

WeaveFox,个人创作者的 AI 应用助手

WeaveFox 是一款免费的 AI 驱动应用创作平台,2个月全新重构升级。无需代码,用自然语言即可生成可运行、可部署的全栈应用。支持灵感澄清、AI建站、技能扩展、云服务集成与团队协作,助力个人、OPC及非技术人员快速实现创意变现。

110 1
|
5天前
|
机器学习/深度学习 人工智能 算法
|

Ring-2.6-1T 正式开源:为真实复杂任务打造的万亿级思考模型

蚂蚁百灵开源万亿级思考模型Ring-2.6-1T,专注真实复杂任务场景。具备强Agent执行能力、可调high/xhigh推理强度、异步强化学习训练三大突破,已在代码生成、科研分析、企业自动化等长链路任务中验证稳定表现。

205 1
|
5天前
|
数据挖掘 物联网 API
|

jina-embeddings-v5-omni 发布!全模态向量小模型

Jina发布v5-omni多模态嵌入模型,支持文本、图像、音频、视频,文本向量与v5-text逐字节一致,无需重建索引。small版(1.57B)以1/5参数追平LCO-7B,nano版(0.95B)性能领先LanguageBind 8.9分,训练仅调0.35%参数,兼顾高效与兼容。

138 1
|
7天前
|
机器学习/深度学习 自然语言处理 数据可视化
|

可计算元认知文本分析:癌症经济学语义基线的构建与边界信号检测

本研究首次为癌症经济学建立了可计算的语义基线,揭示该学科围绕费用 保险 财务负担的政策导向核心特征,并量化了自付费用、财务毒性、保险缺口等关键边界信号。相较于传统综述,本工作从“学科如何说话”的元认知视角提供了 结构化、可复现、跨学科对齐的计量基准,为卫生政策评价、资源配置决策以及跨领域对话提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症经济学;卫生政策;文本分析

101 0
|
8天前
|
人工智能 机器人 测试技术
|

用 Bub 和飞书搭一个更懂群聊上下文的小机器人

手把手教你搭建 Bub:一个懂群聊上下文、无“班味”的轻量化 AI 助理。

180 1
|
8天前
|
SQL 缓存 druid
|

一次 OOM 线上排查实录

老项目线上 OOM 踩坑实录!Druid 连接池 SQL 缓存泄漏 + 业务 SQL 拼接双重叠加导致内存溢出,通过堆 dump 定位问题,优化 Druid 配置 + 批量插入预防 OOM。

143 2
|
9天前
|
缓存 安全 Unix
|

理解虚拟内存:程序看到的地址为什么不是真实内存

虚拟内存通过页表、TLB 与缺页机制,实现安全高效的内存管理。

159 2
|
9天前
|
编解码 文字识别 Android开发
|

MiniCPM-V 4.6 开源:1.3B 多模态模型登顶同尺寸榜单,6G 内存跑通手机端

5月11日,面壁智能联合清华、OpenBMB开源新一代端侧多模态大模型MiniCPM-V 4.6。仅1.3B参数,性能登顶同尺寸全球第一,超越Qwen3.5-0.8B与Gemma4-E2B-it;仅需6GB内存即可流畅运行,支持iOS/Android/HarmonyOS。首创ViT早压缩与4倍/16倍混合Token压缩技术,实现“低内存、极速跑”,推动AGI普惠落地。

415 5
|
10天前
|
人工智能 前端开发 测试技术
|

AI Coding Agent 如何工程化:从上下文污染到多 Agent 分工

复杂任务不仅需要会写代码 Agent,更需要能够负责派活、整理结果与汇报 Manager Agent~

189 1
|
10天前
|
缓存 调度 异构计算
|

LLM 训练提速约 25% 背后:缓存、重叠与 MoE 路由优化

LLM 提速关键在两件事:少做不必要的重复工作;让不可避免的工作尽量并行发生。

127 1
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
|

书尖 AI 依托阿里云算力,重塑智能阅读与学习新方式

书尖AI是依托阿里云算力的智能阅读工具,内置自研大模型,聚合1.2亿+优质内容。支持AI精读、双人互动播客、自定义创作与音频生成,3分钟提炼全书精华,兼顾碎片听学与深度理解,操作轻量、安全稳定,让高效阅读触手可及。(239字)

144 0
|
10天前
|
机器学习/深度学习 人工智能 安全
|

蚂蚁·安诊儿医疗大模型:6.1B激活即登顶三大医疗榜单,魔搭在线体验已开放

蚂蚁·安诊儿医疗大模型(AntAngelMed)是由浙江省卫健委与蚂蚁集团联合打造的全球首个开源千亿级医疗大模型。基于Ling-flash-2.0 MoE架构,仅激活6.1B参数即达40B稠密模型性能,推理超200 tokens/s,在HealthBench、MedAIBench等权威测评中全面领先,已开放API与权重下载。

193 3
|
11天前
|
JSON NoSQL API
|

开源项目观察|ds4:本地 Agent 推理,不只是把模型跑起来

Redis作者antirez新开源项目ds4(DwarfStar 4),是专为DeepSeek V4 Flash设计的轻量级本地推理引擎。聚焦Agent场景,支持OpenAI/Anthropic API、Disk KV Cache复用、工具调用精准映射与长上下文优化,在MacBook等高端个人设备上实现高效端到端推理。

317 3
|
11天前
|
人工智能 自然语言处理 监控
|

从训练理由到检查理由:Anthropic 的 AI 对齐工程化思路

Anthropic最新研究推动AI对齐从“行为对齐”迈向“理由对齐”:MSM方法在训练中注入规则背后的价值观与理由,提升模型在Agent场景中的原则泛化能力;NLA技术则将内部激活转为自然语言,揭示未显化的评测意识与隐藏动机。二者共同构建“可理解、可检验”的对齐新范式。

107 2
|
12天前
|
人工智能 前端开发 数据可视化
|

HTML is the new Markdown:来自 Claude Code 团队的实践

AI Agent兴起后,Markdown因简洁易编辑成为默认输出格式。但Anthropic工程师Thariq提出:HTML正成为“新Markdown”——它通过CSS、交互元素、图表与响应式布局,显著提升信息密度与可读性,更适合PR评审、设计原型、技术报告等复杂场景。业界共识渐明:Markdown适合作为AI与开发者的轻量底稿,HTML则担当面向人类的展示与协作层。

293 3
|
14天前
|
存储 人工智能 前端开发
|

不写框架、不用 npm,我用 AI Coding 做了一个家庭记忆站

大佬勿进!新手向,手把手带你从零做站点:妈妈再也不用担心我会忘记和她之间的温馨小故事了。

154 3
|
14天前
|
人工智能 搜索推荐 云计算
|

阿里云算力加持 书尖 AI 打造智能高效阅读学习新方案

书尖AI是依托阿里云算力的智能阅读平台,聚合1.2亿册正版书籍,提供AI精读、双人对话播客、自定义创作与音频生成等创新功能,3分钟提炼全书精华,破解读得慢、记不住、没时间等痛点,打造轻量、沉浸、高效的一站式学习体验。(239字)

195 0
|
15天前
|
存储 缓存 人工智能
|

当 Agent 从模型调用,走向系统工程:OpenAI 和 LangChain 的两种实践

OpenAI与LangChain最新实践揭示:AI Agent 正从“模型调用”迈向“系统工程”。前者以 WebSocket 优化API链路,提速40%;后者强调Feedback驱动Trace闭环,实现持续演进。效率与进化,缺一不可。

232 8
|
15天前
|
物联网 测试技术
|

SenseNova U1开源:原生统一多模态理解与生成,8B参数达到同量级SOTA

商汤日日新开源SenseNova U1 Lite系列(8B参数),基于自研NEO-unify架构,原生统一多模态理解、推理与生成,摒弃VE/VAE,重构统一表征空间。性能达同量级开源SOTA,部分指标比肩大型闭源模型,并支持8步LoRA加速推理。

234 2
|
17天前
|
人工智能 自然语言处理 算法
|

2026年运营岗正在分层:懂AI应用的运营和只会排期的运营差距有多大

2026年运营岗加速分层:一类陷于排期催单,另一类借AI做用户洞察、内容生成、活动复盘与工作流提效。效率、价值与晋升差距显著拉大。真正稀缺的是“AI协作力”——懂Prompt、会搭工作流、能落地RAG/Agent。推荐考取CAIE注册人工智能工程师(Level I),零基础友好、企业认可度高,助运营从执行者跃升为业务增长关键接口人。

242 1
|
17天前
|
开发框架 人工智能 分布式计算
|

蚂蚁百灵双响开源:万亿旗舰 Ling-2.6-1T 与 高效 Agent 主力 Ling-2.6-flash

蚂蚁百灵开源双模型:Ling-2.6-1T(万亿参数旗舰)专注复杂任务多步执行与高智效比;Ling-2.6-flash(104B/7.4B激活)主打极致推理速度与Agent场景,Token效率达业界领先。二者兼顾“强智能”与“真落地”,全面支持生产级AI工作流。

325 1
|
19天前
|
数据采集 自然语言处理 算法
|

可计算元认知文本分析:肿瘤生物物理学语义基线的构建与边界信号检测

本研究首次为肿瘤生物物理学提供可计算的语义基线,揭示该学科围绕力学信号与细胞行为的核心知识结构,并量化了力学/黏附/成像阈值作为学科边界信号。相比传统综述,本工作从“学科如何说话”的元认知视角实现了可复现、可扩展、跨层次对齐的计量基准,为肿瘤生物物理学在精准医学、组织工程及材料科学中的跨学科协作提供了方法学支撑。

194 4
|
22天前
|
人工智能 安全 API
|

Claude Cowork 支持第三方模型接入 开放而不开源

Claude Cowork 正式支持第三方推理平台接入(如Bedrock、Vertex AI、Azure Foundry及兼容/v1/messages的LLM网关),实现工具层与模型层解耦。用户可自由配置国产模型(如Qwen、GLM、DeepSeek等),降低使用门槛与成本,同时保留桌面端Agent工作流、MCP、插件及本地文件访问等核心体验——开放接口,不开放入口。

1228 7
|
23天前
|
人工智能 机器人 测试技术
|

从成功率到能力画像:上海AI Lab推出具身操作仿真评测基座EBench

上海AI Lab推出EBench,突破单一成功率评测范式,构建可复现、可拆解的具身操作能力诊断框架。涵盖26类任务、5维能力标签与4类泛化测试,共794条用例,助力精准刻画模型强项、短板及真实泛化性。

165 2
|
23天前
|
人工智能 自然语言处理 监控
|

一句话查高铁票并写入文件:揭秘 IntentOrch 的意图驱动编排黑科技

IntentOrch 是一款意图驱动的MCP编排引擎,支持用自然语言(如“查明天广州到南宁高铁票并存入ticket.txt”)一键触发多工具协同执行,自动完成意图解析、工具匹配、工作流编排与执行,零代码、可视化、开箱即用。

145 2
来自: 自然语言处理  版块
|
23天前
|
人工智能 Java 数据库
|

DeepAgents 人工介入实战|LangGraph 实现 Agent 高危工具人工审批

本文详解基于 LangChain+LangGraph+DeepAgents 实现 Python 智能体人工介入实战,配置高风险工具中断审批、状态检查点保存与恢复,支持同意 / 拒绝 / 参数编辑,对比 Spring AI Alibaba 方案,附完整可运行源码与生产落地建议。

266 0
|
23天前
|
人工智能 IDE 中间件
|

原创|AI 长期记忆分层检索架构(可落地的轻量中间件方案)

这是一套原创AI外挂式长期记忆中间件架构,含四层模块、三层索引、四级分层与本地化治理,零LLM检索开销、全本地隐私可控,支持IDE/AI助手无缝集成,单次对话记忆Token仅130~330,助力知识资产化沉淀。(239字)

173 6
|
23天前
|
JSON API PHP
|

韩国股票实时数据 KOSPI(主板)和 KOSDAQ(创业板)的实时行情、K 线及指数数据

StockTV API全面支持韩国股市,覆盖KOSPI主板(exchangeId=60)与KOSDAQ创业板(110),提供实时行情、K线、指数等数据。需配置countryId=11及API密钥,支持HTTP/WS双协议,含PHP对接示例与关键注意事项。

269 6
|
24天前
|
自然语言处理 数据可视化 测试技术
|

在ModelScope上实现模型评测与压测服务化:PivotEval

魔搭推出PivotEval模型评测服务,一键完成模型效果与性能压测。无需搭建环境、下载数据集或写脚本,只需提供API地址并选择基准(如MMLU、GSM8K等),平台自动执行评测,生成交互式可视化报告,支持在线分享与本地复现。

261 4
|
25天前
|
人工智能 测试技术 调度
|

移动端 RPA 的架构重构:基于多模态视觉大模型的自动化调度系统压测复盘

本文复盘企业级移动端RPA重构实践,介绍如何以“侠客工坊”AI数字员工平台替代传统坐标录制方案:基于多模态大模型实现视觉语义决策、高并发多机型调度、零代码编排、异常自愈及MCP协议集成,显著提升自动化鲁棒性与运维效率。

171 10
|
25天前
|
消息中间件 缓存 API
|

DeepSeek-V4 核心能力落地与实战应用指南:从底层机制到多智能体架构复盘

本文以SaaS架构师视角,深度解析DeepSeek-V4在真实生产环境中的工程落地:聚焦上下文缓存优化、强约束JSON输出、多智能体协同调度,并分享高并发下的三大避坑实战指南,助力开发者高效构建AI原生应用。

633 6
|
25天前
|
编解码 自然语言处理 文字识别
|

LLaDA2.0-Uni 开源: 打破 AR 桎梏,dLLM定义原生多模态统一新范式

LLaDA2.0-Uni是全球首个开源的多模态MoE离散扩散大模型(dLLM),以16B参数统一实现图像理解、生成与编辑。突破性采用全离散扩散建模,摆脱自回归依赖,支持并行解码与任意分辨率;语义视觉Token+定制Diffusion Decoder,8步即出高质量图。已在21项基准登顶,全面开源。

273 1
|
29天前
|
机器学习/深度学习 缓存 测试技术
|

DeepSeek-V4开源:百万上下文,Agent能力比肩顶级闭源模型

DeepSeek-V4正式开源!含V4-Pro(1.6T参数)与V4-Flash(284B参数)双版本,均支持百万token上下文。首创混合注意力架构,Agent能力、世界知识与推理性能全面领先开源模型,数学/代码评测比肩顶级闭源模型。

3469 10
|
1月前
|
人工智能 运维 前端开发
|

Kimi K2.6开源:编码能力比肩闭源顶级模型,支持300智能体协同

Moonshot AI开源Kimi K2.6,主打长时编码、智能体协同与前端设计生成。在Terminal-Bench 2.0、SWE-Bench Pro等基准上达开源SOTA,逼近GPT-5.4与Claude Opus 4.6;智能体集群扩展至300个子智能体、4000协调步。

1139 6

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4192
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互