蚂蚁百宝箱正式发布AI构建能力:自然语言一键生成企业级智能体,助力业务创新提效
5月21日,蚂蚁百宝箱上线全新AI构建能力,支持自然语言一键生成智能体、营销活动与场景化Skill,深度融合行业资产与工程化能力,零代码、高可用、可交付。新用户注册即赠海量tokens,速体验!
理解 KV Cache:LLM 推理为什么能越写越快
LLM生成时首token慢、后续快,源于推理的两阶段:Prefill(全量计算prompt,建KV Cache)耗算力;Decode(逐token生成)复用缓存的Key/Value,仅需轻量计算。KV Cache以显存换速度,是实现流式输出的核心机制。
Open Code的部署以及API调用教程
OpenCode AI 是一款开源AI开发工具,支持快速集成各类大模型。只需三步:1)全局安装 `npm install -g opencode-ai`;2)配置 `opencode.json`(含Canopy Wave等API密钥);3)运行 `opencode` 命令,通过 `/connect` 连接模型,即刻开始智能编码。
AR 工业巡检技术详解与企业推荐
AR工业巡检融合增强现实与物联网技术,通过空间定位、虚实叠加、远程协同,实现设备巡检可视化、标准化、智能化。显著提升效率30%-50%,降低误检率与培训成本,已广泛应用于电力、石化、轨交等领域。(239字)
做一个 review-first 的企业 AI 项目,想征集真实业务场景
Helm 是聚焦企业AI落地的开源项目,打造企业经营控制单:将企业内部会议/邮件/CRM等信号、生成建议,但所有关键动作(审批、外发、写回)必须人工确认。现诚邀20位伙伴贡献真实场景,共建边界清晰、安全可控的企业AI实践。
HiDream-O1开源:8B参数像素级统一Transformer
HiDream-O1-Image是HiDream.ai开源的8B参数像素级统一生成模型,摒弃VAE与分离文本编码器,首创UiT架构实现文本、图像、任务条件在共享token空间端到端联合建模。支持2048×2048高清生成、多镜头/多语言渲染、指令编辑与主体个性化,在GenEval等基准刷新SOTA。含50步未蒸馏版与28步Dev加速版,并集成推理驱动提示代理。
可计算元认知文本分析:癌症社会科学研究语义基线的构建与边界信号检测
本研究首次为癌症社会科学提供了可计算的语义基线,揭示该领域以不平等、社会决定因素与健康素养为核心的政策导向特征,并量化了不平等、歧视、健康素养等边界信号的学术覆盖率。相较于传统综述,本工作从“学科如何说话”的元认知视角提供结构化、可复现、跨学科对齐的计量基准,为健康公平监测、政策评估与跨领域协同提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症社会科学;健康不平等;文本分析
Google 的 IDE 演进小史
本文回顾Google IDE演进史:从工程师各用所爱(Vim/Emacs/IntelliJ/VS Code),到因超大规模代码库(google3)催生云端IDE Cider,再升级为融合VS Code前端的Cider V。其核心不是统一工具,而是以云化语言服务重构开发体验,将IDE升维为连接代码库、构建、审查与AI的工程杠杆。
LLM 训练能不能少跑一点?Nous Research 的 TST 方法
Nous Research提出Token-Superposition Training(TST),一种不改模型架构、分词器、优化器或推理形式的预训练加速方法:训练前期将连续token平均为“叠加token”并预测下一组token,提升单位算力的数据吞吐;后期切回标准自回归训练。实验显示,在10B-A1B模型上可达2.5倍训练加速,显著降低GPU小时消耗。
终端里跑 3D 老鼠,桌面窗口成摆锤;AI 大佬新公司估值百亿起
上周技术圈的信息挺杂,但有几条线索值得放在一起看。 一边,AI 产品继续往具体工作流里走:Claude Code 开始支持 Agent View,OpenAI 把 Codex 带到移动端;另一边,开发者社区继续整活:有人给 Claude Code 做实体旋钮,有人做 Claude 用量桌面仪表盘,还有人把终端做成能显示 3D 老鼠的玩具。
用好 Codex Goal,关键就这三步
Codex 新增 /goal 命令,支持目标驱动的Agent式循环:设定可量化目标(如“运行时间降20%且测试全通过”)、构建短反馈闭环、用PLAN/EXPERIMENTS等Markdown文件持久化记忆。三要素缺一不可,方能真正释放长任务自动化潜力。
书尖 AI 借力阿里云云端算力,打造全新智慧阅读学习模式
书尖AI是依托阿里云算力、搭载自研大模型的智慧阅读平台,整合1.2亿+正版学习资源,支持智能精读、双人有声共读、个性化文稿创作与语音配音,数分钟提炼全书精华,兼顾碎片化学习与深度研读,操作简洁、安全可靠。(239字)
实战分享:生产级AI Agents 7天内上线完成网站主页/域名/Agent Workflow/ 部署和出海打榜
实战分享: 从0到1的一周时间上线生产级AI Agent:Craftsman-Agent(一句话生成3D组装方案,支持乐高/Minecraft/特斯拉车衣设计)和CoachOwl(AI协同日程编排工具,支持目标管理、多Agent协作与自动任务调度),打榜均上线Product Hunt,技术栈涵盖Gemini/Qwen、FastAPI、3D渲染API及DeepNLP OneKey Gateway,部署于AI Agent A2Z 平台*.aiagenta2z.com,获得部署托管网站和子域名。
日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命
本文提出AI时代“日抛型软件”新范式:日抛非终点,而是进化起点。基于AISTUDIO双线架构(Build链即时生成+Designer链持久沉淀),实现“双遗产”——参数权重持续优化(越用越懂用户)与领域知识动态沉淀(生成越来越专业),推动软件从消耗品跃升为认知引擎。(239字)
WeaveFox,个人创作者的 AI 应用助手
WeaveFox 是一款免费的 AI 驱动应用创作平台,2个月全新重构升级。无需代码,用自然语言即可生成可运行、可部署的全栈应用。支持灵感澄清、AI建站、技能扩展、云服务集成与团队协作,助力个人、OPC及非技术人员快速实现创意变现。
Ring-2.6-1T 正式开源:为真实复杂任务打造的万亿级思考模型
蚂蚁百灵开源万亿级思考模型Ring-2.6-1T,专注真实复杂任务场景。具备强Agent执行能力、可调high/xhigh推理强度、异步强化学习训练三大突破,已在代码生成、科研分析、企业自动化等长链路任务中验证稳定表现。
jina-embeddings-v5-omni 发布!全模态向量小模型
Jina发布v5-omni多模态嵌入模型,支持文本、图像、音频、视频,文本向量与v5-text逐字节一致,无需重建索引。small版(1.57B)以1/5参数追平LCO-7B,nano版(0.95B)性能领先LanguageBind 8.9分,训练仅调0.35%参数,兼顾高效与兼容。
可计算元认知文本分析:癌症经济学语义基线的构建与边界信号检测
本研究首次为癌症经济学建立了可计算的语义基线,揭示该学科围绕费用 保险 财务负担的政策导向核心特征,并量化了自付费用、财务毒性、保险缺口等关键边界信号。相较于传统综述,本工作从“学科如何说话”的元认知视角提供了 结构化、可复现、跨学科对齐的计量基准,为卫生政策评价、资源配置决策以及跨领域对话提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症经济学;卫生政策;文本分析
一次 OOM 线上排查实录
老项目线上 OOM 踩坑实录!Druid 连接池 SQL 缓存泄漏 + 业务 SQL 拼接双重叠加导致内存溢出,通过堆 dump 定位问题,优化 Druid 配置 + 批量插入预防 OOM。
MiniCPM-V 4.6 开源:1.3B 多模态模型登顶同尺寸榜单,6G 内存跑通手机端
5月11日,面壁智能联合清华、OpenBMB开源新一代端侧多模态大模型MiniCPM-V 4.6。仅1.3B参数,性能登顶同尺寸全球第一,超越Qwen3.5-0.8B与Gemma4-E2B-it;仅需6GB内存即可流畅运行,支持iOS/Android/HarmonyOS。首创ViT早压缩与4倍/16倍混合Token压缩技术,实现“低内存、极速跑”,推动AGI普惠落地。
书尖 AI 依托阿里云算力,重塑智能阅读与学习新方式
书尖AI是依托阿里云算力的智能阅读工具,内置自研大模型,聚合1.2亿+优质内容。支持AI精读、双人互动播客、自定义创作与音频生成,3分钟提炼全书精华,兼顾碎片听学与深度理解,操作轻量、安全稳定,让高效阅读触手可及。(239字)
蚂蚁·安诊儿医疗大模型:6.1B激活即登顶三大医疗榜单,魔搭在线体验已开放
蚂蚁·安诊儿医疗大模型(AntAngelMed)是由浙江省卫健委与蚂蚁集团联合打造的全球首个开源千亿级医疗大模型。基于Ling-flash-2.0 MoE架构,仅激活6.1B参数即达40B稠密模型性能,推理超200 tokens/s,在HealthBench、MedAIBench等权威测评中全面领先,已开放API与权重下载。
开源项目观察|ds4:本地 Agent 推理,不只是把模型跑起来
Redis作者antirez新开源项目ds4(DwarfStar 4),是专为DeepSeek V4 Flash设计的轻量级本地推理引擎。聚焦Agent场景,支持OpenAI/Anthropic API、Disk KV Cache复用、工具调用精准映射与长上下文优化,在MacBook等高端个人设备上实现高效端到端推理。
从训练理由到检查理由:Anthropic 的 AI 对齐工程化思路
Anthropic最新研究推动AI对齐从“行为对齐”迈向“理由对齐”:MSM方法在训练中注入规则背后的价值观与理由,提升模型在Agent场景中的原则泛化能力;NLA技术则将内部激活转为自然语言,揭示未显化的评测意识与隐藏动机。二者共同构建“可理解、可检验”的对齐新范式。
HTML is the new Markdown:来自 Claude Code 团队的实践
AI Agent兴起后,Markdown因简洁易编辑成为默认输出格式。但Anthropic工程师Thariq提出:HTML正成为“新Markdown”——它通过CSS、交互元素、图表与响应式布局,显著提升信息密度与可读性,更适合PR评审、设计原型、技术报告等复杂场景。业界共识渐明:Markdown适合作为AI与开发者的轻量底稿,HTML则担当面向人类的展示与协作层。
阿里云算力加持 书尖 AI 打造智能高效阅读学习新方案
书尖AI是依托阿里云算力的智能阅读平台,聚合1.2亿册正版书籍,提供AI精读、双人对话播客、自定义创作与音频生成等创新功能,3分钟提炼全书精华,破解读得慢、记不住、没时间等痛点,打造轻量、沉浸、高效的一站式学习体验。(239字)
当 Agent 从模型调用,走向系统工程:OpenAI 和 LangChain 的两种实践
OpenAI与LangChain最新实践揭示:AI Agent 正从“模型调用”迈向“系统工程”。前者以 WebSocket 优化API链路,提速40%;后者强调Feedback驱动Trace闭环,实现持续演进。效率与进化,缺一不可。
SenseNova U1开源:原生统一多模态理解与生成,8B参数达到同量级SOTA
商汤日日新开源SenseNova U1 Lite系列(8B参数),基于自研NEO-unify架构,原生统一多模态理解、推理与生成,摒弃VE/VAE,重构统一表征空间。性能达同量级开源SOTA,部分指标比肩大型闭源模型,并支持8步LoRA加速推理。
2026年运营岗正在分层:懂AI应用的运营和只会排期的运营差距有多大
2026年运营岗加速分层:一类陷于排期催单,另一类借AI做用户洞察、内容生成、活动复盘与工作流提效。效率、价值与晋升差距显著拉大。真正稀缺的是“AI协作力”——懂Prompt、会搭工作流、能落地RAG/Agent。推荐考取CAIE注册人工智能工程师(Level I),零基础友好、企业认可度高,助运营从执行者跃升为业务增长关键接口人。
蚂蚁百灵双响开源:万亿旗舰 Ling-2.6-1T 与 高效 Agent 主力 Ling-2.6-flash
蚂蚁百灵开源双模型:Ling-2.6-1T(万亿参数旗舰)专注复杂任务多步执行与高智效比;Ling-2.6-flash(104B/7.4B激活)主打极致推理速度与Agent场景,Token效率达业界领先。二者兼顾“强智能”与“真落地”,全面支持生产级AI工作流。
可计算元认知文本分析:肿瘤生物物理学语义基线的构建与边界信号检测
本研究首次为肿瘤生物物理学提供可计算的语义基线,揭示该学科围绕力学信号与细胞行为的核心知识结构,并量化了力学/黏附/成像阈值作为学科边界信号。相比传统综述,本工作从“学科如何说话”的元认知视角实现了可复现、可扩展、跨层次对齐的计量基准,为肿瘤生物物理学在精准医学、组织工程及材料科学中的跨学科协作提供了方法学支撑。
Claude Cowork 支持第三方模型接入 开放而不开源
Claude Cowork 正式支持第三方推理平台接入(如Bedrock、Vertex AI、Azure Foundry及兼容/v1/messages的LLM网关),实现工具层与模型层解耦。用户可自由配置国产模型(如Qwen、GLM、DeepSeek等),降低使用门槛与成本,同时保留桌面端Agent工作流、MCP、插件及本地文件访问等核心体验——开放接口,不开放入口。
从成功率到能力画像:上海AI Lab推出具身操作仿真评测基座EBench
上海AI Lab推出EBench,突破单一成功率评测范式,构建可复现、可拆解的具身操作能力诊断框架。涵盖26类任务、5维能力标签与4类泛化测试,共794条用例,助力精准刻画模型强项、短板及真实泛化性。
一句话查高铁票并写入文件:揭秘 IntentOrch 的意图驱动编排黑科技
IntentOrch 是一款意图驱动的MCP编排引擎,支持用自然语言(如“查明天广州到南宁高铁票并存入ticket.txt”)一键触发多工具协同执行,自动完成意图解析、工具匹配、工作流编排与执行,零代码、可视化、开箱即用。
DeepAgents 人工介入实战|LangGraph 实现 Agent 高危工具人工审批
本文详解基于 LangChain+LangGraph+DeepAgents 实现 Python 智能体人工介入实战,配置高风险工具中断审批、状态检查点保存与恢复,支持同意 / 拒绝 / 参数编辑,对比 Spring AI Alibaba 方案,附完整可运行源码与生产落地建议。
原创|AI 长期记忆分层检索架构(可落地的轻量中间件方案)
这是一套原创AI外挂式长期记忆中间件架构,含四层模块、三层索引、四级分层与本地化治理,零LLM检索开销、全本地隐私可控,支持IDE/AI助手无缝集成,单次对话记忆Token仅130~330,助力知识资产化沉淀。(239字)
韩国股票实时数据 KOSPI(主板)和 KOSDAQ(创业板)的实时行情、K 线及指数数据
StockTV API全面支持韩国股市,覆盖KOSPI主板(exchangeId=60)与KOSDAQ创业板(110),提供实时行情、K线、指数等数据。需配置countryId=11及API密钥,支持HTTP/WS双协议,含PHP对接示例与关键注意事项。
在ModelScope上实现模型评测与压测服务化:PivotEval
魔搭推出PivotEval模型评测服务,一键完成模型效果与性能压测。无需搭建环境、下载数据集或写脚本,只需提供API地址并选择基准(如MMLU、GSM8K等),平台自动执行评测,生成交互式可视化报告,支持在线分享与本地复现。
移动端 RPA 的架构重构:基于多模态视觉大模型的自动化调度系统压测复盘
本文复盘企业级移动端RPA重构实践,介绍如何以“侠客工坊”AI数字员工平台替代传统坐标录制方案:基于多模态大模型实现视觉语义决策、高并发多机型调度、零代码编排、异常自愈及MCP协议集成,显著提升自动化鲁棒性与运维效率。