|
2月前
|
人工智能 API 开发工具
|

Silly Tavern 免费API保姆级教学

本指南详解Windows下安装SillyTavern全流程:先安装Node.js与Git,再克隆仓库(推荐Gitee镜像),双击Start.bat启动;接着配置OpenAI兼容API(如Canopy Wave),填入Key与端点;最后下载导入角色卡,即可开启AI角色对话体验。(239字)

2056 1
|
2月前
|
机器学习/深度学习 算法 安全
|

打破真题依赖!微软、清华联合开源 X-Coder:全合成数据激发代码大模型推理潜力

微软与清华联合推出X-Coder系列模型,首创纯合成数据训练范式,在不使用任何真实竞赛题的前提下,仅用7B参数即在LiveCodeBench v5上达62.9%准确率,超越更大规模依赖真实数据的模型。项目已开源模型与数据集。(239字)

325 11
|
2月前
|
JSON API 数据库
|

如何快速对接德国股票数据 API

德国作为欧洲最大经济体,其法兰克福交易所及DAX指数是全球配置欧洲资产的关键入口。本文详解如何通过StockTV金融API,快速接入德国股票实时行情、历史K线及DAX指数数据,支持毫秒级延迟与多周期分析。

255 4
|
2月前
|
数据采集 人工智能 数据可视化
|

《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。

786 11
|
3月前
|
监控 前端开发 API
|

[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent

本节我们将理论付诸实践,利用 LlamaIndex 的 ReAct 框架和 Qwen3 模型,手搓一个全自动的博客监控 Agent。通过为大模型接入 RSS 读取、邮件与微信发送等外部工具,让它从‘聊天机器人’进化为‘能干活的数字员工’。

411 10
|
3月前
|

双 Transformer + 双神经符号 + 突触耦合 + DeepSeek 插件 极简验证

双 Transformer + 双神经符号做核心,用类脑突触耦合中间层做动态配对,嵌入 DeepSeek 的 Engram 和 MHC 补长程和记忆短板,也不知道行不行。

168 6
|
3月前
|
算法 API 网络架构
|

如何高效对接新加坡股票(SGX)实时数据 API

新加坡股市(SGX)汇聚优质REITs、DBS/UOB银行股及航运企业。本文详解如何用StockTV全球金融API(countryId=15)快速获取实时行情、K线、STI指数等数据,支持REST/WS,低门槛、高时效,助力东南亚金融产品开发。(239字)

414 12
|
3月前
|
人工智能 算法 Cloud Native
|

【深度思考】当代码无法解决增长焦虑:一场关于“组织操作系统”的重构与意识进化

本文提出“意识进化模型”与“三账户核算体系”,以大型企业转型实践为基,超越KPI,将组织视为生命体:通过意识光谱诊断、七力雷达评估、85/15杠铃预算、良知效能比(CER)等机制,重写组织“操作系统”,推动从创伤防御态迈向使命驱动态,实现技术与人性的协同进化。(239字)

173 1
|
3月前
|
JSON 人工智能 Shell
|

用 4B 小模型做Code Agent的SubAgent?这个开源项目做到了

LocoOperator-4B 是 LocoreMind 推出的 4B 开源蒸馏模型,专为代码库探索优化:本地运行、零 API 成本,结构化工具调用(Read/Grep/Glob/Bash 等)准确率达 100%。它替代 Code Agent 中的子智能体,显著降本增效。(239 字)

741 18
|
3月前
|
机器学习/深度学习 测试技术 API
|

Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力

通义千问Qwen3.5发布四款中等规模多模态模型,支持256K原生上下文(可扩至1M)、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习,35B-A3B仅激活3B参数即超越旧旗舰,性能、效率与部署成本兼具。(239字)

7940 23
|
3月前
|
人工智能 自然语言处理 JavaScript
|

Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型百万token对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。 时间:2026 年 2 月

623 3
|
3月前
|
机器学习/深度学习 人工智能 编解码
|

四款国产VLM OCR模型横评

春节前,DeepSeek、智谱、百度、腾讯四大团队密集开源新一代OCR小模型,全面采用视觉语言模型(VLM)架构,摒弃传统流水线,迈向“语义结构化”新纪元。DeepSeek-OCR2首创“视觉因果流”,GLM-OCR以0.9B参数登顶OmniDocBench榜首,PaddleOCR-VL-1.5攻克真实退化场景,Youtu-Parsing实现22倍推理加速——国产OCR正以架构创新实现垂直领域“换道超车”。

847 4
|
3月前
|
自然语言处理 前端开发 测试技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

通义千问新推Qwen3-ASR语音识别模型(1.7B/0.6B),支持52种语言及方言,具备高鲁棒性与流式长音频转写能力。联合魔搭社区与Intel® OpenVINO™,实现Intel平台极致加速部署,提供完整开源教程、Notebook示例及Gradio交互Demo。(239字)

2458 6
|
3月前
|
编解码 自然语言处理 语音技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

通义千问推出Qwen3-TTS系列开源语音模型,支持中英日韩等10种语言,具备声音克隆、情感适配与高保真端到端合成能力;结合Intel OpenVINO™可在CPU上高效推理,无需GPU,轻松部署于边缘设备。(239字)

1378 6
|
3月前
|
机器学习/深度学习 JSON 文字识别
|

0.9B 小模型,OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR,基于GLM-V架构,融合CogViT视觉编码器与GLM-0.5B语言解码器,支持公式、表格、代码等复杂文档识别,性能达OmniDocBench榜首(94.62分),仅0.9B参数,轻量高效,开箱即用。

2677 3
|
3月前
|
人工智能 语音技术 芯片
|

MiniCPM-o 4.5 CookBook:9B 参数玩转多模态全双工交互

MiniCPM-o 4.5是9B参数多模态大模型,支持图像、视频、音频、文本输入与高质量文/语音输出。具备领先视觉理解(OpenCompass平均77.6分)、实时中英双语语音对话、全双工流式交互、高精度OCR及30+语言能力,适配CPU/GPU/国产芯片,支持本地部署与微调。(239字)

980 5
|
3月前
|
机器学习/深度学习 人工智能 算法
|

自进化≠自我刷题,Agent 真正的突破口是「自己造环境」?——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

AI AMA首期聚焦“Agent自进化”,由魔搭等联合发起,邀请翟云鹏主持及5位顶会作者深度对谈。围绕定义、泛化能力、反馈信号、评估体系等7大议题,探讨Agent如何突破“从零开始”瓶颈,实现类人经验积累与策略优化。(239字)

404 6
|
3月前
|
人工智能 算法 测试技术
|

Boss直聘开源Nanbeige4.1-3B:小模型全能新标杆

Boss直聘南北阁实验室发布Nanbeige4.1-3B:一款仅3B参数的“小而全”统一模型,首次在同规模中系统整合强推理、人类偏好对齐与深度搜索Agent能力,性能超越Qwen3-32B等大模型,已开源权重、技术报告及合成数据。

1217 5
|
3月前
|
机器学习/深度学习 存储 自然语言处理
|

蚂蚁集团 Ling-2.5-1T 开源:万亿参数,重新定义"又快又强"

Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型(MIT协议),以“效率×效果”为核心:万亿参数、63B激活,首创混合线性注意力架构,支持百万token上下文;推理吞吐大幅提升,AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。

810 4
|
3月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3.5:迈向原生多模态智能体

除夕夜,通义千问发布Qwen3.5-397B-A17B:全球首个原生多模态MoE大模型,总参3970亿、仅激活170亿参数,性能媲美万亿模型;支持201种语言、超强视觉理解与GUI智能体能力,已开源至GitHub与ModelScope。

4407 4
|
3月前
|
自然语言处理 测试技术 Python
|

小红书开源发布 FireRed-Image-Edit 1.0:高质量训练数据,性能屠榜三项核心评测

2月14日,小红书FireRedTeam开源FireRed-Image-Edit-1.0图像编辑模型。该模型在ImgEdit、GEdit等基准测试中全面超越现有开源方案,风格迁移(4.97分)等维度甚至优于Nano-Banana、Seedream4.0等闭源模型,支持文本保留、老照片修复、多图虚拟试衣等能力。

1269 6
|
3月前
|
缓存 架构师 前端开发
|

MiniMax M2.5 开源,低成本Agent时代来了!社区Day0部署、工具调用、推理&提示词参数实战来啦!

2月13日,MiniMax发布M2.5大模型,108天内三连更!编程(SWE-Bench 80.2%)、搜索(BrowseComp 76.3%)、办公场景全面领先,开源权重已上线ModelScope,支持API调用、本地部署及工具调用。

3787 7
|
3月前
|
机器学习/深度学习 编解码 JSON
|

FantasyWorld 正式开源!一次前向传播,同时生成视频与 3D 几何——视频世界模型的新范

高德地图发布「FantasyWorld」——新一代几何一致世界模型,单次前向即可生成高质量视频与3D场景(深度图、点云、相机轨迹),无需后处理或逐场景优化。ICLR 2026录用,WorldScore榜首,已开源代码与模型。

840 6
|
3月前
|
机器学习/深度学习 人工智能 资源调度
|

万亿参数、混合线性架构、开源免费——Ring-2.5-1T 来了,思考模型卷到新高度

蚂蚁inclusionAI发布开源万亿参数思考模型Ring-2.5-1T,首创混合线性注意力架构,实现“快、深、长”三大突破:推理吞吐提升3倍+,IMO/CMO达金牌水平,可在Claude Code中连续2小时开发可运行的迷你操作系统。MIT协议完全开源。

569 21
|
3月前
|
数据采集 机器学习/深度学习 人工智能
|

全球Top下载中文开源数据集更新|OpenCSG持续打造中文高质量数据集开源底座

OpenCSG正式发布Fineweb-Edu-Chinese V2.2数据集:覆盖预训练(1.5T tokens,质量分层)与SFT微调(143.7万条DeepSeek V3.2蒸馏问答对)全流程,严格事实锚定、支持溯源,是当前少有的高质量中文教育全栈数据解决方案。

319 13
|
3月前
|
机器学习/深度学习 人工智能 算法
|

GLM-5开源:迈向Agentic Engineering新范式,社区Day0 部署、推理实战来了!

智谱发布GLM-5:开源SOTA大模型,Coding与Agent能力双强,真实编程体验媲美Claude Opus 4.5;全球AI榜单排名第四、开源第一;MIT协议开源,支持复杂系统工程与长程Agent任务。

2864 5
|
3月前
|
存储 自然语言处理 Java
|

OoderAgent 能力中心与能力库 技术白皮书(V0.7.3)

OoderAgent平台核心由能力中心(SkillCenter)与能力库(ooder-skills)构成:前者统一管理技能生命周期、市场运营与P2P调度;后者提供40+模块化、场景驱动的多语言(Java/Node/Python)技能包,支持GitHub/Gitee一键发现安装。

218 4
|
3月前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|阿里云 AI 技术加持,与喜马拉雅听书体验深度对比

在阿里云AI赋能下,书尖AI实测展现三大优势:1.2亿册全品类书库、双人互动式AI播客、2分钟极速提炼书籍精华,并依托阿里云TTS实现自然听书体验。相较喜马拉雅,其AI深度解读与定制化能力更胜一筹。(239字)

654 9
|
3月前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|基于阿里云 AI 技术,与微信读书阅读体验对比

本文深度实测阿里云赋能的智能阅读工具“书尖AI”,对比微信读书,客观呈现其1.2亿册书库、双人AI播客听书、2分钟极速解读等核心优势,展现高效轻松的智能阅读新体验。(239字)

843 8
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

PPO 应用 —— 大模型偏好优化的核心场景与落地思路

本文详解PPO算法在大模型RLHF落地中的核心应用:聚焦对话风格、客服话术、内容生成、安全合规、垂直领域及多模态六大场景,强调“偏好定制化”价值。全程无代码,提供4步落地法与3大实操要点,助力企业高效实现大模型优化。(239字)

352 11
|
3月前
|
机器学习/深度学习 自然语言处理 搜索推荐
|

蚂蚁百灵全模态 Ming-flash-omni-2.0 开源!视觉百科+可控语音生成+全能型图像编辑,打破全模态“博而不精”

2月11日,蚂蚁百灵团队开源全模态大模型Ming-flash-omni-2.0(基于Ling-2.0 MoE架构),在视觉理解、语音交互与图像编辑三大领域实现代际跃迁,达开源领先水平。支持多模态统一生成与深度编辑,模型权重与代码已开放。

864 4
|
3月前
|
人工智能 JSON 监控
|

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

本文分享如何用AgentScope框架+AI Agent A2Z平台,一键完成AI Agent生产级部署:解决“开发易、上线难”痛点,快速生成标准/chat接口(如https://agentscope.aiagenta2z.com/deep_research_agent/chat),支持高并发、实时监控与冷启动。

521 5
|
3月前
|
机器学习/深度学习 并行计算 算法
|

LLaDA2.1 正式开源,可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

蚂蚁研究院发布LLaDA2.1,首创“可纠错编辑(ECE)”机制,突破扩散语言模型(dLLM)速度与质量瓶颈:推理达892 TPS,支持极速/质量双模式,并集成业界首个dLLM强化学习框架EBPO。开源即用,迈向真正可用的下一代大模型。

482 6
|
3月前
|
人工智能 文字识别 物联网
|

ModelScope魔搭社区发布月报 -- 26年2月

临近年关,ModelScope迎来春节模型发布潮:Qwen3、GLM-4.7、MiniMax M2.1等大模型密集上新;AIGC生图、语音合成、具身智能全面突破;OpenAPI、OAuth、Gallery等生态基建同步升级,加速AI开源普惠。(239字)

716 7
|
3月前
|
存储 自然语言处理 搜索推荐
|

RAG 应用 —— 解锁大模型在各行业的落地场景与价值

RAG(检索增强生成)技术通过实时接入行业知识库,有效解决大模型知识过时、易幻觉、难适配等痛点,已在金融、医疗、教育、法律、电商五大领域规模化落地,显著提升准确性、合规性与响应效率,成为大模型行业应用的首选路径。(239字)

659 4

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4192
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互