|
6月前
|
IDE 编译器 开发工具
|

嵌入式开发必备!Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含(Keil MDK 5.39)

Keil C51 V9.61是一款专用于8051系列单片机的集成开发环境,支持主流厂商芯片,集编辑、编译、仿真于一体,基于μVision5平台,操作便捷。提供C编译器、汇编器、调试器等全套工具,适用于嵌入式开发。附带安装与激活教程,可实现汉化界面,提升使用体验。(237字)

9707 7
|
29天前
|
机器学习/深度学习 缓存 测试技术
|

DeepSeek-V4开源:百万上下文,Agent能力比肩顶级闭源模型

DeepSeek-V4正式开源!含V4-Pro(1.6T参数)与V4-Flash(284B参数)双版本,均支持百万token上下文。首创混合注意力架构,Agent能力、世界知识与推理性能全面领先开源模型,数学/代码评测比肩顶级闭源模型。

3474 10
|
3月前
|
人工智能 API 对象存储
|

Seedance vs Sora vs Kling:AI 视频生成模型深度对比

本文深度解析Sora、Kling、Runway Gen-3、Seedance等主流文生视频模型的底层原理、性能差异与生产适配性,直击开发者选型难、API碎片化、成本失控三大痛点,提供统一接入方案、智能路由策略与高并发部署实战指南。(239字)

3232 1
|
2月前
|
编解码 物联网 数据处理
|

LTX-2.3开源: 视频生成引擎级升级

Lightricks开源LTX-2.3音视频大模型:重建VAE提升细节锐度,文本连接器扩容4倍增强Prompt遵循,大幅优化I2V运动自然性与音频质量,并首次原生支持1080×1920竖版视频生成。22B参数,支持文生视频、图生视频等多任务。

3868 4
|
22天前
|
人工智能 安全 API
|

Claude Cowork 支持第三方模型接入 开放而不开源

Claude Cowork 正式支持第三方推理平台接入(如Bedrock、Vertex AI、Azure Foundry及兼容/v1/messages的LLM网关),实现工具层与模型层解耦。用户可自由配置国产模型(如Qwen、GLM、DeepSeek等),降低使用门槛与成本,同时保留桌面端Agent工作流、MCP、插件及本地文件访问等核心体验——开放接口,不开放入口。

1229 7
|
4天前
|
机器学习/深度学习 人工智能 算法
|

用好 Codex Goal,关键就这三步

Codex 新增 /goal 命令,支持目标驱动的Agent式循环:设定可量化目标(如“运行时间降20%且测试全通过”)、构建短反馈闭环、用PLAN/EXPERIMENTS等Markdown文件持久化记忆。三要素缺一不可,方能真正释放长任务自动化潜力。

227 1
|
3月前
|
机器学习/深度学习 测试技术 API
|

Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力

通义千问Qwen3.5发布四款中等规模多模态模型,支持256K原生上下文(可扩至1M)、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习,35B-A3B仅激活3B参数即超越旧旗舰,性能、效率与部署成本兼具。(239字)

7936 23
|
2月前
|
人工智能 并行计算 算法
|

video-subtitle-remover(VSR)--开源AI去字幕方案深度解析

VSR(video-subtitle-remover)是一款开源AI视频去字幕工具,支持本地运行,无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型,可智能检测并擦除硬字幕/水印,保持原分辨率与画质。兼容CUDA/DirectML,适配NVIDIA/AMD/Intel显卡,兼顾隐私性、可控性与高性能。

2327 6
来自: 计算机视觉  版块
|
4月前
|
缓存 网络安全 语音技术
|

docker安装部署FunASR

本指南详解FunASR在线语音识别服务的外网部署与内网迁移全流程:先在外网拉取Docker镜像、自动下载模型并启动服务(端口10095),验证成功后,将镜像和缓存模型打包导出;再于内网服务器导入镜像、解压模型、挂载运行,全程禁用SSL,支持热词与标点恢复,开箱即用。

2418 3
来自: 语音  版块
|
5天前
|
机器学习/深度学习 人工智能 算法
|

Ring-2.6-1T 正式开源:为真实复杂任务打造的万亿级思考模型

蚂蚁百灵开源万亿级思考模型Ring-2.6-1T,专注真实复杂任务场景。具备强Agent执行能力、可调high/xhigh推理强度、异步强化学习训练三大突破,已在代码生成、科研分析、企业自动化等长链路任务中验证稳定表现。

205 1
|
1月前
|
人工智能 运维 前端开发
|

Kimi K2.6开源:编码能力比肩闭源顶级模型,支持300智能体协同

Moonshot AI开源Kimi K2.6,主打长时编码、智能体协同与前端设计生成。在Terminal-Bench 2.0、SWE-Bench Pro等基准上达开源SOTA,逼近GPT-5.4与Claude Opus 4.6;智能体集群扩展至300个子智能体、4000协调步。

1140 6
|
3月前
|
人工智能 Linux API
|

[大模型实战 01] 本地大模型初体验:Ollama 部署与 Python 调用指南

大模型实战系列第一篇。拒绝晦涩理论,直接上手!我会带着各位友人们零基础安装 Ollama,利用国内 ModelScope 极速下载模型,详解服务端口配置与 Python 脚本调用,涵盖显存计算与常见避坑指南。

5388 3
来自: 自然语言处理  版块
|
10天前
|
编解码 文字识别 Android开发
|

MiniCPM-V 4.6 开源:1.3B 多模态模型登顶同尺寸榜单,6G 内存跑通手机端

5月11日,面壁智能联合清华、OpenBMB开源新一代端侧多模态大模型MiniCPM-V 4.6。仅1.3B参数,性能登顶同尺寸全球第一,超越Qwen3.5-0.8B与Gemma4-E2B-it;仅需6GB内存即可流畅运行,支持iOS/Android/HarmonyOS。首创ViT早压缩与4倍/16倍混合Token压缩技术,实现“低内存、极速跑”,推动AGI普惠落地。

415 5
|
3月前
|
自然语言处理 前端开发 测试技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

通义千问新推Qwen3-ASR语音识别模型(1.7B/0.6B),支持52种语言及方言,具备高鲁棒性与流式长音频转写能力。联合魔搭社区与Intel® OpenVINO™,实现Intel平台极致加速部署,提供完整开源教程、Notebook示例及Gradio交互Demo。(239字)

2458 6
|
3月前
|
机器学习/深度学习 JSON 文字识别
|

0.9B 小模型,OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR,基于GLM-V架构,融合CogViT视觉编码器与GLM-0.5B语言解码器,支持公式、表格、代码等复杂文档识别,性能达OmniDocBench榜首(94.62分),仅0.9B参数,轻量高效,开箱即用。

2676 3
|
5天前
|
人工智能 JavaScript API
|

实战分享:生产级AI Agents 7天内上线完成网站主页/域名/Agent Workflow/ 部署和出海打榜

实战分享: 从0到1的一周时间上线生产级AI Agent:Craftsman-Agent(一句话生成3D组装方案,支持乐高/Minecraft/特斯拉车衣设计)和CoachOwl(AI协同日程编排工具,支持目标管理、多Agent协作与自动任务调度),打榜均上线Product Hunt,技术栈涵盖Gemini/Qwen、FastAPI、3D渲染API及DeepNLP OneKey Gateway,部署于AI Agent A2Z 平台*.aiagenta2z.com,获得部署托管网站和子域名。

144 2
|
5天前
|
数据挖掘 物联网 API
|

jina-embeddings-v5-omni 发布!全模态向量小模型

Jina发布v5-omni多模态嵌入模型,支持文本、图像、音频、视频,文本向量与v5-text逐字节一致,无需重建索引。small版(1.57B)以1/5参数追平LCO-7B,nano版(0.95B)性能领先LanguageBind 8.9分,训练仅调0.35%参数,兼顾高效与兼容。

139 1
|
11天前
|
JSON NoSQL API
|

开源项目观察|ds4:本地 Agent 推理,不只是把模型跑起来

Redis作者antirez新开源项目ds4(DwarfStar 4),是专为DeepSeek V4 Flash设计的轻量级本地推理引擎。聚焦Agent场景,支持OpenAI/Anthropic API、Disk KV Cache复用、工具调用精准映射与长上下文优化,在MacBook等高端个人设备上实现高效端到端推理。

319 3
|
4月前
|
编解码 物联网 测试技术
|

FLUX.2-Klein 4B/9B开源:亚秒级统一图像生成与编辑

Black Forest Labs开源FLUX.2 [klein]模型家族,兼具文生图、图像编辑与多参考生成能力,端到端推理低至0.5秒,4B版本仅需13GB显存,支持消费级GPU高效运行,量化后速度提升最高2.7倍,Apache 2.0许可商用友好。

3209 1
|
7月前
|
机器学习/深度学习 人工智能 搜索推荐
|

Thinking Machines Lab最新研究结果如何复现?On-Policy Distillation让训练成本直降10倍

Thinking Machines Lab提出On-Policy Distillation技术,让小模型高效继承大模型能力。相比传统强化学习,训练成本降低90%,效率提升十倍,支持本地部署、降低成本与延迟。结合vLLM加速与独立DeepSpeed配置,MS-SWIFT框架实现开箱即用的高效蒸馏训练,助力轻量模型具备“会思考、能纠错、可进化”的智能。

1571 10
|
8月前
|
XML 自然语言处理 数据可视化
|

免费!文本表格不会总结、分析?文本表格可视化!帮你轻松解决困扰,保姆级级教程。【附Coze工作流】

本文介绍了如何利用“扣子”平台创建资源,通过可视化工作流处理并分析文档、表格、PDF等内容,帮助用户快速获取文件核心信息。内容涵盖登录、资源创建、工作流配置及运行操作,适用于多种文件格式,如CSV、Excel、PDF等。

3767 4
|
7月前
|
机器学习/深度学习 人工智能 API
|

用Macbook微调Qwen3!手把手教你用微调给Qwen起一个新名字

本文介绍如何在MacBook上使用苹果MLX框架高效微调Qwen3大模型。借助MLX的高性能计算与统一内存架构,仅需2分钟即可完成训练,内存占用低至2GB,推理速度达400 Token/s,并支持快速部署为本地API服务,展现Mac轻薄本的强大AI生产力潜力。

3214 16
|
8天前
|
人工智能 机器人 测试技术
|

用 Bub 和飞书搭一个更懂群聊上下文的小机器人

手把手教你搭建 Bub:一个懂群聊上下文、无“班味”的轻量化 AI 助理。

180 1
|
3月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3.5:迈向原生多模态智能体

除夕夜,通义千问发布Qwen3.5-397B-A17B:全球首个原生多模态MoE大模型,总参3970亿、仅激活170亿参数,性能媲美万亿模型;支持201种语言、超强视觉理解与GUI智能体能力,已开源至GitHub与ModelScope。

4406 4
|
6月前
|
人工智能 物联网 测试技术
|

Qwen-Image-Edit:全能图像编辑,驱动内容创作提质增效

通义千问团队开源Qwen-Image-Edit,基于20B模型,支持语义与外观双重编辑、精准中英文文字修改,具备SOTA图像编辑能力,可用于IP创作、风格迁移、文字修复等。

5951 6
|
2月前
|
人工智能 API 开发工具
|

Silly Tavern 免费API保姆级教学

本指南详解Windows下安装SillyTavern全流程:先安装Node.js与Git,再克隆仓库(推荐Gitee镜像),双击Start.bat启动;接着配置OpenAI兼容API(如Canopy Wave),填入Key与端点;最后下载导入角色卡,即可开启AI角色对话体验。(239字)

2053 1
|
7月前
|
文字识别 测试技术 开发者
|

Qwen3-VL新成员 2B、32B来啦!更适合开发者体质

Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!

6919 12
|
5天前
|
人工智能 自然语言处理 文字识别
|

WeaveFox,个人创作者的 AI 应用助手

WeaveFox 是一款免费的 AI 驱动应用创作平台,2个月全新重构升级。无需代码,用自然语言即可生成可运行、可部署的全栈应用。支持灵感澄清、AI建站、技能扩展、云服务集成与团队协作,助力个人、OPC及非技术人员快速实现创意变现。

110 1
|
3天前
|
人工智能 安全 Shell
|

Harness Engineering 被讲烂之后,Agent 工程真正难的是什么?

看 Anthropic、OpenAI、Gemini 的 Harness 都在做啥?

107 1
|
3月前
|
安全 API Docker
|

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

本文教你用 Docker 一键部署 Open WebUI,为本地 Ollama 模型打造媲美 ChatGPT 的图形化界面:支持流畅对话、本地知识库(RAG)检索增强、自定义角色(Agent),全程私有化、零数据上传,10分钟即可启用!

2362 3
|
5天前
|
存储 人工智能 JSON
|

日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命

本文提出AI时代“日抛型软件”新范式:日抛非终点,而是进化起点。基于AISTUDIO双线架构(Build链即时生成+Designer链持久沉淀),实现“双遗产”——参数权重持续优化(越用越懂用户)与领域知识动态沉淀(生成越来越专业),推动软件从消耗品跃升为认知引擎。(239字)

106 0
|
25天前
|
消息中间件 缓存 API
|

DeepSeek-V4 核心能力落地与实战应用指南:从底层机制到多智能体架构复盘

本文以SaaS架构师视角,深度解析DeepSeek-V4在真实生产环境中的工程落地:聚焦上下文缓存优化、强约束JSON输出、多智能体协同调度,并分享高并发下的三大避坑实战指南,助力开发者高效构建AI原生应用。

633 6
|
5月前
|
数据采集 人工智能 数据挖掘
|

Claude Skills的开源实现

Claude推出Skills系统,让AI按需加载专业能力。受此启发,我在开源Minion框架中实现了兼容版本:通过声明式SKILL.md定义技能,支持PDF、Excel等文档处理,实现动态加载、分层搜索与智能注册,降低上下文开销,提升效率。项目支持多LLM、可定制、易扩展,推动构建开放的AI Agent技能生态。

2600 0
|
3月前
|
编解码 自然语言处理 语音技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

通义千问推出Qwen3-TTS系列开源语音模型,支持中英日韩等10种语言,具备声音克隆、情感适配与高保真端到端合成能力;结合Intel OpenVINO™可在CPU上高效推理,无需GPU,轻松部署于边缘设备。(239字)

1378 6
|
9天前
|
SQL 缓存 druid
|

一次 OOM 线上排查实录

老项目线上 OOM 踩坑实录!Druid 连接池 SQL 缓存泄漏 + 业务 SQL 拼接双重叠加导致内存溢出,通过堆 dump 定位问题,优化 Druid 配置 + 批量插入预防 OOM。

143 2
|
4月前
|
人工智能 自然语言处理 数据挖掘
|

Qwen3-VL-Embedding & Qwen3-VL-Reranker:统一多模态表征与排序

通义千问Qwen团队于2025年1月8日推出多模态模型新成员:Qwen3-VL-Embedding与Qwen3-VL-Reranker,基于Qwen3-VL构建,支持文本、图像、视频等多模态统一表示与跨模态检索,在图文匹配、视觉问答等任务中表现卓越,具备高精度、多语言、易集成等优势,助力全球开发者构建高效多模态应用。

2935 4
|
12天前
|
人工智能 前端开发 数据可视化
|

HTML is the new Markdown:来自 Claude Code 团队的实践

AI Agent兴起后,Markdown因简洁易编辑成为默认输出格式。但Anthropic工程师Thariq提出:HTML正成为“新Markdown”——它通过CSS、交互元素、图表与响应式布局,显著提升信息密度与可读性,更适合PR评审、设计原型、技术报告等复杂场景。业界共识渐明:Markdown适合作为AI与开发者的轻量底稿,HTML则担当面向人类的展示与协作层。

293 3
|
9天前
|
缓存 安全 Unix
|

理解虚拟内存:程序看到的地址为什么不是真实内存

虚拟内存通过页表、TLB 与缺页机制,实现安全高效的内存管理。

159 2
|
10天前
|
人工智能 前端开发 测试技术
|

AI Coding Agent 如何工程化:从上下文污染到多 Agent 分工

复杂任务不仅需要会写代码 Agent,更需要能够负责派活、整理结果与汇报 Manager Agent~

190 1
|
5月前
|
人工智能 自然语言处理 语音技术
|

通义百聆语音双子星,同步开源!

通义百聆全新升级,推出Fun-CosyVoice3与Fun-ASR系列模型。3秒录音即可实现9种语言、18种方言及多情感音色克隆,支持中英混说、跨语种合成;Fun-ASR识别准确率高达93%,支持31种语言自由混说、歌词说唱识别,并开源轻量级模型,助力高效本地部署与定制开发。

1809 5
|
5月前
|
JSON 安全 JavaScript
|

HTTPS 原理

HTTPS是HTTP与SSL/TLS的结合,通过数字证书验证身份,利用非对称加密安全交换会话密钥,再以对称加密高效传输数据。它确保了通信的机密性、完整性和服务器真实性,在互联网上构建安全加密通道。

6296 2
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Z-Image:冲击体验上限的下一代图像生成模型

通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。

5003 9
|
8月前
|
自然语言处理 机器人 图形学
|

腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型

腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对…

1707 2
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AgentEvolver:让智能体系统学会「自我进化」

AgentEvolver 是一个自进化智能体系统,通过自我任务生成、经验导航与反思归因三大机制,推动AI从“被动执行”迈向“主动学习”。它显著提升强化学习效率,在更少参数下实现更强性能,助力智能体持续自我迭代。开源地址:https://github.com/modelscope/AgentEvolver

2494 38
|
17天前
|
开发框架 人工智能 分布式计算
|

蚂蚁百灵双响开源:万亿旗舰 Ling-2.6-1T 与 高效 Agent 主力 Ling-2.6-flash

蚂蚁百灵开源双模型:Ling-2.6-1T(万亿参数旗舰)专注复杂任务多步执行与高智效比;Ling-2.6-flash(104B/7.4B激活)主打极致推理速度与Agent场景,Token效率达业界领先。二者兼顾“强智能”与“真落地”,全面支持生产级AI工作流。

325 1
|
3月前
|
机器学习/深度学习 人工智能 算法
|

GLM-5开源:迈向Agentic Engineering新范式,社区Day0 部署、推理实战来了!

智谱发布GLM-5:开源SOTA大模型,Coding与Agent能力双强,真实编程体验媲美Claude Opus 4.5;全球AI榜单排名第四、开源第一;MIT协议开源,支持复杂系统工程与长程Agent任务。

2863 5
|
4月前
|
存储 人工智能 安全
|

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

Doo AI是一款简洁易用的开源AI模型本地部署工具,支持通义千问3/VL、LLaMA3.1等主流HF格式模型。下载即用,扫描→点击“加载”,可以快速、轻松完成部署;纯本地运行,隐私安全;支持文本对话、图像识别、RAG、角色提示词等实用功能。(239字)

1488 4
来自: 多模态  版块
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
|

B站开源IndexTTS2,用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。

3740 62
|
3月前
|
人工智能 数据可视化 物联网
|

[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3

本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型,仅需Kaggle免费T4显卡,速度提升2–5倍、显存节省60%;三步实现“灵魂认主”,让模型自认“AlgiebaLLM AI”,全程代码简洁,零基础可上手。

1001 7
来自: 自然语言处理  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4192
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互