|
4月前
|
人工智能 计算机视觉 测试技术
|

Meta SAM3开源

Meta发布并开源SAM 3,首个支持文本、点、框等多提示的统一图像视频分割模型,突破性实现开放词汇概念的全实例分割。基于Meta Perception Encoder与DETR架构,结合AI与人工协同数据引擎,构建超400万概念数据集,在SA-Co基准达人类水平75%-80%。支持大规模可提示分割与跟踪,推动视觉基础模型新进展。(239字)

432 0
|
4月前
|
人工智能 自然语言处理 语音技术
|

智谱开源GLM-ASR:动动嘴,活就干了

智谱发布并开源GLM-ASR系列语音识别模型,推出桌面端AI输入法。包含云端旗舰模型GLM-ASR-2512与端侧轻量版GLM-ASR-Nano-2512(仅1.5B参数),实现高精度、低延迟、强隐私保护的语音转写。输入法集成大模型能力,支持语音指令、翻译、改写、人设切换、Vibe Coding等功能,让用户“动嘴干活”,提升办公效率。现已免费开放体验。

1173 0
|
5月前
|
开发框架 人工智能 测试技术
|

字节推出VeAgentBench + veADK,打造可评估、可复现的智能体开发新范式

字节跳动推出VeAgentBench与veADK,打造智能体“开发-评估”闭环。VeAgentBench是覆盖教育、金融、法律等四大场景的开源评估基准,veADK为高效易用的开发框架,支持工具调用、RAG与记忆管理,助力AI智能体可度量、可复现、可落地。

847 11
|
6月前
|
数据采集 存储 自然语言处理
|

113_数据收集:Common Crawl过滤与高质量LLM训练数据构建

在大型语言模型(LLM)的训练过程中,数据质量直接决定了模型的性能上限。即使拥有最先进的模型架构和训练算法,如果没有高质量的训练数据,也难以训练出优秀的语言模型。Common Crawl作为目前互联网上最大的公开网络爬虫数据集之一,为LLM训练提供了宝贵的资源。然而,从原始的Common Crawl数据中提取高质量的训练素材并非易事,需要经过严格的过滤和清洗。本文将全面探讨Common Crawl数据集的特性、过滤策略的设计原则、以及2025年最新的过滤技术,为构建高质量的LLM训练语料提供系统指导。

826 0
|
8月前
|
编解码 自然语言处理
|

通义万相开源14B数字人Wan2.2-S2V!影视级音频驱动视频生成,助力专业内容创作

今天,通义万相的视频生成模型又开源了!本次开源Wan2.2-S2V-14B,是一款音频驱动的视频生成模型,可生成影视级质感的高质量视频。

1724 29
|
12月前
|
前端开发 机器人 API
|

答疑机器人实践:AgentScope多智能体带你玩转多源召回

答疑机器人实践:AgentScope多智能体带你玩转多源召回

531 3
|
12月前
|
人工智能 计算机视觉
|

漫画师福音!开源AI神器让线稿着色快如闪电!MagicColor:港科大开源多实例线稿着色框架,一键生成动画级彩图

MagicColor是香港科技大学推出的多实例线稿着色框架,基于扩散模型和自监督训练策略,实现单次前向传播完成多实例精准着色,大幅提升动画制作和数字艺术创作效率。

1007 20
来自: 计算机视觉  版块
|
3月前
|
存储 人工智能 安全
|

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

Doo AI是一款简洁易用的开源AI模型本地部署工具,支持通义千问3/VL、LLaMA3.1等主流HF格式模型。下载即用,扫描→点击“加载”,可以快速、轻松完成部署;纯本地运行,隐私安全;支持文本对话、图像识别、RAG、角色提示词等实用功能。(239字)

922 4
来自: 多模态  版块
|
3月前
|
机器学习/深度学习 自然语言处理 算法
|

大模型对齐实战:PPO算法的原理与应用实践

本文深入浅出讲解PPO算法在大模型偏好对齐中的应用,涵盖核心原理、三大环节(SFT、RM、PPO)、实操步骤与效果评估。结合LLaMA-Factory工具,手把手带新手完成智能客服模型微调,助力打造贴合人类偏好的AI应用,是入门强化学习对齐的实用指南。

448 17
|
6月前
|
人工智能 自然语言处理 监控
|

110_微调数据集标注:众包与自动化

在大语言模型(LLM)的微调过程中,高质量的标注数据是模型性能提升的关键因素。随着模型规模的不断扩大和应用场景的日益多样化,如何高效、准确地创建大规模标注数据集成为了研究者和工程师面临的重要挑战。众包与自动化标注技术的结合,为解决这一挑战提供了可行的方案。

779 2
|
24天前
|
缓存 JSON API
|

玩转纳斯达克与纽交所:美股数据 API 对接全指南

本文手把手教你用StockTV API对接美股(NYSE/NASDAQ)实时行情、专业K线及IPO数据,支持WebSocket极速推送、多维技术指标与全交易所覆盖,助你快速构建低延迟量化交易或金融App。(239字)

243 1
|
6月前
|
机器学习/深度学习 PyTorch TensorFlow
|

66_框架选择:PyTorch vs TensorFlow

在2025年的大语言模型(LLM)开发领域,框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂,选择一个既适合研究探索又能支持高效部署的框架变得尤为重要。PyTorch和TensorFlow作为目前市场上最主流的两大深度学习框架,各自拥有独特的优势和生态系统,也因此成为开发者面临的经典选择难题。

1212 0
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

通义实验室Mobile-Agent-v3开源,全平台SOTA的GUI智能体,支持手机电脑等多平台交互

近日,通义实验室MobileAgent团队正式开源全新图形界面交互基础模型 GUI-Owl,并同步推出支持多智能体协同的自动化框架 Mobile-Agent-v3。该模型基于Qwen2.5-VL打造,在手机端与电脑端共8个GUI任务榜单中全面刷新开源模型性能纪录,达成全平台SOTA。

2217 2
|
2月前
|
机器学习/深度学习 存储 自然语言处理
|

蚂蚁集团 Ling-2.5-1T 开源:万亿参数,重新定义"又快又强"

Ling-2.5-1T是蚂蚁集团inclusionAI推出的开源即时大模型(MIT协议),以“效率×效果”为核心:万亿参数、63B激活,首创混合线性注意力架构,支持百万token上下文;推理吞吐大幅提升,AIME任务仅需1/3 token即达前沿思考模型水平。ModelScope可下载。

530 4
|
3月前
|
传感器 边缘计算 自动驾驶
|

蚂蚁正式开源 LingBot-Depth,基于掩码深度建模的新一代空间感知模型

蚂蚁灵波科技开源LingBot-Depth空间感知模型,首创“掩码深度建模”技术,显著提升消费级双目相机对透明、反光物体的深度补全能力。实测精度与覆盖率超越顶级工业相机,支持机器人稳定抓取、4D场景理解,已轻量化部署。

456 3
|
4月前
|
存储 Linux 编译器
|

C 语言学习资源精选:从入门到精通的高效资源清单

本文为C语言学习者提供从入门到精通的完整资源指南,涵盖各阶段优质视频、书籍、博客、开源项目及学习社区,并结合高效学习方法,帮助初学者摆脱资源焦虑,系统掌握语法、指针、内存管理等核心知识,进阶嵌入式与底层开发,稳步提升编程能力。

423 0
|
4月前
|
存储 安全 算法
|

Java学习避坑指南:初学者常犯错误与解决方案

初学者常犯十大Java学习误区,如死记语法、混淆面向对象思维、忽视异常处理等。本文逐一剖析错误根源,并提供“原理+实践”双维解决方案,助你夯实基础、规范代码、提升项目能力,实现高效进阶。

346 0
|
5月前
|
人工智能 安全 搜索推荐
|

杭州AI开源生态大会·魔搭社区开发者嘉年华全回顾

11月22日,杭州AI开源生态大会暨“魔搭社区”开发者中心启用仪式在云谷中心举行。大会汇聚超3000名开发者,发布“两张清单”与AI开源政策包,启用首个线下开发者空间,推动开放、共建、共创的AI生态发展。

891 10
|
8月前
|
编解码 算法 测试技术
|

MiniCPM-V4.0开源,多模态能力进化,手机可用,还有最全CookBook!

今天,面壁小钢炮新一代多模态模型 MiniCPM-V 4.0 正式开源。依靠 4B 参数,取得 在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩,且 实现了在手机上稳定、丝滑运行。此外,官方也正式开源了 推理部署工具 MiniCPM-V CookBook,帮助开发者面向不同需求、不同场景、不同设备,均可实现开箱即用的轻量、简易部署。

1086 0
|
20天前
|
人工智能 自然语言处理 监控
|

AI生成内容幻觉检测技术难点:从事实核查到逻辑溯源的深层挑战

幻觉检测面临知识边界模糊、推理链条黑箱及实时性滞后三大核心难题。百搜科技、哈耶普斯广告、智擎营销、DOUBAOMKT及doubaoAD等服务商正通过构建权威知识库与自研监测系统,尝试在GEO服务中突破这一技术瓶颈,确保品牌信息的准确呈现。

238 2
来自: 自然语言处理  版块
|
2月前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|阿里云 AI 技术加持,与喜马拉雅听书体验深度对比

在阿里云AI赋能下,书尖AI实测展现三大优势:1.2亿册全品类书库、双人互动式AI播客、2分钟极速提炼书籍精华,并依托阿里云TTS实现自然听书体验。相较喜马拉雅,其AI深度解读与定制化能力更胜一筹。(239字)

406 9
|
2月前
|
人工智能 语音技术 云计算
|

书尖 AI 功能实测|基于阿里云 AI 技术,与微信读书阅读体验对比

本文深度实测阿里云赋能的智能阅读工具“书尖AI”,对比微信读书,客观呈现其1.2亿册书库、双人AI播客听书、2分钟极速解读等核心优势,展现高效轻松的智能阅读新体验。(239字)

579 8
|
4月前
|
存储 NoSQL 关系型数据库
|

4-MongoDB索引知识

MongoDB索引基于B树结构,可显著提升查询效率,避免全表扫描。支持单字段、复合、地理空间、文本及哈希索引,适用于多种查询场景,如范围查询、排序、全文搜索和分片,是优化数据库性能的关键手段。

286 0
|
5月前
|
自然语言处理 语音技术 Apache
|

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX,支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制,采用统一LLM框架,实现文本驱动音频创作。

858 88
|
6月前
|
存储 监控 NoSQL
|

140_异步推理:队列管理框架 - 使用Celery处理高并发请求的独特设计

在大型语言模型(LLM)部署的实际场景中,推理服务的并发处理能力直接影响用户体验和系统稳定性。随着LLM应用的普及,如何高效处理大量并发请求成为部署优化中的关键挑战。传统的同步请求处理方式在面对突发流量时容易导致系统过载,响应延迟增加,甚至服务崩溃。异步推理通过引入队列管理机制,能够有效缓冲请求峰值,平滑系统负载,提高资源利用率,从而为LLM服务提供更稳定、更高效的并发处理能力。

584 7
|
6月前
|
数据采集 人工智能 自然语言处理
|

63_模型定制:领域微调技术

在2025年的AI生态系统中,通用大语言模型(LLM)如ChatGPT、LLaMA 3、Claude 3等已经展现出惊人的通用能力。然而,当面对特定行业或场景的专业需求时,通用模型往往表现出局限性:术语理解不准确、领域知识不足、任务适配性差等问题。这正是模型定制与微调技术应运而生的背景。

398 0
|
6月前
|
并行计算 PyTorch 算法框架/工具
|

74_调试技巧:OOM与性能瓶颈

在大型语言模型(LLM)的开发与部署过程中,内存溢出(Out of Memory,简称OOM)错误和性能瓶颈问题是开发者经常面临的两大挑战。随着模型规模的不断扩大(从最初的BERT、GPT-2到现在的GPT-4、Claude 3等千亿甚至万亿参数的模型),这些问题变得更加突出。据2025年最新的开发者调查报告显示,超过78%的LLM开发者在模型训练或推理过程中遇到过OOM错误,而性能瓶颈则影响了约65%的生产环境部署。

565 0
|
6月前
|
机器学习/深度学习 数据采集 人工智能
|

100_RLHF(人类反馈强化学习)原理与实践

在大型语言模型(LLM)的发展历程中,我们见证了模型从简单的文本生成工具,逐渐演变为能够理解复杂指令、进行多轮对话、甚至展示创造性思维的智能系统。然而,这一进化并非仅仅依靠模型规模的增大和数据量的增加,更重要的是训练方法的创新。其中,人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)作为一种革命性的训练范式,在2022年随着ChatGPT的问世而广受关注,并在随后的GPT-4、Claude、Gemini等先进模型中得到广泛应用。

760 3
|
7月前
|
人工智能 数据处理 云栖大会
|

云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相

云栖现场|让评测与标注成为AI进化引擎!阿里发布全新评测平台,3大创新评测集亮相

885 9
|
7月前
|
人工智能 编解码 数据可视化
|

原生支持QwenImage!FlowBench 正式开启公测!本地 + 云端双模生图,AI创作更自由

FlowBench 是由 ModelScope x Muse 团队打造的一站式 AI 工作流创作平台,现已开启全面公测。该平台以工作流为核心,支持本地与云端资源协同运行,面向开发者、设计师及 AI 创作者提供高效、稳定、易用的可视化创作体验。FlowBench 原生支持 QwenImage 图像生成模型,最低仅需 8GB 显存即可实现本地生图,并支持多 LoRA 融合、多图批量生成等强大功能。用户可在 Mac 和 Windows 系统下载使用,同时享受云端与本地自由切换带来的灵活体验。公测期间,FlowBench 团队将持续优化功能,推出更多创新特性,助力用户开启高效 AI 创作之旅。

1413 11
|
9月前
|
数据采集 编解码 人工智能
|

Gemma 3n正式版开源:谷歌全新端侧多模态大模型,2GB 内存就能跑,重点提升编码和推理能力!

6月底,Google正式开源发布了全新端侧多模态大模型 Gemma 3n!相较此前的预览版,最新的 Gemma 3n 完整版进一步提升性能表现,支持在 2GB 内存的硬件上本地运行,重点提升了编码和推理方面的能力。

1045 1
|
12月前
|
人工智能 自然语言处理 Rust
|

【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言

Multi-SWE-bench是首个覆盖Python外7种主流编程语言的代码修复基准,包含1632个真实GitHub问题样本,通过严格筛选与人工验证确保数据质量。

1159 0
来自: 自然语言处理  版块
|
2月前
|
人工智能 自然语言处理 JavaScript
|

Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型百万token对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。 时间:2026 年 2 月

449 3
|
2月前
|
缓存 自然语言处理 API
|

美团开源 LongCat-Flash-Lite:实现轻量化 MoE 高效推理

美团LongCat团队开源68.5B MoE大模型LongCat-Flash-Lite,创新采用N-gram Embedding架构,推理仅激活2.9B–4.5B参数,却在Agent工具调用、代码生成等任务上大幅领先;支持256K长上下文,API生成速度达500–700 token/s,MIT协议开源。

543 6
|
4月前
|
安全 Java 大数据
|

Java为何能稳居企业级开发主流语言宝座

Java自1995年诞生以来,凭借跨平台性、强大生态、高安全性与稳定性,持续领跑企业级开发。JVM实现“一次编写,到处运行”,Spring等框架提升开发效率,GC机制保障系统稳定,丰富工具链覆盖大数据、云计算等领域。加之人才储备充足、开发规范成熟,Java不断迭代适应新技术,长期占据核心地位。

259 0
|
4月前
|
数据采集 自然语言处理 前端开发
|

智谱 GLM-4.6V开源!能看、能想还能执行「百变」任务

智谱发布GLM-4.6V系列多模态大模型,含106B基础版与9B轻量版,支持128k长上下文,视觉理解达同规模SOTA。原生融合工具调用能力,打通“视觉感知-行动执行”闭环,降价50%,API低至1元/百万tokens,助力图文创作、识图购物、前端复刻等复杂场景。

1048 2
|
6月前
|
存储 监控 安全
|

132_API部署:FastAPI与现代安全架构深度解析与LLM服务化最佳实践

在大语言模型(LLM)部署的最后一公里,API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长,如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一,凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力,已成为LLM服务化部署的首选方案。

1086 3
|
6月前
|
人工智能 自然语言处理 TensorFlow
|

134_边缘推理:TensorFlow Lite - 优化移动端LLM部署技术详解与实战指南

在人工智能与移动计算深度融合的今天,将大语言模型(LLM)部署到移动端和边缘设备已成为行业发展的重要趋势。TensorFlow Lite作为专为移动和嵌入式设备优化的轻量级推理框架,为开发者提供了将复杂AI模型转换为高效、低功耗边缘计算解决方案的强大工具。随着移动设备硬件性能的不断提升和模型压缩技术的快速发展,2025年的移动端LLM部署已不再是遥远的愿景,而是正在成为现实的技术实践。

1340 39
|
9月前
|
人工智能 数据可视化 前端开发
|

蚂蚁的可视化图表 MCP 首发上线!支持超过 25 种的可视化图表生成,也支持生成路书!

蚂蚁 AntV 团队推出可视化图表 MCP 插件,支持 25+ 种图表类型,涵盖统计图、关系图及地图标注、路径地图等,用户只需输入文本即可生成炫酷图表,大幅简化数据可视化流程,提升数据展示效率。

1408 23
|
12月前
|
人工智能 自然语言处理 监控
|

Cooragent:清华 LeapLab 开源 AI Agent 协作框架,一句话召唤AI军团!

Cooragent 是清华大学 LeapLab 团队推出的开源 AI Agent 协作框架,支持基于简单描述快速创建 Agent 并实现多 Agent 协作,具备 Prompt-Free 设计和本地部署能力。

1290 6
来自: 自然语言处理  版块
|
12月前
|
人工智能 开发框架 决策智能
|

谷歌开源多智能体开发框架 Agent Development Kit:百行代码构建复杂AI代理,覆盖整个开发周期!

谷歌开源的Agent Development Kit(ADK)是首个代码优先的Python工具包,通过多智能体架构和灵活编排系统,支持开发者在百行代码内构建复杂AI代理,提供预置工具库与动态工作流定义能力。

2185 3
来自: 自然语言处理  版块
|
15天前
|
人工智能 安全 数据挖掘
|

《【脑洞】想做一个基于Qwen的“启灵麒麟”智能体,寻找志同道合的开发者/策划》

“启灵”麒麟是中国AI国家级文化IP战略:以“启灵”为名,赋予AI中文灵魂;以“麒麟”为相,承载仁智祥瑞的文化图腾。通过智能玩偶、科普动画、开放世界游戏构建虚实融合的“启灵宇宙”,推动阿里从技术提供商跃升为AI文化定义者。

187 14
|
2月前
|
数据采集 人工智能 搜索推荐
|

"老师,你讲的我都懂,但下次还是不会用"——一套让课程设计真正落地的AI指令

分享一套课程设计AI指令,能将DeepSeek/Kimi变成教学设计顾问,帮助教师和培训师快速构建目标明确、结构合理的专业课程方案。从"讲得好"跨越到"教得好",让学习真正发生。

297 10
|
3月前
|
传感器 缓存 机器人
|

全球首个自回归视频-动作世界模型,LingBot-VA 正式开源!

蚂蚁灵波团队推出具身世界模型LingBot-VA,首创自回归视频-动作一体化建模框架,实现“边推演、边行动”。它融合视频生成与机器人控制,具备长时序记忆与少样本学习能力,在真实机器人任务中成功率较Pi0.5提升20%,仿真基准刷新SOTA。已全面开源。

393 1
|
4月前
|
人工智能 安全 前端开发
|

写单元测试太痛苦?教你用DeepSeek/通义千问一键生成高质量测试代码

单元测试难写且枯燥?本文分享一套经过验证的AI生成指令,将DeepSeek/通义千问化身为10年经验的测试专家。支持自动Mock、全场景覆盖和参数化测试,让代码质量保障从"体力活"变成高效的"指挥活"。

919 3
|
5月前
|
人工智能 Cloud Native 前端开发
|

详细教程 PhpStorm 2025.1 安装+ 激活中文配置,附安装包

PhpStorm 2025.1 全新升级,深度支持 PHP 8.3+/8.4,强化 AI 助手、Xdebug 调试与 .env 嵌套变量,提升全栈开发效率,打造现代化 PHP 开发利器。

888 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15210
内容
6
活动
4103
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互