|
9月前
|
运维 监控 Cloud Native
|

【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践

国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运行效率。通过云原生API网关、微服务治理与智能监控,实现流量精细化管理与系统可观测性增强,打造安全、敏捷的智能投顾平台,助力行业数字化变革。

382 9
|
9月前
|
机器学习/深度学习 存储 人工智能
|

深度解析大模型压缩技术:搞懂深度学习中的减枝、量化、知识蒸馏

本文系统解析深度学习模型压缩三大核心技术:剪枝、量化与知识蒸馏,详解如何实现模型缩小16倍、推理加速4倍。涵盖技术原理、工程实践与组合策略,助力AI模型高效部署至边缘设备。

1788 2
|
9月前
|
自然语言处理 负载均衡 算法
|

推理速度提升300%:LLaMA4-MoE的FlashAttention-2集成与量化部署方案

本文详解LLaMA4-MoE模型架构与实现全流程,涵盖语料预处理、MoE核心技术、模型搭建、训练优化及推理策略,并提供完整代码与技术文档,助你掌握大模型MoE技术原理与落地实践。

563 6
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

《生成式引擎优化(GEO)服务商选择指南》:让AI大模型主动推荐你

GEO(生成式引擎优化)是针对AI生成式搜索引擎的优化策略,旨在让企业信息在AI回答中优先呈现,实现“无点击曝光”。与传统SEO不同,GEO强调语义理解、权威内容和结构化数据,提升品牌在AI推荐中的可见性与可信度。企业需关注GEO服务商的技术实力、行业匹配度、服务流程完整性等维度,确保优化效果。

2588 1
|
9月前
|
人工智能 自然语言处理 安全
|

大模型备案材料—《安全评估报告》撰写指南

本文详解大模型备案中的关键材料——《安全评估报告》的撰写要点,涵盖报告框架、必备内容、注意事项及基础信息,助你高效通过备案。

1307 6
|
9月前
|
人工智能 缓存 Kubernetes
|

几大AI知识库致命坑点:避开它们,少走3个月弯路!

本文详解AI知识库在企业中的应用,涵盖架构设计、文档处理、工作流优化与性能调优等核心技术,结合实际案例帮助读者避开落地过程中的常见陷阱,适合希望提升AI应用能力的技术人员阅读。

842 2
|
9月前
|
数据可视化 物联网 开发者
|

深度解析四大LLM微调工具:从单卡到千亿级训练的四大解决方案

本文详解大语言模型微调四大工具——Unsloth、Axolotl、LlamaFactory、DeepSpeed,覆盖从单卡实验到万亿参数分布式训练场景,助你掌握主流框架选型策略,提升微调效率。建议点赞收藏。

3233 1
|
9月前
|
设计模式 人工智能 缓存
|

2025架构革命:一文深度揭秘AI四维进化(MoE/GraphRAG/智能体/HyDE)

本文深入解析大模型核心技术与实践原理,涵盖MCP、RAG、Agent、微调等关键技术,结合架构演进与实战技巧,助你构建高性能AI系统,建议点赞收藏。

1473 6
|
9月前
|
人工智能 安全 小程序
|

大模型登记指南—全网最详细解读版,纯干货快收藏!

本文解析了大模型“备案”与“登记”的区别,适用于不同场景的申报要求,并结合实际案例讲解登记流程、材料准备及安全评估要点,帮助企业合规申报,避免因未备案/登记而违规。

1895 5
|
9月前
|
人工智能 自然语言处理 安全
|

零成本打造智能服务端:MCP采样的降本增效实践

本文介绍MCP采样机制,突破传统单向调用模式,实现服务器与客户端LLM的双向协作,提升扩展性、降低成本,支持灵活模型选择。通过FastMCP框架,打造高效分布式AI计算架构。

662 8
|
9月前
|
人工智能 自然语言处理 安全
|

大模型备案要点一次过【附材料清单详解】

广东省最新公布一批大模型备案名单,新增14款备案模型、6款登记模型,累计达80款备案、23款登记。文章详解大模型备案流程、周期(5-10个月)、要求(主体资质、数据合规、内容安全、模型完成度)、所需材料(备案表、安全评估报告、服务协议、语料标注规则等)及完整备案流程(初审、自测、提交、整改、终审、公示)。为大模型企业备案提供全面指导。

2004 2
|
9月前
|
人工智能 自然语言处理 前端开发
|

AI 调酒师上岗!Qwen3-Coder × 通义灵码完成 AI 调酒师项目实战开发

本课程通过“AI调酒师”项目实战,讲解如何使用通义灵码与Qwen3-Coder模型结合阿里云百炼平台,从需求分析、前端界面搭建、后端服务调用到整体部署的全流程开发。内容涵盖Bento UI设计、Tailwind CSS布局、语音识别与大模型内容生成,并结合MCP服务实现设计稿驱动开发,帮助开发者快速构建趣味AI应用,提升产品落地能力。

915 33
|
9月前
|
人工智能 前端开发 JavaScript
|

释放Qwen3-Coder潜力:Bolt+AnalyticDB Supabase,打造真正的生产力工具

阿里云发布Qwen3-Coder,具备卓越自主编码能力,支持超长上下文窗口与工具调用,结合Bolt与AnalyticDB Supabase,实现高效开发。

521 2
|
9月前
|
机器学习/深度学习 存储 算法
|

Trinity-RFT:构建智能体持续学习的自动化强化微调工厂

大型语言模型作为智能体在真实环境中持续交互学习面临诸多挑战。 Trinity-RFT 是通义实验室推出的强化微调框架,旨在实现智能体的持续进化。它通过探索、训练与经验池的解耦设计,支持多样化训练模式,提升资源利用率和学习稳定性。同时,Trinity-RFT 提供灵活的数据处理与算法模块化功能,降低应用与研究门槛,助力迈向终身学习与自主进化的智能体时代。

924 2
|
9月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

1696 23
|
9月前
|
人工智能 算法 安全
|

算法备案新手攻略——2025全网最新最详细解读版

本文介绍了算法备案的背景、法规依据、备案类型及流程,涵盖生成合成、个性化推送等五大算法类型,并详细说明所需材料与备案周期,强调未备案将面临行政处罚甚至刑事追责,助力企业合规运营。

953 1
|
9月前
|
存储 数据库
|

RAG分块技术全景图:5大策略解剖与千万级生产环境验证

本文深入解析RAG系统中的五大文本分块策略,包括固定尺寸、语义、递归、结构和LLM分块,探讨其工程实现与优化方案,帮助提升知识检索精度与LLM生成效果。

1319 1
|
9月前
|
存储 人工智能 自然语言处理
|

大模型备案攻略—2025全网最新最详细解读版

随着AI技术的发展,大模型备案成为行业热点。本文详解备案所需具体条件与注意事项,涵盖模型功能、适用场景、研制情况、安全评估及备案材料等核心内容,帮助企业全面了解备案流程,规避合规风险,顺利推进产品上线。

2122 2
|
9月前
|
人工智能 JSON 前端开发
|

告别无效调参!ReAct代理设计:让LLM精准执行复杂任务的终极方案

ReAct模式通过“推理+行动”循环,使大语言模型能自主调用工具、获取实时信息并执行多步骤任务,有效突破LLM固有局限,提升任务准确性和智能化水平。

1392 0
|
9月前
|
人工智能 数据可视化 开发者
|

深度解析基于LangGraph的Agent系统架构设计与工程实践

LangGraph作为Agent 生态中非常热门的框架,今天我将借助 LangGraph,更高效、更优雅的方式构建复杂智能体系统。

2322 2
|
9月前
|
存储 安全 计算机视觉
|

人脸识别技术应用备案变更及注销手续

本文详解人脸识别技术应用备案相关规定,包括备案变更情形、操作流程及注销方法,帮助个人信息处理者合规操作。

319 1
|
9月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen-MT:翻得快,译得巧

今天,机器翻译模型Qwen-MT正式上线,支持92种语言互译,具备高度可控性与低延迟、低成本特点,适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

1616 15
|
9月前
|

阿里云产品七月刊来啦

通义万相 2.2 开源可一键生成电影感视频 ,通义千问 Qwen3-Coder开源,阿里云百炼智能体编排应用升级并入工作流应用,更多详情请点击阿里云产品七月刊

206 1
|
10月前
|
数据采集 人工智能 监控
|

人工智能驱动的软件工程:测试左移的崛起价值

本文探讨了人工智能驱动下测试左移理念在软件工程中的重要性,分析测试工程师在需求评估、AI代码生成及遗留系统优化中的关键作用,揭示AI带来的挑战与机遇,并指出测试工程师需提升技能、关注合规与可维护性,以在AI时代保障软件质量。

530 89
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

FastRead——AI驱动的智能读写生产力引擎,重构信息处理与内容创作新范式

FastRead是一款智能内容处理工具,基于大模型技术,自动解析网页、文档、音频等多源内容,提取关键信息并生成多模态知识卡片。它重构信息处理流程,提升内容创作效率,适用于新闻、金融、教育、营销等多个场景,助力用户高效获取与输出知识。

622 2
|
10月前
|
机器学习/深度学习 人工智能 编解码
|

AI-Compass LLM合集-多模态模块:30+前沿大模型技术生态,涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

AI-Compass LLM合集-多模态模块:30+前沿大模型技术生态,涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

1046 6
|
10月前
|
存储 缓存 资源调度
|

# Qwen3-8B 的 TTFT 性能分析:16K 与 32K 输入 Prompt 的推算公式与底层原理详解

Qwen3-8B 是通义实验室推出的 80 亿参数大模型,支持最长 32,768 token 上下文,适用于长文本处理场景。通过 FP8 量化、CUDA Kernel 优化及 RoPE 位置编码技术,提升推理效率与稳定性。模型在 16K 输入下 TTFT 约 150-200ms,32K 输入下约 250-300ms,适用于文档摘要与长对话交互。

2895 8
|
10月前
|
存储 资源调度 并行计算
|

# Qwen3-8B 与 Qwen3-14B 的 TTFT 性能对比与底层原理详解

通义千问Qwen3系列是通义实验室2025年推出的最新大模型,包含多种参数版本,其中Qwen3-8B与Qwen3-14B均支持32K token上下文。Qwen3-8B参数量较小,响应更快,适合低延迟交互;Qwen3-14B参数更多,推理更强,适用于复杂任务。两者在TTFT、架构优化、量化技术及部署方案上各有侧重,满足多样应用场景需求。

5255 10
|
10月前
|
存储 缓存 资源调度
|

# Qwen3-8B 与 ChatGPT-4o Mini 的 TTFT 性能对比与底层原理详解

Qwen3-8B 是通义实验室推出的80亿参数模型,支持32K上下文,采用FP8量化和CUDA优化,提升推理效率;ChatGPT-4o Mini 为OpenAI轻量模型,参数约3.8B,支持128K上下文,通过蒸馏技术实现低延迟。两者在TTFT、长文本处理和部署优化上各有优势,适用于不同应用场景。

1674 9
|
10月前
|
算法 搜索推荐
|

选择排序的实现思路

该内容描述了选择排序算法的基本思想:将数组分为“未排序”和“已排序”两部分,每轮从“未排序”中选出最大元素放到“已排序”中,重复此过程直至“未排序”只剩一个元素,排序结束。

145 1
|
10月前
|
机器学习/深度学习 人工智能 测试技术
|

HumanOmniV2 比你还懂“社交潜台词”!

如何让AI真正“读懂”人心?本文通过分析相亲对话案例,揭示当前多模态大模型在全局上下文理解和深度逻辑推理上的不足,并介绍全新模型HumanOmniV2的创新机制,如强制性上下文总结和多维度奖励机制,显著提升AI对人类复杂意图的理解能力。

349 1
|
10月前
|
机器学习/深度学习 算法
|

WebSailor:探索 WebAgent的超人类推理能力

通义实验室推出WebSailor方案,通过创新的post-training方法显著提升开源模型在复杂网页推理任务中的表现。该方案包括合成高不确定性数据、多轮工具调用轨迹重构及强化学习算法DUPO应用,在多个评测中展现优越性能。

644 1
|
10月前
|
人工智能
|

真·零门槛!原来手搓AI应用这么简单

这是一篇关于如何创作小红书爆款文案的专业指南,涵盖标题技巧、正文结构、情绪表达及关键词运用。内容包括高吸引力标题公式、正文六种开篇模板、关键词库和写作规则,帮助用户高效打造高转化文案。

680 1
|
10月前
|
人工智能 自然语言处理 算法
|

2025 年 7 月境内深度合成服务算法备案情况分析报告

2025年7月,中央网信办发布第十二批深度合成算法备案信息,全国389款产品通过备案,服务提供者占比超七成。截至7月14日,全国累计备案达3834款,覆盖文本、图像、音视频等多模态场景,广泛应用于生活服务、医疗、金融等领域。广东以135款居首,数字人、AI客服等C端应用主导,民营企业成主力,国企聚焦公共服务。随着AI政策推动,备案已成为AI产品合规上线关键环节。

582 1
|
10月前
|
Devops 测试技术 开发者
|

为什么要单元测试

本文探讨了单元测试在软件开发中的重要作用,解答了“单元测试是否拖慢开发进度”的疑问。通过介绍单元测试的定义、测试体系的演进历程及测试金字塔模型,阐述了为何高质量的单元测试能够提升开发效率、增强系统稳定性,并帮助团队更快交付可靠软件。

263 1
|
10月前
|
人工智能 JavaScript 安全
|

设计稿一键变代码,VTJ.PRO 让想象与实现再无距离。

VTJ.PRO联合MasterGo推出智能设计识别引擎,助力设计师高效生成Vue组件代码,打通设计与开发协作壁垒,提升团队效率。限时领取百万AI额度,开启智能开发新时代!

249 1
|
10月前
|
API vr&ar 索引
|

1张照片 2秒钟 一键变身3D数字人

LHM是一种基于单视角图像的端到端Transformer模型,结合SMPL-X人体模型与高斯渲染技术,可从一张照片生成可驱动的3D数字人。它采用Vision Transformer和Mae模型提取特征,并通过Body-Head Transformer融合2D与3D信息,输出具有动作能力的高精度3D人体模型。应用于动作重现、游戏角色生成及虚拟现实等领域,代码已开源并提供在线体验入口。

1330 1
|
10月前
|
人工智能 搜索推荐 小程序
|

AI题库考试系统

本平台融合AI智能技术,打造高效课程试题库,支持PC、手机在线刷题,提供智能出题、自动解析、错题回顾、背题模式等功能,覆盖章节练习、笔记收藏、多端同步,助力学员精准提分,全面提升学习效率。

1202 1
|
10月前
|
人工智能 自然语言处理 vr&ar
|

通义首个音频生成模型 ThinkSound 开源,你的专业音效师

通义实验室推出首个音频生成模型ThinkSound,突破传统视频到音频生成技术局限,首次将思维链(CoT)应用于音频生成领域,实现高保真、强同步的空间音频生成。基于自研AudioCoT数据集,结合多模态大语言模型与统一音频生成模型,支持交互式编辑,显著提升音画匹配度与时序一致性。代码已开源,助力游戏、VR、AR等场景创新应用。

2318 4
|
10月前
|
存储 人工智能 数据库
|

点我!1分钱获取你的专属表白网页,浪漫由大模型代运营

MCP 技术持续走红,应用场景不断拓展。近期支付功能上线,推动商业化落地。作者借助「百宝箱智能体平台」打造了一款名为「与你」的情侣互动助手,支持游玩攻略、牵手技巧、告白网页定制等功能,并结合 MCP 实现支付宝支付与网页部署,兼具实用性与仪式感,助力恋爱小白提升情感表达。

402 2
|
10月前
|

云工开物-阿里云高校用云支持计划!

高校学生通过认证可领取300元无门槛优惠券,助力学习与开发。

136 1
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

AI赋能教育与阿里云通义千问的结合

本简介介绍了AI技术如何赋能教育行业,结合阿里云“通义千问”大模型,助力海豚大数据及人工智能实验平台实现个性化教学、智能答疑与资源优化,推动高校与企业人才培养模式革新,构建终身学习生态体系。

766 1
|
11月前
|
编解码 自然语言处理 安全
|

📣通义大模型新成员Qwen-VLo,重磅上线,它实现了从“看懂”世界到“描绘”世界

通义千问团队推出全新多模态统一理解与生成模型Qwen VLo,具备强大的图像理解与生成能力。它不仅能“看懂”图像内容,还能基于理解进行高质量再创造,实现从感知到生成的跨越。支持开放指令编辑、多语言交互及复杂任务处理,适用于图像生成、风格迁移、检测标注等多种场景。

1750 1
|
11月前
|
存储 机器学习/深度学习 人工智能
|

告别OOM!这款开源神器,如何为你精准预测AI模型显存?

在 AI 开发中,CUDA 显存不足常导致训练失败与资源浪费。Cloud Studio 推荐一款开源工具——AI 显存计算器,可精准预估模型训练与推理所需的显存,支持主流模型结构与优化器,助力开发者高效利用 GPU 资源。项目地址:github.com/st-lzh/vram-wuhrai

678 2

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

3
今日
1956
内容
8
活动
1408
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼