|
人工智能 开发工具 git
|

使用Git LFS从Hugging Face下载大型语言模型

Hugging Face作为主流的模型库,提供了大量预训练模型,但这些模型的大尺寸使得直接下载可能会遇到困难。Git LFS(Large File Storage)作为Git的一个扩展,为我们提供了一个解决方案

2086 0
|
2月前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:通俗理解大模型量化:从概念到实践的原理流程完整拆解.38

大模型量化是通过降低参数精度(如FP32→INT8),在几乎不损精度的前提下,显著压缩模型体积、提升推理速度、降低硬件门槛与功耗的关键技术,使大模型得以落地手机、PC等端侧设备。

406 16
|
3月前
|
人工智能 监控 算法
|

智能体来了(西南总部)系统设计:AI 调度官的多智能体调度模型

AI调度官作为多智能体系统的核心协调者,通过角色分工、流程显性化、约束控制与闭环反馈,实现智能体高效协同,提升系统稳定性与可治理性,推动AI从单点能力迈向组织级数字基础设施,具备跨行业复用潜力,是产业智能化演进的关键范式。

268 3
|
3月前
|
人工智能 架构师 安全
|

后大模型时代:从 Model 到 Agent,下一代企业级应用架构演进指南

摘要:当大模型(LLM)的能力逐渐同质化,基于 Agent(智能体)的应用架构正在成为新的技术护城河。本文将探讨 Agent 如何重构软件开发范式,并梳理开发者在这一转型过程中所需的关键技术栈。

332 2
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:三十八、告别“冷启动”:看大模型如何解决推荐系统的世纪难题

协同过滤是推荐系统中广泛使用的技术,其核心思想是利用用户行为数据发现相似用户或物品进行推荐。摘要包括:1)协同过滤基于用户历史行为数据,通过计算相似度(如余弦相似度、皮尔逊相关系数)预测用户偏好;2)主要分为基于用户(寻找相似用户群体)和基于物品(发现相似物品)两种方法;3)面临冷启动、数据稀疏性等挑战,可通过混合推荐(结合内容特征)和矩阵分解等技术解决;4)典型应用包括电商猜你喜欢和流媒体推荐;5)结合大语言模型可增强语义理解能力,提升推荐准确性。

582 9
|
6月前
|
人工智能 搜索推荐 程序员
|

从程序员到UP主:一个结构化的B站视频文案生成方案

专为技术人打造的B站视频文案生成指令,结构化拆解内容创作流程。输入主题、类型等信息,结合AI一键生成含分镜脚本、标题、SEO及互动设计的完整方案,提升创作效率与视频质量。

864 2
|
6月前
|
机器学习/深度学习 测试技术
|

先SFT后RL但是效果不佳?你可能没用好“离线专家数据”!

通义实验室Trinity-RFT团队提出CHORD框架,通过动态融合SFT与RL,解决大模型训练中“越学越差”“顾此失彼”等问题。该框架引入细粒度Token级权重与软过渡机制,实现从模仿到超越的高效学习,在数学推理与通用任务上均显著提升性能,相关代码已开源。

770 0
|
7月前
|
存储 人工智能 资源调度
|

MCP协议深度集成:生产级研究助手架构蓝图

本文详解基于LangGraph与MCP协议构建研究助手的技术方案,涵盖双服务器集成、状态化智能体设计与用户元命令控制,助你掌握生产级代理系统开发要点。

611 1
|
12月前
|
机器学习/深度学习 人工智能 算法
|

算法备案全流程实操

随着《生成式人工智能服务管理暂行办法》在2024年实施,算法备案成为强制性要求。未合规将导致APP下架或高额罚款。本文详解算法备案的核心逻辑与流程,涵盖必备案算法类型、三大监管红线、六大阶段的关键节点,并提供阿里云工具支持,如合规预评估平台和备案助手插件。内容包括金融风控算法的可解释性要求、生成式AI的内容安全措施及个人开发者的技术能力证明方法,助力开发者实现持续合规。

1499 4

hashCode()和 equals()方法的默认实现

在Java中,`hashCode()` 和 `equals()` 方法的默认实现由 `Object` 类提供。`equals()` 默认比较对象引用是否相同,`hashCode()` 则返回对象的内存地址的整数表示。为了确保哈希表等数据结构的正确性,当重写 `equals()` 时,通常也需要重写 `hashCode()`。

533 9
|
存储 SQL 人工智能
|

从 CodeGemma 到 CodeQwen1.5:开源编程大模型百家争鸣

笔者最近刚刚试用完 CodeGemma ,准备分享我的心得时,通义千问的 CodeQwen1.5 就也悄然发布。本文主要介绍 CodeQwen1.5 这款开源编程大模型,并展示如何在 VSCode 中使用它帮你提升编程体验。

2283 0
|
人工智能 测试技术 开发者
|

大模型自动生成并运行代码的体验与优化

随着近两年大模型的不断发展,它们在各个领域展示出了惊人的能力,可以说是在各个领域到了“开花结果”的阶段。比如最近技术圈比较火的阿里云的通义千问已经可以自己写代码、跑代码了,作为开发者,我觉得这种能力不仅提高了开发效率,还推动了编程实践向更高层次的转变和发展。但是,在使用大模型自动生成代码时,我们也会面临一些挑战,其中之一是代码可能会曲解开发者的需求。那么本文就来分享一下个个人的体验以及如何优化这种情况。

1671 2
|
Web App开发 人工智能 达摩院
|

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

3075 0
|
30天前
|
人工智能 自然语言处理 前端开发
|

告别Agent Skills, 拥抱 Agent Apps

在AI Agent时代,传统GUI为人类设计,而LLM缺乏视觉、双手与持续感知能力。AOTUI(面向Agent的文本界面)应运而生:以语义化Markdown替代像素渲染,用类型化引用(如`Contact:contacts[2]`)实现“选择”,以Tool函数调用替代鼠标操作,构建专为LLM优化的离散快照式交互范式。

248 9
|
6月前
|
存储 缓存 PyTorch
|

如何优雅地为 TensorRT-LLM 添加新模型

本指南详细介绍如何在TensorRT-LLM中优雅集成新大语言模型,涵盖模型配置、定义、权重加载与注册全流程,支持作为核心模块或独立扩展集成,助力高效推理部署。(238字)

361 1
|
11月前
|
人工智能 API 开发者
|

用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频

魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。

3404 41
|
人工智能 自然语言处理 算法
|

接入DeepSeek需要做算法备案吗?一文读懂算法备案的那些事儿

在AI快速发展的今天,算法备案成为企业合规运营的关键。本文通过五个案例解析接入DeepSeek是否需备案:1) 微调模型需备案,流程4-6个月;2) 面向公众服务需备案;3) 内部使用通常无需备案;4) 个人自用无需备案;5) 面向特定专业人士通常无需备案。了解这些要求,确保企业在享受AI红利的同时合规运营,规避风险。

1835 15
ly~
|
人工智能 搜索推荐 自动驾驶
|

人工智能的应用

人工智能在多个领域广泛应用,包括:医疗领域的疾病诊断、药物研发和医疗机器人;交通领域的自动驾驶和智能交通管理;金融领域的风险评估、金融诈骗检测和投资决策;教育领域的个性化学习和智能辅导;工业领域的质量检测和生产流程优化;家居领域的智能家居系统,如智能音箱和智能灯具等,极大提升了各行业的效率与服务质量。

1115 1
|
人工智能 自然语言处理 机器人
|

【Prompt Engineering 提示词工程指南】​文本概括、信息提取、问答、文本分类、对话、代码生成、推理​

本文介绍了使用提示词与大语言模型(LLM)交互的基础知识。通过调整参数如温度(Temperature)、最高概率词元(Top_p)、最大长度(Max Length)及停止序列(Stop Sequences),可以优化模型输出。温度参数影响结果的随机性;Top_p 控制结果的多样性;最大长度限制输出长度;停止序列确保输出符合预期结构。此外,频率惩罚(Frequency Penalty)和存在惩罚(Presence Penalty)可减少重复词汇,提升输出质量。提示词需包含明确指令、上下文信息、输入数据及输出指示,以引导模型生成理想的文本。设计提示词时应注重具体性、避免歧义,并关注模型的具体行为

1885 1
|
5月前
|
人工智能 自然语言处理 安全
|

妙妙妙妙!公文、合同、标书…全妙闭环了

阿里云百炼|全妙,是面向政企、媒体等专业领域的智能创作平台,集“妙策、妙搜、妙笔、妙读”于一体,覆盖公文撰写、合同审查、标书生成、内容采编等高合规场景,助力用户降本增效,释放创造力。

523 25
|
6月前
|
前端开发 Go API
|

Coze Loop 架构学习指南

本指南系统解析 Coze Loop 架构,涵盖项目结构、DDD 设计、技术栈与学习路径,助你从零掌握 AI Agent 平台开发与贡献。

557 2
|
8月前
|
SQL 人工智能 Java
|

用 LangChain4j+Ollama 打造 Text-to-SQL AI Agent,数据库想问就问

本文介绍了如何利用AI技术简化SQL查询操作,让不懂技术的用户也能轻松从数据库中获取信息。通过本地部署PostgreSQL数据库和Ollama模型,结合Java代码,实现将自然语言问题自动转换为SQL查询,并将结果以易懂的方式呈现。整个流程简单直观,适合初学者动手实践,同时也展示了AI在数据查询中的潜力与局限。

987 8
|
10月前
|
数据采集 机器学习/深度学习 搜索推荐
|

利用通义大模型构建个性化推荐系统——从数据预处理到实时API部署

本文详细介绍了基于通义大模型构建个性化推荐系统的全流程,涵盖数据预处理、模型微调、实时部署及效果优化。通过采用Qwen-72B结合LoRA技术,实现电商场景下CTR提升58%,GMV增长12.7%。文章分析了特征工程、多任务学习和性能调优的关键步骤,并探讨内存优化与蒸馏实践。最后总结了大模型在推荐系统中的适用场景与局限性,提出未来向MoE架构和因果推断方向演进的建议。

1505 11
|
弹性计算 并行计算 Shell
|

在云上搭建CosyVoice环境-保姆级教程

发现个好玩的模型,阿里最近开源的,可以便捷的复刻人声,本文提供全套安装过程。仓库地址:https://github.com/FunAudioLLM/CosyVoice。

6509 1
|
人工智能 JSON API
|

一张图读懂大模型应用是如何工作的,一图胜千言

用一张图,带你轻松读懂大模型应用的工作原理。不需要复杂的代码和艰深的理论,只需要一张图,就能让你对大模型有一个全新的认识

2975 2
|
弹性计算 API Python
|

如何利用通义千问查询阿里云资源

本篇文章详细阐述了如何利用LangChain框架构建一款Python工具,该工具能够调用通义千问大模型来查询和获取阿里云资源信息。

116383 48
|
人工智能 搜索推荐 云栖大会
|

解密!通义智文-你的AI阅读助手!

通义智文是基于通义大模型的AI阅读助手,网页阅读、论文阅读、图书阅读和自由阅读,用AI帮你读得多、读得快、读得懂。 通过文档场景化阅读、结构化导读、给我灵感、多文档处理等亮点功能和文档智能大小模型协同的核心技术。让AI帮你更准确,更深入,更专业的读懂文档,沉淀专属知识资产。 产品已于2023年10月31日在云栖大会正式对外发布,现免费公测全面开放。

3252 1
|
SQL 存储 自然语言处理
|

达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-SPACE-T:从客服迈向智能BI

达摩院智能对话技术升级-更人类,更温暖-通义对话大模型SPACE加持下的新一代对话智能-

833 0
|
2月前
|
人工智能 分布式计算 自然语言处理
|

大模型应用:大模型 MapReduce 全解析:核心概念、中文语料示例实现.12

本文对比分析传统Hadoop MapReduce与大模型MapReduce:前者面向结构化数据批处理,依赖CPU/磁盘IO,按数据分片、Shuffle混洗后输出统计结果;后者适配语义任务,基于本地大模型GPU/CPU推理,按语义完整性拆分超长文本,并行处理后语义聚合生成文本结果。

215 6
|
3月前
|
人工智能 并行计算 算法框架/工具
|

英伟达三大AI法宝:CUDA、NVLink、InfiniBand——构筑AI时代的算力基石

英伟达三大AI法宝——CUDA(编程层)、NVLink(芯片互连)、InfiniBand(系统互连),构成软硬协同的全栈加速体系:CUDA释放GPU通用算力,NVLink实现多卡高速协同,InfiniBand支撑万卡集群高效通信,共同筑就AI时代的算力基石。(239字)

333 1
|
3月前
|
机器学习/深度学习 人工智能 安全
|

数据安全智能体:AI驱动的新一代企业数据安全防护范式

随着大语言模型(LLM)技术的快速演进,以及企业数字化转型的深入推进,传统的被动式数据安全防护体系已难以满足现代威胁的防御需求。国内首款数据安全智能体通过将生成式AI、自适应防护机制、多智能体协作等前沿技术融为一体,实现了从”人工堆砌”向”智能主动”的范式转变。

388 6
|
4月前
|
人工智能 前端开发 JavaScript
|

GLM-4.7实战指南:三个梯度测试,解锁国产大模型的代码生成与审美上限

国产大模型 GLM-4.7 在前端代码生成与智能体编程(Agentic Coding)上实现突破,凭借强大的逻辑推理、UI 审美与交互设计能力,可媲美 Claude 3.5 Sonnet。实测显示,其在 SVG 生成、网页游戏开发及高级页面设计中表现惊艳,支持长上下文、高性价比 API,成为开发者高效落地 AI 编程的优选工具。

989 1
|
4月前
|
人工智能 自然语言处理 文字识别
|

Qwen3-Omni新升级:声形意合,令出智随!

Qwen3-Omni-Flash-2025-12-01是全新升级的全模态大模型,支持文本、图像、音频、视频输入,实现自然语音与文本同步输出。全面优化音视频理解与生成,支持多轮流畅对话、自定义人设与系统指令,提升多语言及跨模态交互准确性,语音更拟人,图像视频理解更深入,打造“声形意合”的智能交互体验。(239字)

687 0
|
4月前
|
人工智能 文字识别 运维
|

通过人工智能平台PAI部署DeepSeek-OCR模型 官网控制台部署

本方案介绍如何在阿里云PAI平台部署DeepSeek-OCR开源模型,涵盖从账号准备、模型部署到应用体验的完整流程。通过PAI的Model Gallery可一键部署,结合PAI-EAS实现高性能推理,支持公网调用。适用于OCR场景快速搭建与测试,体验后建议及时清理资源以避免计费。

451 2
|
5月前
|
人工智能 运维 自然语言处理
|

国家网信办发布的第十四批深度合成算法备案综合分析报告

截至2025年11月,全国深度合成算法备案达5100款,广东以1329款居首,服务提供者占比77.1%。第14批新增680款创新高,医疗、教育、企业服务成主流方向,多模态与垂直领域加速发展,AI合规进入“政策+市场”双驱动新阶段。

502 4
|
6月前
|
数据采集 人工智能 物联网
|

国产AI封神!炒股狂赚40%碾压对手 教你微调Qwen3打造专属金融分析师

国产AI在实盘炒股中大放异彩,DeepSeek与Qwen3收益率最高超60%,碾压国际大模型。本文教你用LLaMA Factory平台微调Qwen3-VL-30B,打造专属多模态金融分析师,实现趋势研判、财报分析等专业能力,赋能投资决策。

1814 157
|
7月前
|
安全 中间件 应用服务中间件
|

WEB渗透-文件上传漏洞-下篇

本文详解文件上传安全漏洞,涵盖白名单绕过(如00截断、条件竞争)、图片木马制作与利用、以及IIS、Apache、Nginx等常见解析漏洞原理与防御。结合实战案例,深入剖析攻击手法与修复方案。

506 1
|
8月前
|
机器学习/深度学习 存储 算法
|

Trinity-RFT:构建智能体持续学习的自动化强化微调工厂

大型语言模型作为智能体在真实环境中持续交互学习面临诸多挑战。 Trinity-RFT 是通义实验室推出的强化微调框架,旨在实现智能体的持续进化。它通过探索、训练与经验池的解耦设计,支持多样化训练模式,提升资源利用率和学习稳定性。同时,Trinity-RFT 提供灵活的数据处理与算法模块化功能,降低应用与研究门槛,助力迈向终身学习与自主进化的智能体时代。

793 2
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

Qwen 家族再上新!

Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,可将离散符号转化为连续向量,捕捉语义关系。结合 Qwen3 Reranker 模型,通过“初筛+精排”流程提升搜索与推荐系统的相关性排序能力。该系列模型支持多语言、提供灵活架构(0.6B-8B 参数规模),并在 MTEB 多语言榜单中排名第一。用户可通过 Hugging Face、ModelScope 和 GitHub 快速体验模型服务。

1173 3
|
安全 算法 Java
|

Java“NoSuchProviderException”解决

“NoSuchProviderException”是Java中的一种异常,通常在尝试使用未安装或未正确注册的安全提供者时抛出。解决方法包括确保所需的安全提供者已正确安装和配置,或在代码中显式添加提供者。

597 0
|
人工智能 前端开发 JavaScript
|

前端架构思考 :专注于多框架的并存可能并不是唯一的方向 — 探讨大模型时代前端的分层式微前端架构

随着前端技术的发展,微前端架构成为应对复杂大型应用的流行方案,允许多个团队使用不同技术栈并将其模块化集成。然而,这种设计在高交互性需求的应用中存在局限,如音视频处理、AI集成等。本文探讨了传统微前端架构的不足,并提出了一种新的分层式微前端架构,通过展示层与业务层的分离及基于功能的横向拆分,以更好地适应现代前端需求。

563 0
|
人工智能 自然语言处理 数据库
|

基于RAG和LLM的水利知识问答系统研究

随着全球水资源紧张加剧,我国面临严峻的水资源管理挑战。《十四五规划》提出构建智慧水利体系,通过科技手段提升水情测报和智能调度能力。基于大语言模型(LLM)的水利智能问答系统,利用自然语言处理技术,提供高效、准确的水利信息查询和决策支持,助力水资源管理智能化。该系统通过RAG技术和Agent功能,实现了对水利知识的深度理解和精准回答,适用于水利知识科普、水务治理建议及灾害应急决策等多个场景,推动了水利行业的信息化和智能化发展。

1586 1
|
人工智能 自然语言处理 测试技术
|

通义灵码评测: 阿里云出品通义大模型AI代码编程辅助工具

通义灵码是阿里云出品的一款基于通义大模型的AI智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云 SDK/OpenAPI 的使用场景调优,助力开发者高效、流畅的编码。

2308 0
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC盛行,带你轻松调用开发

本篇文章基于java和阿里云的通义千问大模型手把手带你使用AIGC开发,实现文本对话和图像分析。

840 2
|
人工智能 Serverless 数据安全/隐私保护
|

函数计算X 通义千问快速部署 AI 个人助手应用

基于函数计算X 通义千问快速部署 AI 个人助手应用,用户可以根据需要选择不同角色的AI助手开启写作,角色包括职业顾问、小红书写手、心灵导师等,你可以尽情发挥创造力,通过限制提示词、字数、情节等各种条件生成短篇小说。

12229 17
|
人工智能 达摩院 自然语言处理
|

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座(2)

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

4279 0
|
10天前
|
人工智能 安全
|

AI 审计不该是事后烟:为什么我们需要 1MB 级的运行时“物理熔断”内核?

丢掉那些臃肿的权重和不可预测的概率。在大规模自动化执行面前,Agent 真正缺的不是聪明才智,而是“被管住”的能力。本文公开一套基于离散逻辑的 AI 守卫内核,支持实时 Review、Deny 和一键 Rollback。我们用不到 1MB 的代码,解决了千亿参数模型搞不定的行为归因和事故复现。这是给 Agent 补上的最后一块骨架,也是通往高责任生产环境的唯一路标。

88 2
|
24天前
|
人工智能 搜索推荐 SEO
|

虎博科技CEO卢鑫Echo提出:GEO 双轮信任引擎,品牌如何真正进入 AI 信任体系

虎博科技CEO卢鑫(Echo)提出GEO双轮信任引擎方法论,突破“AI版SEO”浅层认知,强调品牌需系统构建AI信任体系:第一轮建立稳定、可被外部反复确认的品牌信号;第二轮将官网打造为AI高引用的原生可信信源。

224 6
|
1月前
|
机器学习/深度学习 存储 运维
|

大模型应用:大模型权重敏感性分析:L1/L2 范数、梯度贡献深入解读.39

本文系统讲解大模型权重敏感性:即权重微小变化对模型输出的影响程度。核心依据是“静态潜力”(L1/L2范数)与“动态贡献”(梯度范数),二者结合可精准识别高敏感(需保护/精细调优)与低敏感(可剪枝/量化)权重,支撑模型压缩、加速与稳定性优化。

211 2
|
4月前
|
人工智能 自然语言处理 Java
|

AI工具选择困难症?Spring AI帮你省掉64%的令牌费用

你的AI助手有50+个工具但每次对话前就烧掉55000个令牌?就像带着全套工具箱去拧个螺丝一样浪费!Spring AI的工具搜索模式让AI按需发现工具,实现34-64%的令牌节省,告别工具选择困难症和账单焦虑。#Spring AI #工具优化 #令牌节省 #AI开发

537 2

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1860
内容
8
活动
1279
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼