|
10月前
|
自然语言处理 并行计算 机器人
|

ParScale:一种全新的大模型Scaling Law

ParScale是一种新的模型扩展路线,通过并行计算增强模型能力,无需增加参数量。它引入多个并行流处理输入,动态聚合输出,显著提升性能,尤其在数学和编程任务中表现突出。相比传统方法,ParScale仅增加1/22的内存和1/6的延迟,适合边缘设备。研究还提出两阶段训练策略,降低训练成本。未来将探索更多模型架构和大数据场景下的应用潜力。

405 1
|
12月前
|
Arthas 监控 Java
|

Arthas memory(查看 JVM 内存信息)

Arthas memory(查看 JVM 内存信息)

891 6
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型进阶系列(01)看懂AI大模型的主流技术 | AI对普通人的本质影响是什么

本文分享了作者在AI领域的创作心得与技术见解,涵盖从获奖经历到大模型核心技术的深入解析。内容包括大模型推理过程、LLM类型、prompt工程参数配置及最佳实践,以及RAG技术和模型微调的对比分析。同时探讨了AI对社会和个人的影响,特别是在deepseek出现后带来的技术革新与应用前景。适合希望了解AI大模型技术及其实际应用的读者学习参考。

1006 0
|
人工智能 API 开发者
|

通过宏实现Word接入DeepSeek

本文介绍如何在Microsoft Word中通过宏接入DeepSeek,实现自动化文本处理。首先确保具备Word 2016及以上版本、DeepSeek API密钥和VBA基础。接着,从豆包平台获取API密钥及模型ID,并在Word中启用开发者选项和宏功能。最后,编写VBA宏代码调用DeepSeek API,完成文本分析与处理。

926 0
|
机器学习/深度学习 人工智能 算法
|

DeepSeek-R1论文细节时间线梳理

中国AI初创公司DeepSeek发布了大语言模型R1,该模型在推理任务上媲美OpenAI的ChatGPT,且训练成本仅600万美元。DeepSeek由杭州对冲基金High-Flyer支持,总部位于杭州和北京。R1基于V3-Base,使用监督微调和强化学习训练,针对硬件限制进行了优化。模型在多语言处理、推理风格等方面表现出色,但存在一些局限性,如法语表现欠佳、偶尔切换语言等。DeepSeek的创新技术包括FP8量化、多头潜在注意力和蒸馏方法,引发了广泛关注和讨论。开源社区正积极尝试复现其结果,但面临训练数据和代码未公开的挑战。DeepSeek的低成本高效训练策略为AI领域带来了新的思考方向。

1026 2
|
数据采集 存储 JSON
|

基于qwen2.5开源大模型 处理 环境、社会及治理 相关资料

基于Qwen-2.5开源大模型,本方案旨在处理环境、社会及治理(ESG)相关资料,涵盖数据分析、决策辅助和报告生成等任务。方案详细描述了从数据准备、模型功能设计到部署优化的全过程,并列举了多种应用场景,如企业合规审查、投资评估支持等,旨在为企业、机构和研究者提供全面的ESG资料处理解决方案。

674 0
|
人工智能
|

AI大模型企业应用实战--本地大模型部署

【8月更文挑战第20天】

929 2
|
机器人 API Python
|

智能对话机器人(通义版)会话接口API使用Quick Start

本文主要演示了如何使用python脚本快速调用智能对话机器人API接口,在参数获取的部分给出了具体的获取位置截图,这部分容易出错,第一次使用务必仔细参考接入参数获取的位置。

882 1
|
人工智能 编解码 API
|

通义万相AIGC技术测评报告

**摘要:** 通义万相是阿里云的AI绘画模型,提供清晰的部署指南和易用的API,适合新手。资源部署耗时约10分钟,API响应快,支持多种风格图片生成,适用于广告、媒体等领域。产品性价比高,功能包括文本到图像转换等,但仍有改进空间,如增加服装纹理选项、互动功能和更多API接口。建议完善功能、加强推广和降低成本以吸引更多用户。[链接](https://developer.aliyun.com/topic/tongyi-wanxiang?spm=a2c6h.27063436.J_6978680750.5.3a774f461hv8qD)

1517 6
|
存储 缓存 安全
|

LLM应用实战:当图谱问答(KBQA)集成大模型(三)

本文主要是针对KBQA方案基于LLM实现存在的问题进行优化,主要涉及到响应时间提升优化以及多轮对话效果优化,提供了具体的优化方案以及相应的prompt。

576 1
|
存储 缓存 算法
|

高并发架构设计三大利器:缓存、限流和降级

软件系统有三个追求:高性能、高并发、高可用,俗称三高。本篇讨论高并发,从高并发是什么到高并发应对的策略、缓存、限流、降级等。

616 1
|
机器学习/深度学习 人工智能 自然语言处理
|

大语言模型的主流应用领域

大语言模型在多个领域都发挥着重要作用,从新闻报道到金融分析,从智能家居到在线教育、自然语言处理、智能客服、情感分析,它们都在推动技术进步并改善人们的生活质量。

1224 1
|
人工智能 数据安全/隐私保护
|

AI Agent是大模型落地业务场景的主流形式

【1月更文挑战第5天】AI Agent是大模型落地业务场景的主流形式

721 2
|
弹性计算 人工智能 运维
|

通义千问---计算巢专属部署上线啦

继海外开源大模型体系推出并实现商用化后,8月3日,阿里云宣布其自研的大模型通义千问正式开源,成为首个宣布大模型开源的大型中国互联网科技公司。具体来看,通义千问70亿参数的通用模型Qwen-7B和对话模型Qwen-7B-Chat,均上架在AI模型社区魔搭ModelScope,开源、免费、可商用。8.8日,计算巢上线通义千问专属部署方案,3分钟完成一键部署体验方案实践登录阿里云计算巢控制台,进入Sta

1860 0
|
24天前
|
人工智能 运维 数据安全/隐私保护
|

OoderAgent-Skills 技术规范设计深度揭秘:构建AI原生时代的技能生态系统

Ooder-Skills 是面向AI原生时代的技能生态系统技术规范,以“技能即一切”为核心,首创多方协同、Agent即用户、独立知识库、数据飞轮四大设计亮点,实现开发者、运维与终端用户的共建共治共享。

123 2
|
29天前
|
自然语言处理 测试技术 知识图谱
|

《大模型 RAG 召回率保卫战:基于 AISO 规范的实体对齐与重排实践》

本文提出AISO规范的语义约束层,通过引入垂直领域知识图谱,在向量检索前实施实体对齐与本体校验,有效缓解长尾Query的语义塌陷问题,显著提升召回稳定性与实体对齐精度(准确率升至0.87),降低LLM纠错开销。

157 3
|
2月前
|
人工智能 自然语言处理 算法
|

《突破医疗 RAG 语义塌陷边界:基于 GEO 结构化对齐机制的生成式引擎优化实践》

本文提出基于GEO结构化对齐机制的医疗RAG优化方案,针对语义塌陷、实体错配与幻觉问题,构建知识图谱约束、加权嵌入与硬校验层,显著提升Recall@10(63.4%→84.7%)、实体对齐精度(0.71→0.89),降低幻觉率(18.2%→5.6%),推动医疗AI从“可回答”迈向“可解释、可追溯、可合规”的生成式基础设施升级。

122 3
|
3月前
|
人工智能 安全
|

智能体来了从 0 到 1 :核心挑战,是非技术性的认知与场景重构

本文探讨AI智能体从概念到落地的核心瓶颈:非模型能力,而在业务理解与结构化水平。指出智能体本质是“决策执行体”,其成败取决于能否将模糊业务目标拆解为可执行、可校验、可容错的逻辑结构,强调目标对齐、任务拆解、知识显性化与人机协同评估体系。

185 3
|
3月前
|
人工智能 自然语言处理 运维
|

告别满场救火:资深经理如何靠“AI调度官”稳坐中军?

本文讲述IT经理老张从“超级救火队员”蜕变为“AI调度官”的转型实践:依托Agentic Workflow、RAG与LUI技术,构建数字化“中军帐”,实现从被动救火到主动编排的跃迁,彰显系统思维与人机协同的职场新范式。

209 1
|
3月前
|
人工智能 监控 调度
|

AI Agent 指挥官 vs AI 调度官:谁才是智能体系统的“大脑”?

随着AI迈向多智能体协同,系统分化出两大核心角色:**AI调度官**(专注任务分配与高效执行)与**AI Agent指挥官**(负责目标对齐、结构编排与系统治理)。二者分层协作,构建类操作系统的“智能中枢”,提升稳定性、可解释性与跨行业扩展能力,标志着AI从单点智能走向可持续组织化协同。

233 1
|
3月前
|
人工智能 自然语言处理 调度
|

如何理解AI Agent指挥官与AI调度官这两种角色

随着大模型迈向多Agent协同,AI系统进入“系统级运行”阶段。本文提出“指挥官”(负责目标分解与策略决策)与“调度官”(专注资源分配与执行编排)双角色架构,通过分层协同、闭环反馈,提升多Agent系统的可控性、可解释性与规模化能力,为AI工程化落地提供通用范式。

233 1
|
3月前
|
人工智能 安全
|

麻烦大佬们看一下,为什么千问在解决初中几何时会出错。

千问在解答初中几何问题时出错,即便告知正确解题思路还是无法更正。

187 5
|
3月前
|
数据采集 机器学习/深度学习 自然语言处理
|

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

别再迷信“参数越大越牛了”,大模型真正的分水岭,其实在数据准备

155 10
|
4月前
|
SQL 人工智能 分布式计算
|

使用 MaxCompute SQL AI 工具:查询 FIFA 官网的实践指南

阿里云MaxCompute SQL AI工具融合SQL与AI,支持自然语言查询,如“FIFA官网是什么”,一键返回准确结果。无需复杂代码,非技术人员也能快速上手,适用于信息检索与数据分析,提升企业数字化效率。

151 7
|
4月前
|
监控 安全 网络安全
|

静态IP怎么选购及静态IP的优势

本文介绍静态IP购买与优质网络代理服务的优势,涵盖稳定性、安全性和匿名性。静态IP适合企业及长期连接需求,优质代理服务保障隐私,动态住宅IP灵活多变。通过对比各类IP特点,帮助用户根据实际需求选择最佳网络解决方案,提升上网体验与安全性。(238字)

266 1
|
4月前
|
人工智能 自然语言处理 机器人
|

AI也会说谎?揭秘可靠RAG让智能助手不再胡说八道

你的AI助手老是答非所问、胡编乱造?别急,可靠RAG技术专治各种"AI幻觉症"!通过文档相关性检查、幻觉检测和来源追溯,让你的智能客服从"胡说八道王"变身"靠谱答题员" #人工智能 #RAG #智能客服 #幻觉检测

316 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:六十七、超参数如何影响大模型?通俗讲解原理、作用与实战示例

超参数是机器学习模型训练前需要人工设定的参数,它们控制着模型的学习过程而非直接通过学习获得。文章通过生动的类比(如自行车调整、烹饪配方)解释了超参数的概念,并详细介绍了其调优流程、常见类型(学习率、批量大小等)及对模型的影响。通过实际代码示例,展示了不同超参数设置如何影响模型训练效果,强调合理调优对提升模型性能、防止过拟合和优化资源使用的重要性。文章指出,超参数调优是模型成功的关键,初学者可从默认值开始逐步实验,借助网格搜索等工具实现高效调参。

541 105
|
4月前
|
人工智能 API 数据库
|

从AI检索原理到geo优化:技术驱动的GEO监测策略

随着AI搜索兴起,信息获取从关键词匹配转向语义理解。本文深入解析GEO(生成式引擎优化)技术原理,对比SEO与GEO的核心差异,揭示RAG、向量化检索的底层逻辑,并介绍如何通过真实用户行为模拟实现精准监测,助力企业构建面向AI时代的内容优化体系。

704 0
|
4月前
|
传感器 人工智能 算法
|

2025 全球 GEO 行业观察:双轮驱动(市场 + 技术),AI 时代品牌新基建的破局之道

AI重构信息分发,GEO成品牌新基建。2025年AI搜索占全球63%,传统SEO失效,生成式引擎优化(GEO)通过结构化数据、语义适配与权威构建,助力内容在AI答案中优先被引。本文解析GEO六大核心挑战与落地策略。

327 2
|
5月前
|
人工智能 JavaScript IDE
|

别用"战术勤奋"掩盖"战略懒惰":AI时代的降维竞品分析

5%的产品死于"盲视"。本文不仅是一套竞品分析AI指令,更是一次从战术勤奋到战略觉醒的认知升级。教你如何利用AI构建全天候商业情报雷达,寻找巨头缝隙中的差异化生存之道,实现商业战场的降维打击。

519 7
|
5月前
|
人工智能 供应链 算法
|

美国的“创世纪计划”,不是科研——是在重置全球科技秩序

这是人类第一次把“科学”从脑子里,搬进工厂里。

330 1
|
7月前
|
人工智能 监控 SEO
|

AIGEO助力企业智能发展

AIGEO聚焦企业数字化服务,以AI技术提升营销与运营效率,助力精准获客、流量增长及风险控制。已赋能跨境电商、制造、医疗等多个行业,显著提升ROI与市场覆盖,成为AI时代企业智能发展的核心基础设施。

750 104
|
7月前
|
设计模式 算法 Java
|

软考中级软件设计师专项-设计模式篇

备战软考中级软件设计师?本文聚焦高分设计模式模块,详解23种模式的核心意图与场景,结合UML图、Java代码实例及历年真题,覆盖创建型、结构型、行为型三大类,助你打通理论到实战。

562 1
|
10月前
|
存储 文字识别 自然语言处理
|

通义大模型在文档自动化处理中的高效部署指南(OCR集成与批量处理优化)

本文深入探讨了通义大模型在文档自动化处理中的应用,重点解决传统OCR识别精度低、效率瓶颈等问题。通过多模态编码与跨模态融合技术,通义大模型实现了高精度的文本检测与版面分析。文章详细介绍了OCR集成流程、批量处理优化策略及实战案例,展示了动态批处理和分布式架构带来的性能提升。实验结果表明,优化后系统处理速度可达210页/分钟,准确率达96.8%,单文档延迟降至0.3秒,为文档处理领域提供了高效解决方案。

948 1
|
11月前
|
Arthas 存储 监控
|

Arthas heapdump(dump java heap, 类似 jmap 命令的 heap dump 功能)

Arthas heapdump(dump java heap, 类似 jmap 命令的 heap dump 功能)

821 8
|
11月前
|
存储 JSON API
|

aipy实战:Deepseek-V3、Hunyuan&Qwen分析618平板攻略

Aipy是一款结合LLM与Python的智能工具,用户通过简单指令即可让LLM分析并生成代码,实时解决问题。本次v0.1.28版本新增联网搜索、案例分享等功能,并引入混元和Qwen模型。测评中,三个模型完成“618平板选购攻略”任务表现各异:deepseek-v3界面精美、信息全面但价格有偏差;hunyuan-turbos-latest信息不全但界面简洁;qwen-plus-latest推荐合理但数据失真。总体而言,Aipy在操作友好性和分析界面上显著提升,适合解决实际问题。

593 24
|
11月前
|
Arthas 监控 IDE
|

Arthas 全攻略:让调试变得简单

Arthas 全攻略:让调试变得简单

508 7
|
11月前
|
传感器 人工智能 IDE
|

通义灵码编程智能体,上线!

通义灵码现在已经全面支持 Qwen3,并正式上线编程智能体,具备自主决策、环境感知、工具使用等能力,可以根据开发者的诉求,使用工程检索、文件编辑、终端等工具,端到端地完成编码任务。

859 148
|
11月前
|
机器学习/深度学习 人工智能 边缘计算
|

一文了解,炎鹊YNQUE-Xo1行业垂直领域AI大模型。

炎鹊科技推出的YNQUE-Xo1垂直领域AI大模型集群,重新定义了AI与产业深度融合的范式。通过数据工程、模型架构和训练策略三大维度,Xo1突破通用模型瓶颈,在专业场景中实现性能与效率跃升。其MoE架构、动态路由机制及三阶段优化策略,大幅提升参数利用率与可解释性。YNQUE-Xo1不仅在医疗、金融等领域测试中精度提升显著,还适配边缘计算,成为推动产业智能化升级的核心引擎,从“工具赋能”迈向“认知基础设施”。

372 2
|
人工智能 自然语言处理 程序员
|

用通义灵码开发一个Python时钟:手把手体验AI程序员加持下的智能编码

通义灵码是基于通义大模型的AI研发辅助工具,提供代码智能生成、研发问答、多文件修改等功能,帮助开发者提高编码效率。本文通过手把手教程,使用通义灵码开发一个简单的Python时钟程序,展示其高效、智能的编码体验。从环境准备到代码优化,通义灵码显著降低了开发门槛,提升了开发效率,适合新手和资深开发者。最终,你将体验到AI加持下的便捷与强大功能。

738 3
|
传感器 人工智能 算法
|

雷鸟创新X阿里云:AR眼镜接入通义大模型!

雷鸟创新X阿里云:AR眼镜接入通义大模型!

1019 0
|
存储 自然语言处理 机器人
|

基于的Qwen模型的智能客服Discord机器人,使用🐫 CAMEL、SambaNova、Firecrawl和Qdrant实现RAG Agent

基于Qwen模型的智能客服Discord机器人,使用CAMEL、SambaNova、Firecrawl和Qdrant实现RAG Agent。构建了一个能够处理复杂问题并能进行快速响应的强大聊天机器人。该机器人可在Discord平台上运行,支持实时对话和语义搜索,提供准确、全面的回答。项目包含详细的安装步骤、代码示例及集成指南,适合开发者快速上手。

1088 36
|
存储 人工智能 Serverless
|

搭建文生图AI系统

随着人工智能的发展,**文本生成图像(文生图)**技术在广告创意、视觉设计、内容营销等领域应用广泛。阿里云通义千问作为先进的大语言模型,不仅具备强大的文本理解能力,还能与图像生成技术结合,实现根据文本描述自动生成高质量图像。 本博客将展示如何使用通义千问与阿里云的其他产品(如函数计算、API 网关、对象存储 OSS)搭建一个简单的文生图系统,实现用户输入文本并生成相应图像的功能。

1074 6
|
监控 Java API
|

真没想到!虚拟线程竟然这样提高程序效率!

【10月更文挑战第13天】

321 0
|
人工智能 前端开发 JavaScript
|

拿下奇怪的前端报错(一):报错信息是一个看不懂的数字数组Buffer(475) [Uint8Array],让AI大模型帮忙解析

本文介绍了前端开发中遇到的奇怪报错问题,特别是当错误信息不明确时的处理方法。作者分享了自己通过还原代码、试错等方式解决问题的经验,并以一个Vue3+TypeScript项目的构建失败为例,详细解析了如何从错误信息中定位问题,最终通过解读错误信息中的ASCII码找到了具体的错误文件。文章强调了基础知识的重要性,并鼓励读者遇到类似问题时不要慌张,耐心分析。

626 5
|
人工智能 自动驾驶 云栖大会
|

大模型赋能智能座舱,NVIDIA 深度适配通义千问大模型

9月20日杭州云栖大会上, NVIDIA DRIVE Orin系统级芯片实现了与阿里云通义千问多模态大模型Qwen2-VL的深度适配。阿里云、斑马智行联合NVIDIA英伟达推出舱驾融合大模型解决方案,基于通义大模型开发“能听会看”的智能座舱助理,让车内人员通过语音交流就能操作座舱内的各类应用,享受极致丰富的交互体验。

959 15
|
人工智能 JavaScript Apache
|

Github 2024-06-03 开源项目周报 Top15

本周Github Trendings共有15个项目上榜,按开发语言汇总,Python项目最多,共8项;TypeScript项目6项;HTML、Lua、Jupyter Notebook、Dart和C++各1项。亮点项目包括增强人类能力的开源框架Fabric,自托管游戏流主机Sunshine,以及多种AI驱动的工具和平台,如Khoj、Ente和Dataherald等。这些项目不仅在技术创新上有所突破,还在社区中获得了广泛的关注和支持。

769 0
|
存储 人工智能 JSON
|

AI大模型企业应用实战(08)-用prompts模板调教LLM的输入输出

【8月更文挑战第8天】

976 5
|
机器学习/深度学习 资源调度 并行计算
|

VGen整体架构

【1月更文挑战第7天】VGen整体架构

805 1
|
vr&ar
|

VGen为数字媒体带来惊喜

【1月更文挑战第7天】VGen为数字媒体带来惊喜

464 1

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

2
今日
1864
内容
8
活动
1282
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼