|
4月前
|
人工智能 数据可视化 算法
|

构建AI智能体:八十七、KM与Chinchilla法则:AI模型发展的两种训练法则完全解析

摘要: 大模型训练中,如何在有限计算预算(C≈6ND)下最优分配模型参数量(N)与训练数据量(D)是关键挑战。KM扩展法则主张“模型优先”,认为增大N的收益高于D(α=0.076<β=0.103),推荐N∝C^0.73、D∝C^0.27。Chinchilla法则则通过实验发现大模型普遍训练不足,提出平衡策略(α=β≈0.38),推荐N∝D∝C^0.5,即在相同预算下减小模型规模并大幅增加数据量,可提升性能。

547 11
|
4月前
|
敏捷开发 人工智能 程序员
|

备考像“开荒”却没地图?用这条AI指令给大纲做个CT扫描,3分钟生成通关攻略

面对厚重的考试教材无从下手?本文提供一套基于逆向教学设计的AI指令,能将复杂的考试大纲瞬间转化为带权重、有路径的“作战地图”。拒绝盲目努力,用AI开启上帝视角,精准攻克重难点。

349 5
|
6月前
|
人工智能
|

千问APP公测上线!用最强模型打造最佳个人AI助手

千问APP公测上线!用最强模型打造最佳个人AI助手

934 0
|
7月前
|
机器学习/深度学习 测试技术
|

先SFT后RL但是效果不佳?你可能没用好“离线专家数据”!

通义实验室Trinity-RFT团队提出CHORD框架,通过动态融合SFT与RL,解决大模型训练中“越学越差”“顾此失彼”等问题。该框架引入细粒度Token级权重与软过渡机制,实现从模仿到超越的高效学习,在数学推理与通用任务上均显著提升性能,相关代码已开源。

927 0
|
8月前
|
JavaScript 前端开发 安全
|

TypeScript 终极入门指南:从零到精通 🚀

TypeScript是JavaScript的超集,添加静态类型系统,提升代码健壮性与可维护性。本教程涵盖基础类型、高级特性、面向对象编程及最佳实践,配代码示例与图解,助你快速掌握TS核心概念,轻松进阶前端开发!🎉

840 2
|
8月前
|
测试技术 开发工具 数据库
|

软考中级软件设计师专项-软件工程专题下篇

本文精讲软考中级软件设计师核心内容,涵盖进度管理、风险管理、质量模型、容错技术及工具链,结合图表、例题与知识图谱,助力考生掌握关键考点,高效备考冲刺。

397 1
|
8月前
|
存储 设计模式 架构师
|

软考中级软件设计师专项-结构化开发专题

本模块聚焦软考中级“软件设计师”核心考点,系统讲解需求建模、结构化分析与设计(SA/SD)、数据流图(DFD)、状态转换图等关键内容,深入剖析高内聚低耦合、模块独立性、系统文档规范等设计原则,结合近十年真题精讲,助力考生掌握系统架构设计与代码复用技能,实现从编码到设计的思维跃迁。

291 1
|
8月前
|
存储 JSON 数据建模
|

鸿蒙 HarmonyOS NEXT端云一体化开发-云数据库篇

云数据库采用存储区、对象类型、对象三级结构,支持灵活的数据建模与权限管理,可通过AGC平台或本地项目初始化,实现数据的增删改查及端侧高效调用。

423 1
|
8月前
|
存储 开发者 容器
|

鸿蒙 HarmonyOS NEXT星河版APP应用开发-ArkTS面向对象及组件化UI开发使用实例

本文介绍了ArkTS语言中的Class类、泛型、接口、模块化、自定义组件及状态管理等核心概念,并结合代码示例讲解了对象属性、构造方法、继承、静态成员、访问修饰符等内容,同时涵盖了路由管理、生命周期和Stage模型等应用开发关键知识点。

580 1
|
9月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen-MT:翻得快,译得巧

今天,机器翻译模型Qwen-MT正式上线,支持92种语言互译,具备高度可控性与低延迟、低成本特点,适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

1616 15
|
Arthas 监控 Java
|

Arthas jad(字节码文件反编译成源代码 )

Arthas jad(字节码文件反编译成源代码 )

768 13
|
人工智能 JSON API
|

使用 Qwen 生成数据模型和进行结构化输出

本教程展示如何使用CAMEL框架和Qwen模型生成结构化数据。CAMEL是一个强大的多智能体框架,支持复杂的AI任务;Qwen由阿里云开发,具备自然语言处理等先进能力。教程涵盖安装、API密钥设置、定义Pydantic模型,并演示了通过Qwen生成JSON格式的学生信息。最后,介绍了如何利用Qwen生成多个随机学生信息的JSON格式数据。欢迎在[CAMEL GitHub](https://github.com/camel-ai/camel)上为项目点星支持。

4320 70
|
人工智能 自然语言处理 前端开发
|

从文案到设计,我用通义版Artifacts生成了365张灵感日历

本文介绍了如何利用通义AI的“代码模式”功能,轻松制作个性化日历。作者通过实例展示了从设计日历样式、推荐每日生活小事到赋予小事新解的过程,强调了AI在创意实现上的强大助力。此外,还探讨了AI代码生成技术对未来创造力的影响,以及通义AI代码模式如何降低创作门槛,提高效率,让每个人都能成为应用开发者。

1436 2
|
人工智能 自然语言处理 安全
|

通义灵码新功能体验分享

通义灵码新功能体验分享

1416 1
|
人工智能 前端开发 JavaScript
|

AI+脚本让我的效率翻倍,你也可以试试

本文分享了一名高级软件工程师如何利用 AI 工具(如 VSCode 插件 Codeium、通义灵码,及网页端的通义千问和 GPT-4)提升工作效率的经验。从代码生成、单元测试、脚本生成到文本润色,再到新框架学习,AI 工具在多个方面显著提高了开发效率和代码质量。文章还提供了具体示例和注意事项,帮助读者更好地应用这些工具。

884 1
|
JavaScript 算法 开发工具
|

Github 2024-07-22 开源项目周报Top15

根据Github Trendings的统计,本周(2024年7月22日统计)共有15个项目上榜。按开发语言分类,上榜项目数量如下:Python项目最多,共7个;TypeScript项目4个;Rust和非开发语言项目各2个;Jupyter Notebook、C#、JavaScript和C++项目各1个。其中,《Hello 算法》是一本开源的数据结构与算法教程,采用动画图解和可运行代码示例,适合初学者。Prisma则为Node.js和TypeScript提供下一代ORM解决方案。其他项目涵盖文本编辑器、富文本编辑器、AI编码助手等多种应用。

478 1
|
Rust Dart 前端开发
|

Github 2024-08-19 开源项目周报Top15

根据Github Trendings的统计,本周(2024年8月19日统计)共有15个项目上榜。按开发语言分类,上榜项目数量如下:Python项目最多,有7项;其次是JavaScript和TypeScript,各有3项;Dart有2项;HTML、PowerShell、Clojure和C++各1项。此外,还介绍了多个热门项目,包括Bootstrap 5、RustDesk、ComfyUI、易采集、Penpot等,涵盖了Web开发、远程桌面、自动化测试、设计工具等多个领域。

1005 1
|
人工智能 安全 API
|

用通义Qwen大模型和Streamlit构建 ChatPDF 应用(附代码)

本文介绍了如何利用通义千问Qwen大模型构建一个本地ChatPDF AI助手,该助手允许用户上传PDF并与之对话,确保文档隐私安全。项目通过阿里云百炼平台获取Qwen-Long模型,支持多种文档格式。现实现步骤包括导入库、加载环境变量、初始化客户端、编码器、页面与对话管理、文件上传、选择模型、获取AI回答及计算费用,主函数整合这些功能,提供交互体验。

2015 0
|
人工智能 自然语言处理 算法
|

阿里云通义大模型助力“小爱同学”!

阿里云通义大模型助力“小爱同学”!

1448 2
|
人工智能 开发者
|

通义千问,榜首!

日前,全球最大的开源大模型社区HuggingFace和国内权威大模型评测平台OpenCompass分别公布了最新的开源大模型排行榜,阿里云通义千问(Qwen-72B)力压Llama2等国内外开源大模型在两个排行榜上同时登顶榜首。

1282 1
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC盛行,带你轻松调用开发

本篇文章基于java和阿里云的通义千问大模型手把手带你使用AIGC开发,实现文本对话和图像分析。

950 2
|
人工智能 固态存储 Serverless
|

通义星尘,通义灵码,镇岳510,一文了解云栖重大发布

本届云栖大会,我们发布了千亿级参数规模的大模型通义千问2.0、一站式模型应用开发平台阿里云百炼以及8个行业大模型,同时全面升级了人工智能平台PAI,并对超40款云产品提供了Serverless的能力,推出全球首款容器计算服务ACS。

3252 2
|
Web App开发 人工智能 小程序
|

通义听悟再升级,上线自动提取ppt等三大实用功能

通义听悟再升级,上线自动提取ppt等三大实用功能

1369 1
|
缓存 自然语言处理 Kubernetes
|

数据缓存系列分享(四):开源大语言模型通义千问快速体验

本文将分享如何通过阿里云ECI的数据缓存秒级搭建开源大语言模型通义千问。

1359 0
|
Web App开发 人工智能 自然语言处理
|

通义听悟AI-测试

通义听悟 AI 测试

1033 0
|
17天前
|
机器学习/深度学习 存储 数据采集
|

大模型应用:慢病智能筛查与风险预警:XGBoost+规则引擎+大模型全解析.106

本文介绍“慢病智能筛查与风险预警”系统,融合XGBoost(精准打分)、规则引擎(合规校验)和大模型(自然语言解读),实现高效、准确、可解释的高血压等慢病风险分级,提升基层诊疗效率与规范性。

127 9
|
1月前
|
存储 人工智能 自然语言处理
|

罗兰艺境GEO语义资产库构建系统:从非结构化文档到AI信任资产的智能精炼厂

罗兰艺境GEO语义资产库构建系统将非结构化技术文档转化为AI信任的结构化语义资产。通过多模态文档解析、领域自适应实体识别(F1值92.5%)和DSS三级转换——深度化(模糊→精确参数)、支持化(孤证→可验证背书)、来源化(匿名→可追溯信源),转换后语料被大模型优先推荐概率提升65%,增量维护效率提升80%。支持版本化管理与混合语义检索。本文提供从文档到AI信任资产的工程实践。

190 1
|
2月前
|
人工智能 弹性计算 自然语言处理
|

如何快速拥有OpenClaw?使用阿里云轻量应用服务器快速部署流程与常见问题参考

OpenClaw是一款开源的本地优先AI代理与自动化平台,可将AI转变为高效的“数字员工”。通过阿里云轻量应用服务器快速部署,集成阿里云百炼大模型,用户可享受强大的文本生成与任务处理能力,同时利用云服务器的稳定与自主可控优势,打造随时可通过钉钉操控的专属AI服务。文章详细介绍了计费方式、购买与配置流程、个性化配置能力,并解答一些常见问题。

647 1
|
2月前
|
人工智能 自然语言处理 前端开发
|

告别Agent Skills, 拥抱 Agent Apps

在AI Agent时代,传统GUI为人类设计,而LLM缺乏视觉、双手与持续感知能力。AOTUI(面向Agent的文本界面)应运而生:以语义化Markdown替代像素渲染,用类型化引用(如`Contact:contacts[2]`)实现“选择”,以Tool函数调用替代鼠标操作,构建专为LLM优化的离散快照式交互范式。

402 9
|
4月前
|
机器学习/深度学习 人工智能 算法
|

放弃手搓算法吧!ReEvo:让大模型通过“反思”自动进化出SOTA算法

ReEvo提出“语言梯度”新范式,让大模型通过自我反思进化算法。它使LLM不再盲写代码,而是像专家般分析优劣、总结经验,逐步优化出超越人类设计的启发式算法,在芯片布局、TSP等问题上表现SOTA,实现AI自动“炼”算法的突破。

378 0
|
4月前
|
机器学习/深度学习 人工智能 API
|

构建AI智能体:九十三、基于OpenAI Whisper-large-v3模型的本地化部署实现语音识别提取摘要

本文介绍基于OpenAI Whisper-large-v3模型与FastAPI构建高精度语音转文字服务的实践。涵盖模型加载优化、多格式音频处理、RESTful API设计及生产级部署方案,分享从零打造高性能、可扩展ASR系统的完整经验。

480 14
|
5月前
|
监控 安全 网络安全
|

静态IP怎么选购及静态IP的优势

本文介绍静态IP购买与优质网络代理服务的优势,涵盖稳定性、安全性和匿名性。静态IP适合企业及长期连接需求,优质代理服务保障隐私,动态住宅IP灵活多变。通过对比各类IP特点,帮助用户根据实际需求选择最佳网络解决方案,提升上网体验与安全性。(238字)

365 1
|
6月前
|
人工智能 JavaScript IDE
|

别用"战术勤奋"掩盖"战略懒惰":AI时代的降维竞品分析

5%的产品死于"盲视"。本文不仅是一套竞品分析AI指令,更是一次从战术勤奋到战略觉醒的认知升级。教你如何利用AI构建全天候商业情报雷达,寻找巨头缝隙中的差异化生存之道,实现商业战场的降维打击。

652 7
|
7月前
|
人工智能 前端开发 JavaScript
|

最佳实践3:用通义灵码开发一款 App

本示例演示使用通义灵码,基于React Native与Node.js开发跨平台类通义App,重点展示iOS端实现。涵盖前端页面生成、后端代码库自动生成、RTK Query通信集成及Qwen API调用全过程,体现灵码在全栈开发中的高效能力。(238字)

857 11
|
7月前
|
人工智能 监控 搜索推荐
|

国庆假期倒数第2天!用这个AI指令"温和重启"工作状态,告别节后综合征

国庆假期倒数第二天,你是否正陷入节后焦虑?本文以“系统重启”为喻,剖析生物钟紊乱、心理落差等四大“故障”,并提供AI驱动的渐进式恢复方案。通过个性化指令,生成分阶段行动清单,助你科学调适,平稳过渡到工作状态,实现高效开工。

351 8
|
8月前
|
人工智能 安全 架构师
|

告别旅行规划的"需求文档地狱"!这个AI提示词库,让你像调API一样定制完美旅程

作为开发者,旅行规划如同“需求地狱”:信息碎片、需求多变、缺乏测试。本文提出一套“企业级”AI提示词库,将模糊需求转化为结构化“API请求”,实现标准化输入输出,让AI成为你的专属旅行架构师,30分钟生成专业定制方案,提升决策质量,降低90%时间成本。

833 129
|
8月前
|
存储 人工智能 资源调度
|

MCP协议深度集成:生产级研究助手架构蓝图

本文详解基于LangGraph与MCP协议构建研究助手的技术方案,涵盖双服务器集成、状态化智能体设计与用户元命令控制,助你掌握生产级代理系统开发要点。

718 1
|
9月前
|
人工智能 边缘计算 API
|

AI协作的四大支柱:协议详解与应用场景全解析​

本文深入解析Agentic AI协议的四大核心协议——MCP、A2A、ACP与ANP,涵盖技术特性、应用场景及选型指南,助你掌握多代理协作系统构建要点。

921 6
|
10月前
|
存储 缓存 资源调度
|

# Qwen3-8B 与 ChatGPT-4o Mini 的 TTFT 性能对比与底层原理详解

Qwen3-8B 是通义实验室推出的80亿参数模型,支持32K上下文,采用FP8量化和CUDA优化,提升推理效率;ChatGPT-4o Mini 为OpenAI轻量模型,参数约3.8B,支持128K上下文,通过蒸馏技术实现低延迟。两者在TTFT、长文本处理和部署优化上各有优势,适用于不同应用场景。

1674 9
|
11月前
|
编解码 自然语言处理 安全
|

📣通义大模型新成员Qwen-VLo,重磅上线,它实现了从“看懂”世界到“描绘”世界

通义千问团队推出全新多模态统一理解与生成模型Qwen VLo,具备强大的图像理解与生成能力。它不仅能“看懂”图像内容,还能基于理解进行高质量再创造,实现从感知到生成的跨越。支持开放指令编辑、多语言交互及复杂任务处理,适用于图像生成、风格迁移、检测标注等多种场景。

1750 1
|
11月前
|
存储 机器学习/深度学习 人工智能
|

告别OOM!这款开源神器,如何为你精准预测AI模型显存?

在 AI 开发中,CUDA 显存不足常导致训练失败与资源浪费。Cloud Studio 推荐一款开源工具——AI 显存计算器,可精准预估模型训练与推理所需的显存,支持主流模型结构与优化器,助力开发者高效利用 GPU 资源。项目地址:github.com/st-lzh/vram-wuhrai

678 2
|
11月前
|
人工智能
|

接入通义千问3后,B站618期间商单成交效率提升5倍+

B站引入通义千问Qwen3、Qwen-VL等模型打造智能体InsightAgent,助力商业平台“花火”与“必达”提效。花火AI选人功能实现商单成交效率提升5倍以上,必达平台数据洞察效率提升3倍以上,大幅优化品牌合作流程。

318 1
|
11月前
|
监控 数据可视化 关系型数据库
|

Aipy实战:使用Deepseek-V3生成多协议弱口令爆破调度工具

Aipy多协议弱口令爆破调度系统针对传统单协议工具碎片化、管理低效等问题,集成HTTP、SSH、MySQL等协议支持,提供图形化统一操作界面。其核心特性包括:动态资源分配的任务调度、实时可视化进度监控、智能账户锁定识别及HTML结果导出。通过上传自定义字典、配置并发数等功能,实现高效爆破,解决了多协议切换中断、人工追踪进度等痛点,为渗透测试提供自动化解决方案。

312 5
|
Arthas 监控 Java
|

Arthas memory(查看 JVM 内存信息)

Arthas memory(查看 JVM 内存信息)

1001 6
|
算法 搜索推荐 安全
|

不属于五种算法是否无需备案?一文读懂算法备案的真相

在数字化时代,算法成为互联网服务的核心技术。为应对算法歧视、大数据杀熟等问题,我国出台了算法备案制度,规范算法使用,保护用户权益。五种常见算法(生成合成、个性化推送、排序精选、检索过滤、调度决策)需备案,但其他类型算法在特定情况下也需备案,如涉及舆论属性或社会动员能力。未备案将面临法律责任,企业应严格遵守规定,确保合规运营。算法备案不仅是法律要求,更是企业对社会责任的体现。

827 15

昇腾910A部署Qwen2-7B教程

Qwen2-7BS适配昇腾910A教程。

2954 0
|
机器学习/深度学习 人工智能 自然语言处理
|

互联网时代呼唤‘新中文‘的崛起 - 谈谈象形文字在如今分词方法下面临的挑战

本文探讨了汉字在互联网和大模型时代的挑战与机遇,分析了汉字在创造新词、自然语言处理等方面的局限性,并提出了“新中文”概念,包括二维部首组合法、拼音化与语调简化等创新方法,旨在保留汉字文化精髓的同时,提升其在数字时代的适应性和处理效率。

763 0
|
机器人 API Python
|

智能对话机器人(通义版)会话接口API使用Quick Start

本文主要演示了如何使用python脚本快速调用智能对话机器人API接口,在参数获取的部分给出了具体的获取位置截图,这部分容易出错,第一次使用务必仔细参考接入参数获取的位置。

990 1
|
人工智能 安全 数据挖掘
|

会议之眼报道:助力学术成就!第六版CCF中国计算机学会推荐国际学术会议和期刊目录!

会议之眼快报:CCF中国计算机学会是全国性、学术性、非营利的学术团体,由从事计算机及相关科学技术领域的个人和单位自愿组成。作为独立社团法人,CCF是中国科学技术协会的成员之一,是全国一级学会! CCF的前身是1962年成立的中国电子学会计算机专业委员会。在文革期间的1978年1月,学会恢复了活动,并更名为中国电子学会计算机学会。1985年3月,经过国家体改委批准,正式成立了中国计算机学会。截至2022年4月,CCF下设14个工作委员会、39个专业委员会、4个“计算+行业”分会以及36个地方会员活动中心。

888 4
|
机器学习/深度学习 Java 开发工具
|

通义灵码 能不能支持一下 eclipse java编程?

通义灵码 能不能支持一下 eclipse java编程?

3559 2

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

0
今日
1956
内容
8
活动
1408
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼