aipy实战:Deepseek-V3、Hunyuan&Qwen做商品分析之端午怎么买粽子

简介: 爱派(AiPy)是一款基于LLM大模型与Python生态结合的任务型AI系统,通过“大模型规划+Python代码执行”实现全链路闭环。v0.1.28版新增联网搜索、分享案例等功能,并引入混元和Qwen模型。本文测试了deepseek、混元、Qwen在端午粽子推荐任务中的表现,从信息度、美观度和反应时间等方面对比分析。

一、背景
爱派(AiPy)是一款基于 LLM 大模型与 Python 生态深度融合的任务型 AI 系统,核心定位是帮用户用 AI 解决实际问题。区别于传统大模型只能提供问答服务,AiPy 通过 “大模型规划 + Python 代码执行” 的独特范式,实现了从 “理解需求” 到 “动手操作” 的全链路闭环,真正让 AI 具备了 “知行合一” 的能力。

昨天爱派(AiPy)v0.1.28 正式上线啦!改进主要包括:联网搜索、分享案例、私密记录、模型配置和新手引导五个方面。博主认为最重要的改进就是引入了混元和Qwen模型。今天我们最主要的任务就是在aipy上配置这两个模型,并且对deepseek-v3,hunyuan-turbos-latest,qwen-plus-latest三个模型完成同一任务进行测评。

至于任务选择,最近端午节到了,粽香四溢的季节那就少不了吃粽子哦正巧赶上618,看看aipy能否能给我们推荐最近网上比较好吃的粽子呢?主要是考查aipy的联网搜索和报告总结的能力啦

二、测试

  1. 提示词

    端午想买粽子。1.搜集一下网上好评比较多的粽子品牌。2.查看品牌的粽子分类和成分。3、列出618大促的具体购买价格。4.整理以上内容并产出格式特别精美、配色特别炫酷、特别美观的html格式文件

  1. deepseek
    总体来说,deepseek表现得很不错。

首先在界面上,deepseek整体为白色配色,很简洁明了。

其次,在重要信息呈现上,用了颜色突出的加粗字体,来把信息着重凸显,这样子能够让信息更直观、便读。

再次,在信息选择上,他主要是搜集了淘宝粽子TOP5榜单,信息来源符合我的要求,产品成分和信息选择上都很完善,甚至包含了热量。

唯一不足的就是价格都是参考去年的价格,这一点需要继续改进。
ds粽子.png

  1. 混元
    总体来说,混元表现得也是达到了我的预期。

首先总体来看,颜色选择上,特殊的采取了粉蓝渐变的背景,非常特殊。整个界面都很简洁明了,产品名称、成分、价格都很清楚,信息抓取很方便。

再次,观察信息,价格是很贴近目前淘宝的618价格的,没有虚假数据,值得表扬。

唯一的不足就是,信息太过简洁而呈现界面过于宽敞,可能比例有些不协调。
hy粽子.png

  1. Qwen
    总体来说,Qwen表现的是一开始最让我惊讶的。

首先,看到报告最直观的一点就是,确实是做的最好看的,并且在信息区分、重点信息抓取上都做了区分度。无论是名称、推荐信息、成分信息、价格,都很清晰完整。

但是,缺点也是显而易见的,就是在信息呈现方面,虽然确实很丰富,价格和成分上都很贴近原文,但是太冗杂了,导致抓不到重点。
qw粽子.png

  1. 总结
    最后总结一下,博主不对三者进行排序哦萝卜白菜各有所好哈。哈哈哈

在信息度上,Deepseek在信息搜集上比较全面,但是只呈现了去年原价信息。hunyuan和Qwen都比较贴近真实价格,但是一个太简洁、一个太冗杂。

在美观度上看,三者各有所长。deepseek整体商务风配色,hunyuan背景具有特色,客观上,Qwen是最好看的,还具有配图。

在时间反应上,hunyuan花费最短,其次是Qwen,最后Deepseek花费时间最长。这也是为什么hunyuan和Qwen的信息简短的原因也许是分析提取文字稍快了点?哈哈哈哈,这也是一个蛮有趣的问题。
评价1.png

三、思考
在和aipy打交道的过程中,三个模型都或多或少的出现了不理解我的需求的时刻,但好在我可以继续和aipy补充说明,优化我的prompt,最后产出一份不错的结果。

三个大模型都各有优缺点,大家在使用过程中也要根据自己的需要看情况选择,当然你也可以自己研究一下在你的手中三个模型有什么区别。欢迎大家和我在评论区讨论~

相关文章
|
3月前
|
人工智能 自然语言处理 API
快速集成GPT-4o:下一代多模态AI实战指南
快速集成GPT-4o:下一代多模态AI实战指南
405 101
|
4月前
|
物联网
直播预告 | Qwen-lmage 技术分享+实战攻略直播
通义千问团队最新开源的图像生成模型 Qwen-Image,凭借其出色的中文理解与文本渲染能力,自发布以来获得了广泛关注与好评。
232 0
|
4月前
智谱发布GLM-4.5V,全球开源多模态推理新标杆,Day0推理微调实战教程到!
视觉语言大模型(VLM)已经成为智能系统的关键基石。随着真实世界的智能任务越来越复杂,VLM模型也亟需在基本的多模态感知之外,逐渐增强复杂任务中的推理能力,提升自身的准确性、全面性和智能化程度,使得复杂问题解决、长上下文理解、多模态智能体等智能任务成为可能。
743 0
|
2月前
|
存储 监控 算法
1688 图片搜索逆向实战:CLIP 多模态融合与特征向量落地方案
本文分享基于CLIP模型与逆向工程实现1688图片搜同款的实战方案。通过抓包分析破解接口签名,结合CLIP多模态特征提取与Faiss向量检索,提升搜索准确率至91%,单次响应低于80ms,日均选品效率提升4倍,全程合规可复现。
|
3月前
|
机器学习/深度学习 算法 数据可视化
从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。
464 2
从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
|
3月前
|
人工智能 Java API
Java与大模型集成实战:构建智能Java应用的新范式
随着大型语言模型(LLM)的API化,将其强大的自然语言处理能力集成到现有Java应用中已成为提升应用智能水平的关键路径。本文旨在为Java开发者提供一份实用的集成指南。我们将深入探讨如何使用Spring Boot 3框架,通过HTTP客户端与OpenAI GPT(或兼容API)进行高效、安全的交互。内容涵盖项目依赖配置、异步非阻塞的API调用、请求与响应的结构化处理、异常管理以及一些面向生产环境的最佳实践,并附带完整的代码示例,助您快速将AI能力融入Java生态。
551 12
|
3月前
|
人工智能 自然语言处理 算法
现代AI工具深度解析:从GPT到多模态的技术革命与实战应用
蒋星熠Jaxonic,AI技术探索者,深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略,助力开发者提升效率,共赴智能编程新纪元。
|
4月前
|
人工智能 缓存 监控
大模型性能测试实战指南:从原理到落地的全链路解析
本文系统解析大模型性能测试的核心方法,涵盖流式响应原理、五大关键指标(首Token延迟、吐字率等)及测试策略,提供基于Locust的压测实战方案,并深入性能瓶颈分析与优化技巧。针对多模态新挑战,探讨混合输入测试与资源优化

热门文章

最新文章