操作系统智能助手OS Copilot 测评

简介: 我是一名曾担任个人开发者、运维工程师、架构师和产品经理的专业人士,主导过某品牌的全球网站架构及运行保障工作。近期受邀参与OS Copilot的产品体验评测,重点测试了其-t/-f/管道功能。在ECS实例上顺利安装并使用后,发现该产品在提升初级工程师效率方面表现出色,但在多管道支持、模型服务指定、RAM权限配置等方面仍有改进空间。建议优化资源分配模式,简化评测流程,并加强信息安全保护,以更好地满足企业级用户需求。

我是一位(个人开发者/运维工程师/架构师/产品经理) 从工作以来这些职位都参与过,其中主导过某品牌的全球网站架构及运行保障工作,我平时工作涉及到云资源的运维和管理。
这次受邀参与了 OS Copilot的 产品体验评测,近两年大模型技术落地很多,在运维方面的成果凤毛麟角,对阿里的这款产品抱有很大期望.

我 顺利使用了 OS Copilot的 -t/-f/管道 功能.我的疑惑是这款产品目前是否可以采用指定的大模型服务(该疑问没什么图好截取……)。

我申请了一台ECS实例,实例的选用及生成非常顺畅,也正常的登陆进了系统.
image.png

采用命令确认了OS Copilot 并未安装,执行安装命令后成功.

image.png

此处提一下建议:评测相关使用的资源是否可以调整相应的模式,允许在评测时直接选取附带相关评测的服务?这样OS Copilot 就可以直接附带上,另一个就是相关的RAM授权体系可以不用费劲的申请了.(RAM申请特别容易让人头秃)

-t 测试

-t功能测试之前 先体验了一下 “co 当前系统健康度”
image.png

从返回结果来看是RAM权限授权缺失问题(这就是吐槽评测资源配置过程的原因)

在重新配置好以后 执行健康度检查:
image.png

介绍的非常详细,这在给初级程序员与运维工程师使用时 非常有帮助! 当然对于老手来说这个过程不够效率.

使用-t 参数后,效率非常明显:
image.png

美中不足的是copilot 回复中带着英文,期望后面可以进行统一语言.
从检查结果来看,基本反馈了服务器的大致情况,对于运维人员来讲,非常实用.
这一场表现完美.

-f 测试

看介绍来说,这是一个复杂流程的支持场景,通过演示Demo来讲 是通过自然语义表达工作需要和流程及案例来引导模型基于思维连和工作流模式进行场景问题解决.由于产品面向中有系统运维人员,在以前的工作中我有一部分是要进行相关的网络分析和测试环节,我就打算采用分析网络域名解析CDN地址节点的场景进行测试.
task 任务如下:
image.png

执行情况:
image.png

copilot 很从容的分解了任务,然后进行执行,非常的AI及科技感!但是……但是……它告诉我没有工具,巧妇那位无米之炊,只有锅……
不过还是很贴心的给我一个示例.
我做了工具命令的尝试:
image.png

果然是没有工具,copilot 没有说谎.

重新修改了task 描述:
image.png

告诉它为了达成目标什么都可以做,我来背锅……
image.png

执行逻辑及部分成果响应都很Nice,copilot 响应都很好,不过遇到了其他意外.看起来是云服务资源出了问题.重新尝试了几次 :
image.png

从执行过程来看,copilot 理解了我为达成目标不择手段的初衷……
进行相应工具的安装,在执行逻辑和问题处理(依赖安装)上都表现的非常优秀,简直是磕到了我的心巴上…… 不过拉垮的是提示了模型链接超时,导致流程没有走完! 这也是开头提到的评测资源建议独立划归资源管理的原因,评测不能尽兴,测不出深度来!

对于运维工程师来说,问题分析环节面临着诸多不确定性的挑战,工具自动安装,脚本编写都是常态,遇到的问题也是多种多样,要求copilot调用模型的服务量也是不确定的,猜测可能是评测资源设置了上限阀值,导致流程中断.

第二次测试:

采用低阶运维工程师的服务搭建场景进行测试:
image.png
这是许多开发初期环境搭建的常见案例,没什么营养的体力活.
copilot 响应非常丝滑:
image.png

突然感觉人员优化指标能完成了……

-f 测试总结:
任务理解,逻辑分解,执行细节 都可以给出较高评价,被吐槽的就是LLM链接超时太多,云服务质量需要看一看.

管道 测试

你永远不知道用户会怎么打开你的产品:

image.png

在使用两个管道的情况下,没有反应,中断执行后报错得知产品用的python(手动狗头)

使用单个管道则可以正常运行:
image.png

效果较为理想.但是……这些参数优化都是需要视业务情况来决定的,copilot直接发现了如下命令xxxxx ,个人觉得作为运维产品助手是不合适的:

  1. 助手需要做的事干活
  2. 提供有价值的意见
  3. 不能有无意义的误导

这款产品我觉得是要辅助低阶能力的运维人员,降低工作难度,提升效率与安全稳定性,在这些用户群体中不具备资深经验,对判断copilot意见准确能力不强,非常容易因为不准确的建议采纳产生事故,建议重视这个问题 愿天下没有背锅的运维.

多个管道使用在正常的运维中是常见的情况,许多运维人员的思维逻辑里也会深入印象.建议针对这个场景做些优化: “co” 命令中先进性语义分析,识别是否存在组合命令情况,再进行拆分执行.

最后

我认为 -t/-f/管道 功能非常有用 ,解决了常规工作中的许多的问题,提升了效率 因人而定,对于初阶技能的工程师而言,效率翻倍不夸张。

此外,我还有其他建议:
1.期望可以增加服务日志,允许通过日志分析工作命林及复杂task执行流程,以便用户可以按需调整task描述,形成稳定工作模版.

  1. 可以提供更换模型选项,允许用户在百炼平台训练微调自身所需命令情况.
  2. 模型服务信息隔离,信息安全,隐私保护等问题需要明确,copilot处理命令、文件、日志都可能存在涉密、涉私问题,相关内容不够透明.企业及个人用户使用存在信息安全担忧.

以上,感谢这次邀请测试,产品非常惊艳,瑕不掩瑜,期待这个产品越做越好.

目录
相关文章
|
14天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
阿里云与企业共筑容器供应链安全
171332 12
|
17天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。
150295 32
|
25天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
201962 14
对话 | ECS如何构筑企业上云的第一道安全防线
|
3天前
|
机器学习/深度学习 自然语言处理 PyTorch
深入剖析Transformer架构中的多头注意力机制
多头注意力机制(Multi-Head Attention)是Transformer模型中的核心组件,通过并行运行多个独立的注意力机制,捕捉输入序列中不同子空间的语义关联。每个“头”独立处理Query、Key和Value矩阵,经过缩放点积注意力运算后,所有头的输出被拼接并通过线性层融合,最终生成更全面的表示。多头注意力不仅增强了模型对复杂依赖关系的理解,还在自然语言处理任务如机器翻译和阅读理解中表现出色。通过多头自注意力机制,模型在同一序列内部进行多角度的注意力计算,进一步提升了表达能力和泛化性能。
|
7天前
|
存储 人工智能 安全
对话|无影如何助力企业构建办公安全防护体系
阿里云无影助力企业构建办公安全防护体系
1253 8
|
7天前
|
人工智能 自然语言处理 程序员
通义灵码2.0全新升级,AI程序员全面开放使用
通义灵码2.0来了,成为全球首个同时上线JetBrains和VSCode的AI 程序员产品!立即下载更新最新插件使用。
1306 24
|
9天前
|
机器学习/深度学习 自然语言处理 搜索推荐
自注意力机制全解析:从原理到计算细节,一文尽览!
自注意力机制(Self-Attention)最早可追溯至20世纪70年代的神经网络研究,但直到2017年Google Brain团队提出Transformer架构后才广泛应用于深度学习。它通过计算序列内部元素间的相关性,捕捉复杂依赖关系,并支持并行化训练,显著提升了处理长文本和序列数据的能力。相比传统的RNN、LSTM和GRU,自注意力机制在自然语言处理(NLP)、计算机视觉、语音识别及推荐系统等领域展现出卓越性能。其核心步骤包括生成查询(Q)、键(K)和值(V)向量,计算缩放点积注意力得分,应用Softmax归一化,以及加权求和生成输出。自注意力机制提高了模型的表达能力,带来了更精准的服务。
|
7天前
|
消息中间件 人工智能 运维
1月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
593 23
1月更文特别场——寻找用云高手,分享云&AI实践
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
|
13天前
|
人工智能 自然语言处理 API
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。