阿里云 OS Colilot 使用方法及评测

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
NLP 自学习平台,3个模型定制额度 1个月
简介: 作为一名后端研发工程师兼公司运维,我经常使用阿里云维护服务器和管理云服务。最近尝试了OS Copilot的-f/-t/管道功能此外,我还测试了普通模式、自动模式、文件定义任务及命令解释功能。其中自动模式表现出色,而文件定义任务和默认英文解释则存在问题。总体而言,OS Copilot在某些方面显著提高了运维效率,但仍需改进。

我是一名后端研发工程师,兼职公司运维,所以需要经常使用阿里云维护服务器和管理各类云服务。

本次比较顺利的使用了 OS Copolit 的 -f/-f/管道功能,以下是具体的使用过程和测评结果。

先说结论:

我认为 -t/管道功能有用 ,解决了运维中的日常问题,提升了效率,不再需要记住复杂的命令和参数。

我认为 -f 功能不好用 ,因为实测一个比较简单的任务,无法正常执行,也没有给出全面的解决方案。

另外,建议可以不需要配置 AK/SK,直接使用 Copolit,这个配置过程较为繁琐。

安装

  1. 开通 ECS 服务器

服务器镜像,建议选择 Alibaba Cloud Linux、CentOS、Ubuntu 或 Anolis OS

  1. 安装 os-copilot

如果是 Alibaba Cloud Linux/CentOS,执行以下命令安装 os-copilot:

sudo yum install -y os-copilot

如果是 Ubuntu:

curl -#S https://mirrors.aliyun.com/os-copilot/os-copilot-all-in-one-latest.sh | bash

配置

1.配置 RAM 用户

由于需要使用 AK,SK, 这里先添加 RAM 用户

打开 https://ram.console.aliyun.com/users,点击创建用户,填写登录名称,访问方式勾选 使用永久 AccessKey 访问,点击确定。

复制 AccessKey,AccessSecret,后面会用到。

2.分配权限

点击用户名称,在标签栏处,点击权限管理,新增授权,在权限策略处,搜索 “AliyunSysOMOSCopilotAccess”,然后勾选,点击 “确认新增授权”

image.pngimage.png

image-1.pngimage-1.png

这样,RAM 用户就拥有了 os-copilot 的权限。

3.在命令行中配置 AK,SK

让我们回到服务器的命令行,执行以下命令:

export ALIBABA_CLOUD_ACCESS_KEY_ID=<AccessKey ID>
export ALIBABA_CLOUD_ACCESS_KEY_SECRET=<AccessKey Secret>

将 和 替换为上面您自己复制的 AccessKey。

测试

1.使用普通模式

copilot 当前服务器的健康度

输出以下内容

[root@moguyun ~]# copilot 当前服务器的健康度

[Copilot]:
要检查当前服务器的健康度,可以执行以下几个步骤来获取相关信息:
 1 检查CPU使用率: 使用 top 命令可以查看当前系统的CPU使用情况。
    top -b -n 1
 2 检查内存使用情况: 使用 free 命令可以查看内存使用情况。
    free -h
 3 检查磁盘使用情况: 使用 df 命令可以查看磁盘空间使用情况。
    df -h
 4 检查网络连接状态: 使用 netstat 命令可以查看网络连接状态。
    netstat -tuln
 5 检查系统负载: 使用 uptime 命令可以查看系统的平均负载。
    uptime
 6 检查系统日志: 使用 journalctl 命令可以查看系统日志,帮助发现潜在的问题。
    journalctl -xe
 7 检查服务状态: 使用 systemctl 命令可以查看系统服务的状态。
    systemctl list-units --type=service --state=failed

通过以上命令,你可以全面了解服务器的健康状况。如果有任何异常,可以根据输出的信息进一步排查问题。

[Copilot]发现如下命令:
    1. top -b -n 1
    2. free -h
    3. df -h
    4. netstat -tuln
    5. uptime
    6. journalctl -xe
    7. systemctl list-units --type=service --state=failed

[Copilot]: 请选择要执行的命令或者保存所有命令,从[s, 1, 7]中进行选择,回复's''save'进行保存,回复'n''no'进行取消,回复'r''retry'重新生成回答。
请输入: 1

[Copilot]: 确认执行该命令[top -b -n 1](y/n)
请输入: y
top - 15:53:04 up 94 days, 22:14,  1 user,  load average: 0.01, 0.02, 0.00
Tasks: 224 total,   1 running, 220 sleeping,   0 stopped,   3 zombie
%Cpu(s):  3.1 us,  3.1 sy,  0.0 ni, 93.8 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
MiB Mem :   3581.4 total,    668.4 free,   1285.0 used,   1628.1 buff/cache
MiB Swap:      0.0 total,      0.0 free,      0.0 used.   1834.3 avail Mem

    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
3216368 root      20   0       0      0      0 I   6.7   0.0   0:01.06 kworker+
      1 root      20   0  169548   6352   3068 S   0.0   0.2   1:40.93 systemd
      4 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 rcu_par+

...

3219422 root      20   0    2744    816    708 S   0.0   0.0   0:00.23 copilot
3219423 root      20   0  517300  73980  17776 S   0.0   2.0   0:01.34 copilot
3219447 root      20   0  227204   4668   4020 R   0.0   0.1   0:00.00 top

[Copilot]: 执行结束。

可以看到,这种模式下,Copilot 会根据用户的输入要求,给出对应的建议命令,然后需要手动选择、确认执行。

2.使用自动模式,在命令后面增加参数 -t

copilot 当前服务器的健康度 -t

输出以下内容

[Copilot]:
为了评估服务器的健康状况,我们需要检查一些关键指标,比如CPU使用率、内存使用情况、磁盘空间和网络状态。这些信息可以通过执行一系列的命令来获取。

[Copilot]:
从top命令的输出可以看到,CPU的使用率大约为6.2%(用户进程3.1% + 系统进程3.1%),空闲率为93.8%,这表明CPU的负载较低。

[Copilot]:
从free -m命令的输出可以看到,总内存为3581MB,已使用的内存为1284MB,空闲内存为669MB,缓冲/缓存占用1627MB,可用内存为1834MB。这表明内存使用情况良好,没有出现内存不足的情况。

接下来,我们检查磁盘空间和网络状态。

[Copilot]:
从df -h命令的输出可以看到,根文件系统的总大小为79GB,已使用36GB,剩余40GB,使用率为48%。这表明磁盘空间还有足够的余量,没有出现磁盘空间不足的情况。

最后,我们检查网络状态。

[Copilot]:
从netstat -tuln命令的输出可以看到,服务器上运行着多个监听端口的服务,包括HTTP (80), HTTPS (443), SSH (22)等常用服务。这些服务都在正常监听状态,没有异常。

综合以上信息:

 • CPU使用率较低,约为6.2%。
 • 内存使用情况良好,没有出现内存不足的情况。
 • 磁盘空间还有足够的余量,使用率为48%。
 • 网络状态正常,各服务都在正常监听状态。

因此,当前服务器的健康状况良好,没有明显的性能瓶颈或资源不足的问题。

[Copilot]:
当前服务器的健康状况良好,没有明显的性能瓶颈或资源不足的问题。具体指标如下:

 • CPU使用率:约6.2%
 • 内存使用情况:总内存3581MB,已使用1284MB,空闲669MB,缓冲/缓存1627MB,可用1834MB
 • 磁盘空间:根文件系统总大小79GB,已使用36GB,剩余40GB,使用率48%
 • 网络状态:各服务都在正常监听状态,没有异常

3.使用文件定义任务

新建一个文件,定义需要执行的任务

cat task.txt

1.查找日志中大于200M的文件,列出来,显示每个文件的名称和大小
2.用户确认是否清理
3.确认以后删除这些文件

测试结果

copilot 执行任务

co -f ~/task.txt -t
[Copilot]:
我需要先找到大于200M的日志文件并列出它们的名称和大小。这可以通过find命令实现。

[Copilot]:
Observation:

输出中断,没有完成实际的任务,也没有给出完整的建议。

4.测试解释命令

cat /etc/sysctl.conf |co "使用中文解释"

[Copilot]:
这些配置项都是用于调整Linux内核参数的,下面我将逐一解释每个配置项的意义:                                                                                                        vm.swappiness = 0
 • 含义:vm.swappiness 参数控制了系统使用交换空间(swap)的倾向性。值为0表示尽可能避免使用交换空间,只有当物理内存不足时才会使用。
 • 作用:减少磁盘I/O操作,提高系统性能。                                                                                                                            kernel.sysrq = 1

 • 含义:kernel.sysrq 参数启用了“魔术 SysRq”键功能。当设置为1时,允许通过组合键(通常是 Alt + SysRq + <command>)执行某些低级别的内核操作。
 • 作用:在系统出现严重问题时,可以用来诊断和恢复系统。                                                                                                        net.ipv4.neigh.default.gc_stale_time = 120

 • 含义:net.ipv4.neigh.default.gc_stale_time 参数设置了邻居表项(如ARP缓存)中过期条目的垃圾回收时间。值为120秒表示过期条目将在120秒后被清理。
 • 作用:防止邻居表项占用过多内存,保持网络连接的高效性。                                                                                                                   net.ipv4.conf.all.rp_filter = 0

...                                                                                                 

 • 注释:net.ipv4.tcp_max_syn_backlog 参数设置了SYN队列的最大长度。值为65536表示最多允许65536个未完成的连接请求。
 • 作用:增加SYN队列长度,提高服务器处理大量并发连接的能力。
 • 注意:此参数仅在 net.ipv4.tcp_syncookies 设置为0时生效。

这些配置项通常用于优化系统的网络性能和安全性,确保在高负载情况下系统的稳定性和响应速度。

这里出现的问题是,如果不告诉他使用中文解释,默认使用的英文,不是很好用。

参考资料

智能助手OS Copilot使用说明

相关文章
|
14天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
阿里云与企业共筑容器供应链安全
171330 12
|
17天前
|
供应链 监控 安全
对话|企业如何构建更完善的容器供应链安全防护体系
随着云计算和DevOps的兴起,容器技术和自动化在软件开发中扮演着愈发重要的角色,但也带来了新的安全挑战。阿里云针对这些挑战,组织了一场关于云上安全的深度访谈,邀请了内部专家穆寰、匡大虎和黄竹刚,深入探讨了容器安全与软件供应链安全的关系,分析了当前的安全隐患及应对策略,并介绍了阿里云提供的安全解决方案,包括容器镜像服务ACR、容器服务ACK、网格服务ASM等,旨在帮助企业构建涵盖整个软件开发生命周期的安全防护体系。通过加强基础设施安全性、技术创新以及倡导协同安全理念,阿里云致力于与客户共同建设更加安全可靠的软件供应链环境。
150295 32
|
25天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
201961 14
对话 | ECS如何构筑企业上云的第一道安全防线
|
2天前
|
机器学习/深度学习 自然语言处理 PyTorch
深入剖析Transformer架构中的多头注意力机制
多头注意力机制(Multi-Head Attention)是Transformer模型中的核心组件,通过并行运行多个独立的注意力机制,捕捉输入序列中不同子空间的语义关联。每个“头”独立处理Query、Key和Value矩阵,经过缩放点积注意力运算后,所有头的输出被拼接并通过线性层融合,最终生成更全面的表示。多头注意力不仅增强了模型对复杂依赖关系的理解,还在自然语言处理任务如机器翻译和阅读理解中表现出色。通过多头自注意力机制,模型在同一序列内部进行多角度的注意力计算,进一步提升了表达能力和泛化性能。
|
7天前
|
存储 人工智能 安全
对话|无影如何助力企业构建办公安全防护体系
阿里云无影助力企业构建办公安全防护体系
1251 8
|
7天前
|
人工智能 自然语言处理 程序员
通义灵码2.0全新升级,AI程序员全面开放使用
通义灵码2.0来了,成为全球首个同时上线JetBrains和VSCode的AI 程序员产品!立即下载更新最新插件使用。
1301 24
|
9天前
|
机器学习/深度学习 自然语言处理 搜索推荐
自注意力机制全解析:从原理到计算细节,一文尽览!
自注意力机制(Self-Attention)最早可追溯至20世纪70年代的神经网络研究,但直到2017年Google Brain团队提出Transformer架构后才广泛应用于深度学习。它通过计算序列内部元素间的相关性,捕捉复杂依赖关系,并支持并行化训练,显著提升了处理长文本和序列数据的能力。相比传统的RNN、LSTM和GRU,自注意力机制在自然语言处理(NLP)、计算机视觉、语音识别及推荐系统等领域展现出卓越性能。其核心步骤包括生成查询(Q)、键(K)和值(V)向量,计算缩放点积注意力得分,应用Softmax归一化,以及加权求和生成输出。自注意力机制提高了模型的表达能力,带来了更精准的服务。
|
7天前
|
消息中间件 人工智能 运维
1月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
589 23
1月更文特别场——寻找用云高手,分享云&AI实践
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
|
13天前
|
人工智能 自然语言处理 API
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。