在阿里云PAI-DSW完成微调的大模型,通过EAS部署为AI-web应用,目前能通过自己的机器访问该web页面,但是其他IP提示需登录验证ram用户,该web应用下也提示“同一主账号下的子账号均可查看应用”。我如何讲该应用开放为公网web应用,能提供给用户在公网ip访问呢
要将在阿里云 PAI-DSW 完成微调的大模型通过 EAS 部署为 AI-web 应用并开放为公网 web 应用,可参考以下步骤:
准备工作
确保已在阿里云 PAI-DSW 完成大模型的微调,并将模型及相关文件存储到对象存储 OSS 等存储产品中.
确认已开通阿里云 EAS 服务,并了解相关的操作权限和资源配置情况.
模型部署
登录 PAI 控制台,在左侧导航栏单击工作空间列表,进入对应的工作空间,选择模型部署>模型在线服务(EAS),进入 EAS 模型在线服务页面.
点击部署服务,选择镜像部署 AI-Web 应用方式,根据模型及应用需求选择合适的镜像及版本 ,配置运行命令、端口号等参数,如使用 llama2-13b 模型部署,运行命令为 python webui/webui_server.py --listen --port=8000 --model-path=meta-llama/llama-2-13b-chat-hf --precision=fp16 .
开放为公网应用
进入 EAS 服务详情页,点击查看调用信息,获取服务调用的 VPC 地址、API 和 Token 等信息.
在阿里云控制台配置安全组规则,开放 EAS 应用所使用的端口,允许公网 IP 访问该端口,将 EAS 应用的 VPC 地址与公网进行连通 。
根据获取的 API 和 Token 等信息,通过前端页面或其他调用方式,从公网访问该 AI-web 应用,实现与大模型的交互.
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。