大语言模型 LLM 管理功能特点解析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 大语言模型领域正快速发展,涵盖技术革新、跨领域应用及行业影响。随着技术进步,更多创新性AI应用和服务涌现。Botnow加速迭代AI应用开发平台,赋能各行各业。新发布的模型管理功能包括模型仓库和模型服务,支持模型文件托管、部署及推理服务,提升使用效率,降低成本。模型服务具备本地推理和接入外部模型的能力,满足中大型企业对大语言模型自主可控的需求。

大语言模型领域正处于快速发展阶段,涉及技术革新、跨领域应用以及行业影响等多个方面。随着技术的进步,我们预计会看到更多创新性的AI应用和服务涌现出来。为此,Botnow 正在加速迭代 AI 应用开发平台,赋能千行百业的 AI 应用落地。


近日,Botnow 正式发布模型管理功能,包含模型仓库和模型服务两部分:


模型仓库


模型仓库支持模型文件托管,用户可以通过上传本地模型文件,也可以从魔搭(ModelScope)或HuggingFace上拉群模型文件并保存在模型仓库,模型仓库帮助用户免去了频繁下载远程模型文件,节省了运维和资源成本,提升了用户使用大语言模型的效率,同时方便用户将大语言模型部署并发布模型推理服务,供业务中使用。


下面让我们详细了解一下模型仓库的功能特点:

新增模型

左侧菜单选择“模型管理” -> “模型仓库”,点击“创建模型”,即可进行新增模型操作。平台支持模型来源包括:魔搭社区、Hugging Face、本地模型



新建完成后,点击”确定“,即可保存模型信息。

  • 魔搭社区:需要录入模型文件的地址以及对应的分支。当创建完成时,平台会自动根据填写的模型地址、分支自动获取模型文件。
  • Hugging Face:需要录入模型文件的地址、对应的分支,以及 Token(非必填)。当创建完成时,平台会自动根据填写的模型地址、分支自动获取模型文件。
  • 本地模型:需要上传本地文件。当创建完成时,需要您手动上传本地模型文件。


模型详情


用户可在模型详情页面查看模型介绍以及模型文件:




其他功能


  • 模型部署。在模型列表以及详情页面中,支持本地模型快捷部署操作,点击“部署”按钮,即可跳转至 “模型服务 / 新增模型服务” 页面。
  • 编辑模型。支持编辑模型基本信息与接入信息。
  • 模型文件管理。如果是模型来源是本地模型,在详情页面中,支持对模型文件进行管理操作,包含:上传文件、删除文件。
  • 删除模型仓库


模型服务


模型服务具备本地模型推理和接入外部模型的能力。本地模型推理服务旨在为用户提供开箱即用的模型推理加速引擎,它大幅降低大型模型的部署成本,本地模型推理服务具备简单易用、易于扩展、性能优化等特点,并支持Llama系列模型、Qwen、Embedding、Reranking模型等。外部模型服务支持无缝接入第三方模型服务API,支持Qwen、Moonshot、OpenAI、Gemini、Zhipu、DeepSeek等第三方模型服务。


新增模型服务

进入模型服务页面,点击 “新增模型服务” 按钮,进入新增模型服务页面。新增模型服务时 ,需要填写服务基本信息,以及选择模型来源,来源包括:本地模型、外部模型。


本地模型推理服务部署

部署本地模型服务时,需要配置的内容如下:


  • 选择要部署的模型文件
  • 配置服务规格:配置服务规格时,支持选择指定的节点。



  • 高级配置:模型推理服务支持 vLLM 推理加速和分布式多 GPU 调度能力



接入外部模型服务


部署本地模型服务时,需要配置的内容如下:

  • 输入模型服务名称,例如 “OpenAI”。
  • 输入模型服务别名,例如 “OpenAI GPT-4o 模型服务”。
  • 模型来源选择 “外部模型”
  • 填写描述,例如 “OpenAI GPT-4o 模型服务”。
  • 选择模型服务供应商



  • 填写对应的 Token
  • 完成填写后,点击【确定】按钮,即可完成创建操作。


模型服务详情


点击模型服务卡片,可进入模型服务详情页面,查看模型服务详情。


  • 外部模型服务



  • 本地模型服务


其他功能

  • 上线 / 下线(仅本地模型服务支持)。本地模型服务部署成功后,支持上线 / 下线操作。下线之后,将停止提供服务
  • 编辑模型服务。本地模型服务支持编辑模型以及服务规格;外部模型服务支持编辑基本信息以及外部服务配置。
  • 删除模型服务


应用场景


中大型企业大多要求对大语言模型自主可控,主要体现在两方面的使用场景:


  • 接入第三方大模型服务的API,这类场景一般是数据不敏感的业务,且对模型回答的质量有较高的要求,是一般开源大模型或微调大模型无法达到的效果。
  • 本地部署开源模型或经微调后的模型,这类场景企业基本可以实现端到端的管理大模型,从模型文件的管理 -> 模型部署推理 -> 接入智能体 Bot -> AI 加持的业务上线运营 -> 产生效益。这是企业落地大模型较理想的形态,兼具了成本和自主可控的特点。


Botnow 模型管理能力的推出,加上 Botnow 已具备的强大的智能体编排能力,能较好得满足上述企业用户的需求和使用场景。

相关文章
|
2月前
|
人工智能 自然语言处理 前端开发
基于RAG和LLM的水利知识大语言模型系统开发有感
在数字化时代,水利行业的智能化管理尤为重要。本文介绍了基于大语言模型(LLM)和检索增强生成(RAG)技术的水利知识问答系统的开发过程。该系统结合了前沿AI技术和水利专业知识,通过构建全面的水利知识库,优化用户体验,确保系统的灵活性和可扩展性。项目展示了AI技术在垂直领域的巨大潜力,为水利行业的智能化发展贡献力量。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
Hugging Face 论文平台 Daily Papers 功能全解析
【9月更文挑战第23天】Hugging Face 是一个专注于自然语言处理领域的开源机器学习平台。其推出的 Daily Papers 页面旨在帮助开发者和研究人员跟踪 AI 领域的最新进展,展示经精心挑选的高质量研究论文,并提供个性化推荐、互动交流、搜索、分类浏览及邮件提醒等功能,促进学术合作与知识共享。
|
1月前
|
安全 Java 测试技术
🎉Java零基础:全面解析枚举的强大功能
【10月更文挑战第19天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
117 60
|
2月前
|
Web App开发 前端开发 测试技术
Selenium 4新特性解析:关联定位器及其他创新功能
【10月更文挑战第6天】Selenium 是一个强大的自动化测试工具,广泛用于Web应用程序的测试。随着Selenium 4的发布,它引入了许多新特性和改进,使得编写和维护自动化脚本变得更加容易。本文将深入探讨Selenium 4的一些关键新特性,特别是关联定位器(Relative Locators),以及其他一些重要的创新功能。
195 2
|
1月前
|
供应链 安全 BI
CRM系统功能深度解析:为何这些平台排名靠前
本文深入解析了市场上排名靠前的CRM系统,如纷享销客、用友CRM、金蝶CRM、红圈CRM和销帮帮CRM,探讨了它们在功能性、用户体验、集成能力、数据安全和客户支持等方面的优势,以及如何满足企业的关键需求,助力企业实现数字化转型和业务增长。
|
3月前
|
移动开发 Android开发 数据安全/隐私保护
移动应用与系统的技术演进:从开发到操作系统的全景解析随着智能手机和平板电脑的普及,移动应用(App)已成为人们日常生活中不可或缺的一部分。无论是社交、娱乐、购物还是办公,移动应用都扮演着重要的角色。而支撑这些应用运行的,正是功能强大且复杂的移动操作系统。本文将深入探讨移动应用的开发过程及其背后的操作系统机制,揭示这一领域的技术演进。
本文旨在提供关于移动应用与系统技术的全面概述,涵盖移动应用的开发生命周期、主要移动操作系统的特点以及它们之间的竞争关系。我们将探讨如何高效地开发移动应用,并分析iOS和Android两大主流操作系统的技术优势与局限。同时,本文还将讨论跨平台解决方案的兴起及其对移动开发领域的影响。通过这篇技术性文章,读者将获得对移动应用开发及操作系统深层理解的钥匙。
|
1月前
|
数据管理 Nacos 开发者
"Nacos架构深度解析:一篇文章带你掌握业务层四大核心功能,服务注册、配置管理、元数据与健康检查一网打尽!"
【10月更文挑战第23天】Nacos 是一个用于服务注册发现和配置管理的平台,支持动态服务发现、配置管理、元数据管理和健康检查。其业务层包括服务注册与发现、配置管理、元数据管理和健康检查四大核心功能。通过示例代码展示了如何在业务层中使用Nacos,帮助开发者构建高可用、动态扩展的微服务生态系统。
89 0
|
2月前
|
Web App开发 存储 前端开发
前端开发必备:requestAnimationFrame、setInterval、setTimeout——功能解析与优劣对比
前端开发必备:requestAnimationFrame、setInterval、setTimeout——功能解析与优劣对比
164 0
|
3月前
|
存储 自然语言处理 搜索推荐
外汇CRM系统的关键特点及功能解析
Zoho CRM外汇系统提供全面客户管理,涵盖信息记录、交易历史等,提升个性化服务水平。系统界面直观易用,支持自定义,数据分析实时,助决策精准。具备高安全性,多系统整合能力强,自动化功能提高效率,支持多语言,适用于全球市场,配备专业客户支持与培训,助力外汇企业优化流程,增强客户满意度,在竞争中领先。
59 1

推荐镜像

更多