南加州大学最新研究:ChatGPT或只有70亿参数规模

简介: 【2月更文挑战第28天】南加州大学最新研究:ChatGPT或只有70亿参数规模

6bbf7aab052364143b2f46c6fecbe1bc.jpg
在人工智能领域,大型语言模型(LLM)的发展一直是研究的热点。南加州大学的研究团队近期发表的一篇论文,为我们提供了对这些模型更深入理解的可能性。该研究团队发现,即使是通过API保护的LLM,也能通过少量的查询推断出模型的关键信息,这一发现对于理解LLM的内部工作机制具有重要意义。

LLM的商业化使得许多公司和组织选择通过API来限制对模型的访问,以保护其专有技术。然而,南加州大学的研究发现,这种做法可能给LLM提供商带来一种虚假的安全感。研究者指出,尽管LLM的架构信息被认为是私有的,但实际上,通过API查询,外部研究者可以获取到关于模型的大量信息。这一发现挑战了现有的安全假设,提示LLM提供商需要重新审视他们的安全策略。

研究的核心在于揭示了LLM普遍存在的softmax瓶颈问题。由于这一瓶颈,LLM的输出被限制在了一个低维的子空间内,形成了所谓的LLM“图像”。研究者通过收集少量的输出样本,就能够构建出这个图像的基,从而推导出模型的隐藏大小和输出层参数。这一方法的提出,为LLM的分析和理解开辟了新的途径。

通过实证研究,研究者估计了OpenAI的gpt-3.5-turbo模型的嵌入大小约为4096,这意味着该模型可能拥有大约70亿个参数。这一发现对于评估LLM的性能和规模具有重要意义,也为模型的进一步研究和开发提供了参考。

此外,研究者还探讨了如何利用LLM图像来实现多种应用,例如高效地从API保护的LLM中获取完整输出、识别产生特定输出的LLM、检测和区分LLM的更新类型等。这些应用不仅能够提高LLM的使用效率,还能够增强用户对LLM提供商的信任。

研究者提出的算法通过减少API调用次数,显著提高了获取完整LLM输出的速度和效率。这种超快速完整输出算法,通过预处理步骤获取LLM的低维图像,将获取完整LLM输出所需的API调用次数从O(v)降低到O(d),其中d是嵌入大小,v是词汇表大小。这种加速使得获取完整LLM输出的速度和成本提高了多达100倍,具体取决于LLM的类型。

尽管这项研究为LLM的分析和理解提供了新的工具,但它也引发了一些潜在的问题。例如,这种技术可能会使依赖完整输出的模型窃取方法变得更便宜,这对于LLM提供商来说可能是一个挑战。然而,研究者认为,这种方法对于API客户来说提供了更多的工具,同时警告LLM提供商他们的API暴露了哪些信息。他们认为,这些发现和方法不需要改变LLM API的最佳实践,而是扩展了API客户可用的工具集。

论文地址:
https://arxiv.org/abs/2403.09539

目录
相关文章
|
3月前
|
开发框架 人工智能 自然语言处理
基于ChatGPT的API的C#接入研究
基于ChatGPT的API的C#接入研究
|
5月前
|
人工智能 自然语言处理 搜索推荐
【人工智能】第六部分:ChatGPT的进一步发展和研究方向
【人工智能】第六部分:ChatGPT的进一步发展和研究方向
62 3
|
6月前
|
机器学习/深度学习 人工智能
斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成
斯坦福大学研究发现,顶级学术会议评审内容中有一部分可能由大型语言模型如ChatGPT生成,揭示AI对学术领域的影响,引发学术诚信和评审质量关注。研究团队通过新框架“分布式GPT量化”更准确检测AI参与度,发现AI在评审紧迫、无引用及低互动场景中更常见,可能影响评审质量和多样性。尽管AI能提升效率,但也可能导致同质化和学术不端。该研究强调了在利用AI的同时保持学术评审质量的重要性。
52 3
斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成
|
6月前
|
机器学习/深度学习 人工智能
看看OpenAI(ChatGPT)怎么回答马斯克呼吁停止ai研究的?
看看OpenAI(ChatGPT)怎么回答马斯克呼吁停止ai研究的?
332 1
|
人工智能
专门做研究的ChatGPT平台:你的答案完全来自论文,免费使用
专门做研究的ChatGPT平台:你的答案完全来自论文,免费使用
专门做研究的ChatGPT平台:你的答案完全来自论文,免费使用
|
人工智能 监控 机器人
OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大
OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大
114 0
|
编解码 人工智能 自然语言处理
ChatGPT爆火之后,视觉研究者坐不住了?谷歌将ViT参数扩大到220亿
ChatGPT爆火之后,视觉研究者坐不住了?谷歌将ViT参数扩大到220亿
165 0
|
机器学习/深度学习 数据采集 人工智能
从BERT到ChatGPT,北航等9大顶尖研究机构全面综述:那些年一起追过的「预训练基础模型」
从BERT到ChatGPT,北航等9大顶尖研究机构全面综述:那些年一起追过的「预训练基础模型」
194 0
|
3月前
|
人工智能 自然语言处理 搜索推荐
chatgpt这么火,现在AI搜索引擎有哪些呢?
国外AI搜索引擎包括ChatGPT,擅长自然语言处理与内容生成;Google Bard,提供智能个性化搜索体验;Microsoft Bing集成GPT模型增强智能检索;Perplexity AI以简洁答案及文献引用著称;Neeva强调隐私保护与无广告服务。国内方面,天工AI支持多种功能如知识问答与代码编程;腾讯元宝基于混元模型助力内容创造与学习;360AI搜索以精准全面的信息搜索见长;秘塔AI专注提升写作质量和效率;开搜AI搜索提供个性化智能搜索服务。以上引擎均利用先进AI技术提升用户体验。更多详情参阅[AI搜索合集](zhangfeidezhu.com/?page_id=651)。
110 8
chatgpt这么火,现在AI搜索引擎有哪些呢?
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
HuggingGPT解析:使用 ChatGPT及HuggingFace上的族系解决AI问题
HuggingGPT是一个框架,它使用大型语言模型(如ChatGPT)作为控制器来管理和协调Hugging Face上的AI模型,以语言作为通用接口解决多模态和领域的复杂AI任务。
57 0
HuggingGPT解析:使用 ChatGPT及HuggingFace上的族系解决AI问题