📣📣📣达摩院-视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1. 千帆大模型平台接入Llama 2等33个大模型
百度智能云方面表示,千帆大模型平台已完成新一轮升级,目前已经全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个大模型,成为国内拥有大模型最多的平台。接入的模型经过千帆平台二次性能增强,模型推理成本最高可降低50%。同时,千帆平台上线了国内最全的预置Prompt模板,模板数量多达103个,覆盖对话、游戏、编程、写作十余个场景。
本次千帆大模型平台升级的目的是给企业、开发者提供更加灵活、多样化、高效的大模型服务,客户可选择最适合自身业务的大模型,再利用千帆平台全套工具链进行模型再训练、指令微调等,高效率、低成本地打造企业专属大模型。此外,海量Prompt模板库可提高大模型内容准确性和满意度。
如今,大模型正在重塑各行各业,进入产业落地期。为降低大模型使用门槛,千帆大模型平台将持续汇聚优质的大模型资源,提供易用可靠的大模型工具链,帮助每个企业、开发者打通拥抱大模型的最短路径,共同探索大模型与行业结合的创新实践。
2. API 调用上优于 GPT-4,微软研发出 Gorilla LLM
微软研究院近日联合加州大学伯克利分校,开发出名为 Gorilla 的全新大语言模型(LLM),表示在准确性、灵活性等 API 调用方面优于 GPT-4。微软研究院表示即便 API 文档发生更改,在调用 API 时依然能生成正确的语义和语法。GPT-4 固然是 OpenAI 研发的最强大 LLM,可驾驭生成文本、翻译语言、回答内容等各种场景,不过 API 调用方面是其短板,无法理解 API 调用的语义,只能生成和 API 文档相似的文本。
微软研究院所研发的 Gorilla LLM,使用名为“检索器感知训练”(retriever-aware training)的技术,让 LLM 学习 API 调用的语义,并生成语义和语法正确的文本内容。在最近的一项研究中,在各种 API 调用任务上,Gorilla 表现优于 GPT-4。GPT-4 在 API 调用准确率为 85%,而 Gorilla 的准确率可以达到 95%。
3.微软更新 AI 服务条款:不得用于反向工程等
微软近日公示了旗下的 AI 服务条款,并宣布将于 9 月 30 日正式生效。本次新增条款主要针对生成式 AI,特别在使用相关用户、以及负责任的开发实践等。
微软强调官方并不会保留用户和必应聊天的对话,也不会利用这些聊天数据,用于训练 Bing Enterprise Chat 的 AI 模型。这五个关键政策要点涵盖一系列领域,包括禁止用户尝试对 AI 模型进行逆向工程,从而防止发现底层组件;除非明确允许,否则不允许通过 Web 抓取等方法提取数据;一项重要条款限制用户使用 AI 数据创建或增强其他 AI 服务。
微软新增条款内容如下:
o. AI 服务。“AI 服务”指微软标记或描述为包括、使用、由人工智能(以下简称“AI”)系统提供支持或构成人工智能系统的服务。
- i. 反向工程。您不得使用 AI 服务来发现模型、算法和系统的任何底层组件。例如,您不得尝试确定和删除模型的权重。
- ii. 提取数据。除非得到明确允许,否则您不得使用网络抓取、网络搜寻或网络数据提取方法从 AI 服务中提取数据。
- iii. AI 服务数据的使用限制。您不得使用 AI 服务或来自 AI 服务的数据来创建、训练或改进(直接或间接)任何其他 AI 服务。
- iv. 使用您的内容。微软在提供 AI 服务的过程中,将处理和存储您对服务的输入以及服务的输出,以监控和防止服务的滥用、有害使用或输出。
- v. 第三方索赔。如果第三方就您使用 AI 服务提出索赔(包括但不限于与您使用 AI 服务时的内容输出有关的版权侵权或其他索赔),您自行负责根据适用法律做出响应。
4. 深圳:到2025年累计开放数据集总量5000个以上
据深圳特区报今日报道,深圳市委、市政府近日同意并正式印发《深圳市优化市场化营商环境工作方案(2023—2025年)》。该方案提出加快培育数据要素市场,健全深圳市公共数据开放平台,2023年出台深圳市公共数据开放管理办法,到2025年累计开放数据集总量5000个以上;2023年出台数据产权登记管理暂行办法,保护数据要素市场参与主体合法权益,促进数据要素开放流动和开发利用;开展数据跨境传输(出境)安全管理工作,探索建立数据安全管理相关机制;2024年在企业登记监管、卫生健康、交通运输、气象、金融、电力等重点领域开展公共数据授权运营试点。
📖新鲜论文早知道
清华等发布大模型基准测试工具AgentBench,可以评估LLM在多轮开放式生成环境中的推理和决策能力
来自清华大学、俄亥俄州立大学、加州大学伯克利分校的研究人员介绍了一个面向大型语言模型的多维基准测试工具AgentBench。AgentBench由8个不同的任务组成,可评估大语言模型在多轮开放式生成环境中的推理和决策能力。研究团队对25个大型语言模型的广泛测试表明,顶级商业大型语言模型在复杂环境中表现出强大的代理能力,但它们与开源竞争对手之间的性能存在显著差异。根据测试结果,GPT-4表现最佳,Claude和GPT-3.5分居第二、第三名。
论文链接:https://arxiv.org/pdf/2308.03688.pdf
项目地址:https://github.com/THUDM/AgentBench
🔥开源模型先体验
IBM联合NASA发布开源地理空间模型,用于拍摄地球卫星图像
美国宇航局NASA估计,仅在2024年,其地球科学任务将产生约25万TB的数据。为了让气候科学家和研究界有效地挖掘这些大量的原始卫星数据,IBM、HuggingFace和美国宇航局合作建立了一个开源的地理空间基础模型。该模型以IBM最近发布的Watsonx.ai作为基础模型,将作为一种新型气候和地球科学人工智能的基础,用于追踪森林砍伐、预测作物产量和减少温室气体排放。
对于这个项目,IBM利用其最近发布的Watsonx.ai作为基础模型,使用美国宇航局一年的协调Landsat Sentinel-2卫星数据(HLS)。该数据由欧空局的一对哨兵2号卫星收集,这些卫星旨在获取13个光谱带的陆地和沿海地区的高分辨率光学图像。HuggingFace正在其开源人工智能平台上托管该模型。据IBM称,通过在“洪水和烧伤疤痕映射的标签数据”上微调模型,该团队能够使用一半的数据将模型的性能比当前最先进的水平提高15%。
开源的地理空间基础模型:https://huggingface.co/ibm-nasa-geospatial
Watsonx.ai基础模型地址:https://www.ibm.com/us-en
相关视频:https://www.youtube.com/watch?v=9bU9eJxFwWc
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。