📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1. AI 聊天机器人平台 Poe 新增 Mac 应用和 Llama 2 模型
Poe 是由知名问答网站 Quora 创立的一个 AI 聊天机器人平台,近日 Poe 发布了一系列的更新,包括 Mac 应用、与同一个 AI 机器人同时进行多个对话的功能、接入 Meta 的 Llama 2 模型等。此外,Poe 还计划推出企业级服务,让公司可以为员工管理平台使用情况。
Poe 的平台上有各种各样的 AI 聊天机器人,例如 OpenAI 的 ChatGPT-4 和 Anthropic 的 Claude。用户按年或月订阅后可以无限制地使用所有的机器人。新推出的 Mac 应用与 Poe 的网页和移动应用非常相似,都可以让用户与多个机器人进行交流。此次Poe还增加了三个新的机器人,都使用了 Meta 开源的 Llama 2 模型。此外,Poe 现在允许用户与同一个机器人进行多个对话、通过探索页面搜索机器人,并且支持日语使用。
2. 微软发布 Turing Bletchley v3 视觉语言模型:必应搜索图片更精准
微软今天发布新闻稿,宣布推出第三代 Turing Bletchley 视觉语言模型,并逐步整合到必应(Bing)等相关产品中,可以大幅改进图像搜索体验。微软表示目前已使用 Turing Bletchley v3 视觉语言模型,用于审核 Xbox 游戏服务上的内容,它可以帮助团队识别 Xbox 玩家上传到其个人资料中的图像和视频,营造更和谐的社区环境。
3. 谷歌推出全新人工智能助理 Duet AI
谷歌宣布,将在所有的 Workspace 应用中推出人工智能助理 Duet AI,包括 Gmail、Drive、Slides、Docs 等。该公司表示,Duet 技术已经测试了一段时间,已经有超过一百万人体验了这款虚拟助手。现在,任何付费使用谷歌 Workspace 应用的用户都可以使用 Duet AI。
谷歌此前公布了 Duet AI 人工智能,官方将其描述为一个在所有谷歌应用中都能提供帮助的合作伙伴。用户可以让 Duet AI 将 Google Docs 大纲转换成 Slides 中的演示文稿,或者让它根据电子表格中的数据制作图表。Duet AI 也可以是一个创造性的工具,用户可以让它写一封电子邮件回复,生成图像,或者检查语法。而且,还可以用它在 Drive 中找东西,总结文档等等。Duet AI 也是一个涵盖很多应用特定功能的统称,在 Google Meet 中使用 Duet AI 意味着基于人工智能的光照和声音调整以及自动会议总结;在 Chat 中使用 Duet AI 意味着聊天长文自动摘要,让你不用花太多时间阅读。
4. 谷歌 DeepMind 推出 SynthID 工具,能在 AI 生成的图像中嵌入隐形水印
谷歌 DeepMind 团队近日推出了一款名为 SynthID 的工具,可以在 AI 生成的图像中嵌入人眼不可见的水印,但可以用专门的人工智能检测工具检测出来,以便于区分真实和虚假的内容。该工具已经在谷歌云平台上向部分客户开放。
SynthID 的原理是在图像的像素中嵌入一个水印,但不会影响图像本身的质量和体验。该水印可以抵抗裁剪、缩放等常见的图片编辑操作,只有专门的 AI 检测工具才能识别出来。谷歌 DeepMind 的 CEO Demis Hassabis 表示,这种水印随着 AI 模型的改进,会变得更加隐蔽和强大。
目前,SynthID 只能在谷歌云平台上使用,主要针对使用 Vertex AI 平台和 Imagen 图像生成器的客户。除了谷歌之外,还有许多其他公司也在致力于建立 AI 保护和安全系统。例如,Meta、OpenAI 等公司正在使用一种名为 C2PA 的协议,利用加密元数据来标记 AI 生成的内容。
📖新鲜论文早知道
开源视频风格处理算法CoDeF
据量子位报道,来自香港科技大学、蚂蚁团队、浙江大学CAD&CG实验室合作的视频风格处理项目CoDeF及其论文于上周发布,该算法能够根据提示词对视频进行风格转换。CoDeF是“the content deformation field”的缩写,即“内容形变场”。相较于传统方法,该算法能够实现跨帧一致性,跟踪烟雾、水流等非刚性物体,支持各种图像算法直接用于视频处理。
比起静态的图像风格迁移,视频任务的复杂点在于时间序列上的一致性和流畅度。比如处理水、烟雾这种元素,两帧画面之间的一致性非常重要。在此,作者“灵机一动”,提出用图片算法来直接解决视频任务。他们只在一张图像上部署算法,再将图像-图像的转换,提升为视频-视频的转换,将关键点检测提升为关键点跟踪,而且不需要任何训练。这样一来,相较于传统方法,能够实现更好的跨帧一致性,甚至跟踪非刚性物体。
之所以会被称为是“视频版ControlNet”,主要原因在于CoDeF能够对原视频做到精准控制。(ControlNet实现了根据提示词精准控制图像元素改变,如人物动作、图像结构等)根据给到的提示词,它仅改变视频的画风,而且是针对完整视频。
论文地址:https://arxiv.org/abs/2308.07926
项目地址:https://qiuyu96.github.io/CoDeF/
🎤观点方向多了解
Gartner:生成式AI正处于期望膨胀期
Gartner于8月16日发布的报告称,生成式AI正处于“期望膨胀期”(Peak of Inflated Expectations),预计将在2-5年内实现效益转型。
Gartner于2015年推出技术成熟度曲线(Hype Cycle),用来预测各种新科技的成熟演变速度。该曲线将新兴技术的生命周期划分为5个阶段:技术萌芽期、期望膨胀期、泡沫破裂谷底期、稳步爬升复苏期、生产成熟期。
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。