暂无个人介绍
窥探他人眼中的世界:用眼睛反光重建3D场景,《黑镜》走进现实
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力
结合符号性记忆,清华等提出ChatDB,提升大模型的复杂推理能力
CVPR 2023|All in UniSim:统一的自动驾驶仿真平台
数字文艺复兴来了:英伟达造出「AI版」米开朗基罗,实现高保真3D重建
专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型
超越所有开源模型,击败 Claude、Bard,专门用于编程任务的大模型来了
什么样的方案,夺得了CVPR自动驾驶挑战赛冠军?
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
一文概述联邦持续学习最新研究进展
一文概述联邦持续学习最新研究进展
一文概述联邦持续学习最新研究进展
理想自研认知大模型、无图城市NOA信息曝光,纯电MEGA定价50万以上
基于扩散模型的音频驱动说话人生成,云从&上交数字人研究入选ICASSP 2023
MemNet、AT-LSTM、IAN、AF-LSTM…你都掌握了吗?一文总结情感分析必备经典模型
MemNet、AT-LSTM、IAN、AF-LSTM…你都掌握了吗?一文总结情感分析必备经典模型
7 Papers & Radios | LeCun世界模型首次尝试;Meta开源文本音乐生成模型
黑芝麻智能CMO杨宇欣:如何面对硬件成本瓶颈?
llama.cpp作者创业,用纯C语言框架降低大模型运行成本
语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务
Percy Liang等人新研究:新必应等生成式搜索引擎可能没那么好用
再夺全球顶级竞赛CVPR NTIRE冠军,打造更好用户体验,淘宝拥有哪些内容技术?
再夺全球顶级竞赛CVPR NTIRE冠军,打造更好用户体验,淘宝拥有哪些内容技术?
孙燕姿回应成真?AI歌手音乐创作软件上线,人类怎么办?
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向
自动驾驶竞逐城市NOA,轻舟智航这篇ICML2023论文为「感知模块评估」指出了新方向
紫东太初全模态大模型来了,一个模型打通感知、认知、决策交互屏障
给图片悄悄加上像素级水印:防止AI「抄袭」艺术作品的方法找到了
清华大学提出LiVT,用视觉Transformer学习长尾数据,解决不平衡标注数据不在话下
一台iPhone搞定大作动捕,Epic神器MetaHuman Animator开放下载了
攻克量子计算不可靠难题,IBM用误差缓解得到有用计算,登Nature封面
LLM+模仿学习,解决真实世界中的复杂任务:AI2提出SwiftSage
专访梅涛:多名科大校友支持创业,年底前做出超越Stable Diffusion的底层视觉模型
OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%
LeCun世界模型首项研究来了:自监督视觉,像人一样学习和推理,已开源
CVPR 2023 | 会模仿笔迹的AI,为你创造专属字体
GPT-4是如何工作的?哈佛教授亲自讲授
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
如何解锁大模型时代AI研究开发新范式 ?尽在2023WAIC AI开发者领袖论坛
四年了,基础开源模型没有真正进步,指令调优大模型评估惊人发现
此「错」并非真的错:从四篇经典论文入手,理解Transformer架构图「错」在何处
Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务
75岁Hinton中国大会最新演讲「通往智能的两种道路」
75岁Hinton中国大会最新演讲「通往智能的两种道路」
Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下
时间、空间可控的视频生成走进现实,阿里大模型新作VideoComposer火了(2)
时间、空间可控的视频生成走进现实,阿里大模型新作VideoComposer火了
谷歌大模型云服务上线,代码生成、PaLM for Chat首次亮相
「拖拽」就能实现精准P图的DragGAN,论文作者亲自揭秘技术了
iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了