暂无个人介绍
280万条多模态指令-响应对,八种语言通用,首个涵盖视频内容的指令数据集MIMIC-IT来了
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
CNN、GRNN、CLSTM、TD-LSTM/TC-LSTM…你都掌握了吗?一文总结情感分析必备经典模型
CNN、GRNN、CLSTM、TD-LSTM/TC-LSTM…你都掌握了吗?一文总结情感分析必备经典模型
7 Papers | DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU
休斯顿大学Lu Wang组招收全奖博士生/硕士生/实习生
随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
你只管提需求,大模型解决问题:图表处理神器SheetCopilot上线
彻底反转:号称「碾压」LLaMA的Falcon实测得分仅49.08,HuggingFace决定重写排行榜代码
北大团队将色谱领域知识融入机器学习模型,辅助对映体色谱分离
CREATOR制造、使用工具,实现LLM「自我进化」
智源「悟道3.0」大模型系列问世,这次不拼参数,开源开放成为主角
智源「悟道3.0」大模型系列问世,这次不拼参数,开源开放成为主角
Falcon碾压LLaMa?Huggingface排行引争议,有人自发测评,结论却相反
ICLR 2023 Spotlight|节省95%训练开销,清华黄隆波团队提出强化学习专用稀疏训练框架RLx2
全面了解三维重建在建筑领域应用:多种技术思路、落地案例全都有
AI重写排序算法,速度快70%:DeepMind AlphaDev革新计算基础,每天调用万亿次的库更新了
Sam Altman谈OpenAI:面临GPU短缺恐慌,GPT-3或将开源
给语言大模型加上综合视听能力,达摩院开源Video-LLaMA
CVPR 2023 | 三维场景生成:无需任何神经网络训练,从单个样例生成多样结果
扩散模型还能预测地震和犯罪?清华团队最新研究提出时空扩散点过程
中文大语言模型赶考:商汤与上海AI Lab等新发布「书生·浦语」
如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
将330亿参数大模型「塞进」单个消费级GPU,加速15%、性能不减
10行代码媲美RLHF,用社交游戏数据训练社会对齐模型
当LLM遇到Database:阿里达摩院联合HKU推出Text-to-SQL新基准
当LLM遇到Database:阿里达摩院联合HKU推出Text-to-SQL新基准
多模态可控图片生成统一模型来了,模型参数、推理代码全部开源
全奖读博机会:南洋理工大学MMLab@NTU潘新钢老师招收Generative AI方向博士生、博士后和研究助理
陈天奇官宣新APP,让手机原生跑大模型,应用商店直接下载使用
全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题
GPT-4 API平替?性能媲美同时成本降低98%,斯坦福提出FrugalGPT,研究却惹争议
无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步
NLP还能做什么?北航、ETH、港科大、中科院等多机构联合发布百页论文,系统阐述后ChatGPT技术链
NLP还能做什么?北航、ETH、港科大、中科院等多机构联合发布百页论文,系统阐述后ChatGPT技术链
OpenAI、谷歌双标玩得溜:训练大模型用他人数据,却决不允许自身数据外流
SiamRPN、SiamMask、UpdateNet、SiamAttn…你都掌握了吗?一文总结目标追踪必备经典模型(二)
剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态
7 Papers | GPT-4等大模型自己制作工具;识别ChatGPT造假
RWKV项目原作解读:在Transformer时代重塑RNN
RLHF中的「RL」是必需的吗?有人用二进制交叉熵直接微调LLM,效果更好
NeRF新研究来了:3D场景无痕移除不需要对象,精确到毛发
大幅优化推理过程,字节高性能Transformer推理库获IPDPS 2023最佳论文奖
能听懂语音的ChatGPT来了:10小时录音扔进去,想问什么问什么
三维点云的开放世界理解,分类、检索、字幕和图像生成样样行
识别「ChatGPT造假」,效果超越OpenAI:北大、华为的AI生成检测器来了
2023谷歌研究学者计划名单公布:清华姚班、北大等多位校友在列
Meta抢发新一代混合现实头显Quest 3
OpenAI要为GPT-4解决数学问题了:奖励模型指错,解题水平达到新高度
阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了