暂无个人介绍
思维链如何释放语言模型的隐藏能力?最新理论研究揭示其背后奥秘
13层网络如何拿下83%精度?极简神经网络架构VanillaNet作者亲自解读
思考、思考、思考不停歇,思维树ToT「军训」LLM
CIO战略:IT如何创造卓越的客户体验
灾难恢复和备份在网络安全战略中的重要性
数字化转型成功需要考虑的3个步骤
D1net阅闻 | 英特尔推出AI大模型Aurora genAI,参数量是GPT-3的近6倍
如何在网络攻击发生前保护关键基础设施
为什么云原生架构对数字化转型至关重要
成为数据驱动型公司的六大障碍
D1net阅闻:北京:实施大模型底层支撑性技术筑基工程 以Chiplet技术进步弥补先进工艺技术代差
关于生成式人工智能,每个CEO都应该知道的事情
D1net阅闻 | 四大运营商宣布:我国启动全球首个5G异网漫游试商用
一口气学完《三体 I》,拍张照就能让AI开发应用,这是钉钉「/」的首份开箱评测
一口气学完《三体 I》,拍张照就能让AI开发应用,这是钉钉「/」的首份开箱评测
用GPT-4实现可控文本图像生成,UC伯克利&微软提出新框架Control-GPT
世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能
世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能
世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能
世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能
开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT
GPT-4等大模型迎来进化转折点:不只是使用,还会自己制作工具了
LLM推理提速2.8倍,CMU清华姚班校友提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理
Arm新一代架构发布:CPU能效提升40%,GPU性能提升15%
训练时间减少71.4%,存储成本节省99.9%,厦大指令调优新方案MMA让羊驼模型实现多模态
格灵深瞳官宣「深瞳阿瞳目」,开创智慧体育新范式
SIGIR 2023 | 推荐系统何去何从,经典ID范式要被颠覆?
SIGIR 2023 | 推荐系统何去何从,经典ID范式要被颠覆?
ICML 2023 | 基于模块化思想,阿里达摩院提出多模态基础模型mPLUG-2
无需任何3D数据,直接文本生成高质量3D内容,清华朱军团队带来重大进展
Huggingface榜首开源模型惹争议:魔改Apache协议,达到一定门槛要收钱
MDNet、SiamFC、ADNet、CFNet、LSTM(RNN)…你都掌握了吗?一文总结目标追踪必备经典模型(一)
MDNet、SiamFC、ADNet、CFNet、LSTM(RNN)…你都掌握了吗?一文总结目标追踪必备经典模型
ChatGPT能写长篇小说了,ETH提出RecurrentGPT实现交互式超长文本生成
7 Papers & Radios | 英伟达把GPT-4塞进我的世界;比Adam快2倍的大模型预训练优化器
英伟达把GPT-4塞进我的世界,打游戏快15倍:AI大佬沉默了
13层网络拿下83%精度,华为诺亚新型神经网络架构VanillaNet「简约」到极致
调教LLaMA类模型没那么难,LoRA将模型微调缩减到几小时
中山大学团队使用端到端图生成架构进行分子图编辑的逆合成预测
听说 DevOps 死了
面对复杂问题时,系统思考助你理解问题本质
十五天内,阿里云用三颗子弹击穿To B围城
大型系统如何划分边界?
一次10万token!GPT4最强对手史诗升级,百页资料一分钟总结完毕
SQL开源替代品,诞生了!
高中教师养出40亿美元超级独角兽,发布ChatGPT最大平替
互联网积分任务体系架构演进
业务系统故障率居高不下:有哪些非常有效的治理大招?
马腾宇团队新出大模型预训练优化器,比Adam快2倍,成本减半
24小时内、200美元复制RLHF过程,斯坦福开源「羊驼农场」模拟器