魔搭城市行 | 南京站 · 「阿里巴巴人工智能大模型&魔搭开源社区交流论坛」成功举办

简介: 2024年1月11日下午,阿里巴巴人工智能大模型及魔搭开源社区交流沙龙 · 南京站在南京软件谷云密城L栋成功举办!


2024年1月11日下午,阿里巴巴人工智能大模型及魔搭开源社区交流沙龙 · 南京站在南京软件谷云密城L栋成功举办!


本次活动由魔搭社区、阿里巴巴通义实验室主办,中国(南京)软件谷科技创新部、南京一八九科创服务有限公司协办,阿里巴巴集团、南京市科学技术局、中国(南京)软件谷管委会作为指导单位。


论坛邀请了来自阿里巴巴大模型领域的算法专家、魔搭社区成员以及南京本地的AI创业公司代表作为分享嘉宾,与现场的70余名开发者展开了深入的讨论,这些参与者来自华为、东软集团、江苏广电、江苏省电子商务协会、南京审计大学、南京航空航天大学等众多企事业单位,涵盖各行业。


这次互动交流不仅为参与者提供了一个学习和分享的平台,也为不同行业的AI开发者和爱好者提供了一个相互启发与合作的机会。



致辞

李嘉平阿里巴巴集团华东有限公司总经理、阿里云智能集团战略发展副总裁



2023年,大模型在全球范围内引发了一场革新人工智能领域的风暴,不仅对上层应用的构建带来了巨大挑战,也对底层模型和框架的开发提出了高要求。软件产业是南京的经济重点之一,去年陈市长参观阿里巴巴南京办公室时,提出希望阿里能够与南京的软件产业携手,在大模型的研究与应用方面展开合作。此次正值魔搭社区积极筹备城市推广之际,基于南京软件产业生态的活力,将南京选定为活动的起始站,通过组织大模型技术干货分享和面对面交流,为更多开发者提供支持。



主题一

阿里巴巴人工智能大模型

通义千问:走向通用人工智能刘天宇  通义千问算法专家 



介绍了通义千问大模型在语言模型、多模态、Agent方面的工作,并着重在模型实现、训练细节、工程优化等技术干货方向展开分享。突出当前通义千问“全尺寸、全模态”的全面拥抱开源的工作,以及阿里云百炼平台提供企业级服务,帮助用户利用通义千问系列模型的推理服务来搭建自己的应用,给大家带来了关于通义千问的全视角认知。



LDM的高清视频生成I2VGen和HiGen视频生成技术解析张士伟  通义实验室多模态视频生成算法专家




介绍了视频生成领域的背景和关键技术的发展时间线,并进一步介绍了通义实验室最新的高清图生视频I2VGen-XL、高清文生视频HiGen两个视频生成模型,以及通义实验室开源的最完备通用视频生成框架VGen(张士伟团队正在进行的工作)。同时也介绍视频生成目前依然还在 鲁棒性、时长、可控性、人体/人像生成效果上存在的挑战,未来VGen也将继续通过开源的方式来和更多开发者共同探讨解决这些挑战的方案。



主题二

ModelScope魔搭社区

魔搭社区整体能力介绍石洪竺  魔搭社区负责人



魔搭社区作为一个开放创新的平台,在推动大模型落地及应用生态建设方面发挥了重要作用。魔搭社区提供各种基础模型和高质量的数据集,支持云上部署和一站式的模型管理,为开发者提供方便的使用体验。


SWIFT:轻量大模型训练推理框架

赵宇泽  魔搭社区框架高级专家



分享了魔搭官方开发的LLM&AIGC训练推理部署一站式开源框架——SWIFT,该框架支持了所有主流LLM的预训练、指令微调、人类对齐训练等多种训练,并提供了对应模型的开源数据集前处理过程和Prompt模板。为方便使用,框架提供了命令行、界面等多种训练推理方式,并可以便捷部署训练后模型,提供VLLM等方式进行部署加速。


ModelScopeAgent:魔搭社区开源Agent框架

周文猛  魔搭社区工程技术负责人



分享了AI Agent目前作为大模型应用最热门的方向之一背后的发展脉络,以及最新的Agent前沿技术,随后重点介绍了ModelScopeAgent的功能和优势。ModelScopeAgent提供了灵活的API注册和开发的能力,可以帮助用户定制业务目标模型。平台支持各种开源和闭源的国产模型,并提供了灵活的功能消耗监测和优化。此外,ModelScopeAgent 还致力于推动中小企业的自主定制和业务创新,提供了丰富的API和开发支持。通过该平台,用户可以轻松地构建复杂的业务应用,并实现最终的业务价值。



主题三

大模型应用开发经验分享

智汇涌现:AIGC应用与探索

刘黄骁烈  江苏汇智智能数字科技有限公司 CTO



汇智智能是隶属于南京汇智互娱集团的一家人工智能创新企业,以“让AI力量成为每个人的天赋”为使命。

汇智智能CTO 刘黄骁烈分享了汇智智能在AIGC领域的探索和发现,首先讨论了AI行业的发展历程和大模型在各个领域的应用场景。他认为AI行业的发展具有持续质量可靠的特点,每一次浪潮都会在AI领域留下一些东西。

随后,提出大模型时代下用户存在“GMONIC困境”(Guide-指导、Notarize-公正、Operate-操作、Measure-衡量、Identify-区分、Catelog-推介),在此困境下,国内大模型服务产业最终需要面向行业用户,需要有落地的产品或服务,解决用户的实际问题,基于此,汇智智能推出了一个AIGC行业社区——智能体平台(https://gnomic.cn), 用以拓展产业边界,让AI力量成为每个人的天赋,助力大模型供应商乘风破浪。


AIGC时代,数字人及智能客服的应用搭建实践

魏佳星  云蝠智能创始人



云蝠智能的核心业务是通过AI外呼、人机协同、可交互数字人、短视频生成等能力为企业提供音频、视频数字员工。

作为阿里校友,云蝠智能创始人魏佳星以创业者的视角带来了大模型时代AI应用开发者的心得分享。魏总讲述了创业初期的思考和选择,以及数字人在各个领域的应用场景,提到智能客服和大模型在业务中的作用和优势,并重点讨论了智能客服和数字人的发展趋势,包括大模型的应用、数字人的重要性、开源方案的选择、数据持续增长的必要性以及未来AI产品的原生引流,同时还提到了成本、效率、安全等问题的挑战和解决方案。



圆桌对话

大模型时代下的技术探索


主持人:魔搭社区生态运营负责人  成晨

嘉宾:

刘天宇  通义千问算法专家

周文猛  魔搭社区工程技术负责人

张士伟  通义实验室多模态视频生成算法专家

赵宇泽  魔搭社区框架高级专家

李雅亮  通义实验室资深算法专家


圆桌环节邀请现场观众一起参与,大家围绕大模型在行业应用中可能遇到的问题,以及如何解决这些问题展开讨论,话题涉及到部署设备、行业数据、模型准确率、算法性能等方面,并提到了多智能体的应用场景和未来发展趋势。



本次沙龙的实况直播收录在“魔搭ModelScope社区”视频号的直播回放中,感兴趣的的小伙伴们可移步观看。

相关文章
|
2月前
|
人工智能 安全 算法
上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。
|
19天前
|
人工智能 JSON 算法
魔搭支持在阿里云人工智能平台PAI上进行模型训练、部署了!
现在,魔搭上的众多模型支持在阿里云人工智能平台PAI-Model Gallery上使用阿里云算力资源进行模型训练和部署啦!
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
56 12
|
2月前
|
机器学习/深度学习 数据采集 人工智能
探索人工智能中的深度学习模型优化策略
探索人工智能中的深度学习模型优化策略
|
6月前
|
机器学习/深度学习 人工智能 数据处理
人工智能平台PAI操作报错合集之任务重启后出现模型拆分报错,该怎么办
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
2月前
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
|
2月前
|
机器学习/深度学习 人工智能 图形学
如何将图形学先验知识融入到人工智能模型中?
如何将图形学先验知识融入到人工智能模型中?
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
134 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
135 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
110 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型