专访 MindSpore 黄之鹏:社区治理与商业创新的开源双重奏

简介: 专访 MindSpore 黄之鹏:社区治理与商业创新的开源双重奏

吐槽大会你一定听说过,但你参加过 AI 开源吐槽大会吗?

一年多前,MindSpore 正式开源,自此之后,各类别出心裁的运营活动 —— 吐槽大会、Women In Tech 层出不穷……

开发者们不再为 AI 应用开发门槛太高而踌躇,不再被枯燥无味的文档拒之门外,MindSpore 依靠其在深度学习框架领域的积累和形式多样的开发者活动,聚集了一批中国 AI 新生代力量。

今年的 OSCAR 开源产业大会,也设置了开源社区治理与运营分论坛,在会前我们特别采访了在这一领域极具特点的开源项目代表 ——华为昇腾开源生态总监, MindSpore 开源社区运营负责人,黄之鹏。

深度学习框架正在进入全场景 AI 计算框架新时代

思否什么是 MindSpore?

黄之鹏:MindSpore 是华为开源的一款全场景 AI 计算框架,旨在提供友好设计、高效运行、简捷部署的开发体验,目前应用于医疗、金融、科研等多个领域,提供面向端边云多种场景的主流硬件支持,并针对昇腾硬件平台提供深度优化能力。

思否谈竞争 — 热门的 AI 领域,MindSpore 竞争力何在?

黄之鹏:我们认为应该用发展的眼光看问题,深度学习框架的发展经历了浅层框架时代和通用框架时代,Caffe、Theano 以及 Tensorflow、PyTorch 分别是前后两个时代的典型代表。深度学习框架目前正在进入以 MindSpore 为代表的全场景 AI 计算框架的新时代

MindSpore 社区将通过开源协作,以社区的力量共同努力解决这个新时代的许多新问题,相信也会有大量的业界专家与新一代开发者会深入地参与到这个伟大的变革之中,成为 MindSpore 生态的主力军。

MindSpore 自身提供的极佳的 AI+科学计算能力,包括自动微分能力、能够支撑千亿稠密模型的自动并行能力、高阶优化能力、图算融合能力、全场景协同能力、AI 可信能力等等。

目前开源仅一年多时间,MindSpore 下载量已接近 60 万,2600+ 社区贡献者,服务企业数量超过 5000 家,高校授课、众智、科研合作超过 100 家,ModelZoo 中已有 170+主流网络模型实现。

Community>Code:完整运营方法论、立足中国的国际化社区

思否作为国内第一个采用开放社区治理的深度学习开源框架,目前社区治理框架是否已经完善?取得了哪些成绩?

黄之鹏:开源社区的治理框架同代码一样,也是处于持续的演进之中。

MindSpore 社区目前对社区治理的理解由三个部分组成:开放性、可信性、多样性

开放性:MindSpore 目前拥有来自欧洲、亚洲、美洲的14 名技术专家的技术治理委员会(TSC),由开发者组织的兴趣小组(SIG)工作组(WG)。社区所有组织的会议都要求公开、透明,会前有预告会后有录屏,这保证了开发者对 MindSpore 社区的开放性的信任,反过来也推动了 MindSpore 社区的快速成长。

可信性:MindSpore 社区积极参与 OSCAR 社区及信通院牵头组织的开源可信工作,分享了社区开发者体验 SIG 的大量优秀实践,成为全国首批获得可信开源社区评估证书中的唯一一个 AI 开源项目,并成为可信开源社区的发起成员之一。

多样性:我们在国内和海外,通过组织面向本地开发者、高校师生、上下游企业的社群MindSpore Study Group, 将来自不同文化、习俗、族群、专业、行业的 AI 爱好者,都纳入到社区大家庭中。比如最具特色的 MSG·Women In Tech 活动,在北京上海深圳等地都组织了当地女性开发者社区,更好的推动社区对多样性的支持,弘扬包容的社区文化。

思否看到 MindSpore 举办的线上线下活动皆受到了广泛关注,吐槽大会等创新形式一片好评,有哪些方法论可以和我们分享?

黄之鹏:非常感谢对社区运营工作的认可!我们的社区运营工作有一整套的方法论和制度保证。

在形而上的层面,提出价值框架理论,以价值主义和框架主义的观点,统领我们的具体工作

在具体实施层面,社区运营工作分为四大层面:运营平台、社区治理、开源合作以及基础设施

  • 其中运营平台作为重中之重,以模型的思维和产品迭代的思路,打造集品牌营销、内容制作与传播、社群活动、技术培训等服务能力的平台化产品;
  • 社区治理则通过引入开放治理架构、打造可信开源社区、弘扬性多样性包容文化,来推动开放协作创新;
  • 开源合作侧重于面向业界现有主流开源社区及基金会的广泛合作,比如与 CNCF 基金会的 Kubeflow 和 Volcano 项目这样的技术合作,也有和开放原子基金会合作的开源运营手册这样把社区运营都开源出来的运营合作;
  • 基础设施包括大量的 CI 机器人、开发者体验机器人、同步机器人、CI 集群、数据化运营面板的构造。
  • yy.png
  • 思否:MindSpore 在国际接轨上如何考虑?在国际化市场中有怎样的战略和策略?

黄之鹏:MindSpore 从初始就秉承打造立足中国的全球化开源社区的理念,与全世界的深度学习开发者一起构筑生态。我们选择国内的代码托管平台作为主仓正是立足中国的体现,但同时也通过打造实时同步机器人等社区工程化手段,在 GitHub 维护可以进行开发和接受贡献的镜像仓库,方便世界其他地方的开发者参与社区。

开源社区内生就是国际化的开发者共享、共建、共治的生态圈,因此不存在特定的国际化战略和国内、国外市场不同策略的概念。但是社区非常重视各个地区在文化上、制度上等方面的特异性,因此社区通过发起面向本地开发者的 MindSpore Study Group 社群,尽可能通过去中心化的自组织行为,繁荣所在地的开发者生态,并合规的开展社区活动。我们也通过与 Eclipse 基金会、Linux 基金会等全球性重量级基金会的合作,在 AICE Lab、LFAI、Confidential Computing Consortium 等领域扩展全球开发者生态。

思否:未来一年 MindSpore 在技术和社区上有什么发展规划和目标?

黄之鹏:在技术整体层面上,MindSpore 仍然会持续推动全场景 AI 计算框架这个新时代的发展,具体的技术方向上,则会由社区的各个组织,按照 3 个月的版本周期,来依据规章决策和推动。

MindSpore 开源社区将持续尝试更多有益的尝试,在世界上更多的地方发展我们的开发者生态,并加大制度创新的推动,力争成为最为专业和体系化运作管理的开源社区。

开源助力商业成功,商业生态是开源大生态的价值组成

思否:如何看待开源与商业化之间的矛盾与联系?MindSpore 在商业化上目前进展如何?

黄之鹏:开源与商业并不存在矛盾,在微观的层面上,开源运营是助力商业成功的一个有效手段,而在更宏观的层面上,商业生态则是开源大生态的一个不可或缺价值组成部分

MindSpore 目前在最主要的国计民生行业都有很多的解决方案,一些实际案例比如携手宝德打造的 AI 质检一体机方案,与立得空间在高精度地图生产软件方面的合作等等。

相关文章
|
3月前
|
存储 监控 安全
RFID电动车车牌让出行更安全
RFID电动车车牌通过内置芯片实现车辆身份唯一识别,结合物联网技术,提升防盗、交通秩序、事故处理等多方面的出行安全,助力城市电动车智能化管理,守护市民安全出行。
|
8月前
|
SQL 人工智能 安全
MCP 的 AI 好搭档
本文介绍了MCP(模型上下文协议)及其在AI领域的应用前景。MCP由Anthropic公司推出,通过标准化通信协议实现AI与数据源间的安全隔离,解决了传统AI应用中的数据隐私和安全问题。文章探讨了从LLM到MCP的进化过程,并分析了其面临的挑战,如算力不足和开放性需求。Serverless技术被提出作为解决这些问题的方案,提供弹性算力和支持安全沙箱环境。最后,文章提供了如何一键部署热门MCP Server的教程,帮助开发者快速上手并体验该协议的实际应用效果。
787 111
|
7月前
|
机器学习/深度学习 PyTorch 算法框架/工具
高效处理多维数组:einsum()函数从入门到精通
本文深入解析了NumPy中的`einsum()`函数,从基础语法到高级应用全面展开。文章首先介绍了爱因斯坦求和约定的数学基础,解释了`einsum()`如何通过简洁的索引符号实现复杂的多维数组运算。
283 5
高效处理多维数组:einsum()函数从入门到精通
|
数据可视化 Python
Visdom可视化学习笔记(一):通过visdom画曲线和显示图片总结
关于如何使用Visdom进行数据可视化的教程,包括画曲线、显示图片和文本等操作。
441 0
Visdom可视化学习笔记(一):通过visdom画曲线和显示图片总结
|
Kubernetes Ubuntu Docker
从0开始搞K8S:使用Ubuntu进行安装(环境安装)
通过上述步骤,你已经在Ubuntu上成功搭建了一个基本的Kubernetes单节点集群。这只是开始,Kubernetes的世界广阔且深邃,接下来你可以尝试部署应用、了解Kubernetes的高级概念如Services、Deployments、Ingress等,以及探索如何利用Helm等工具进行应用管理,逐步提升你的Kubernetes技能树。记住,实践是最好的老师,不断实验与学习,你将逐渐掌握这一强大的容器编排技术。
2254 1
|
机器学习/深度学习 人工智能 算法
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
【5月更文挑战第23天】Meta和哈佛的研究发现Flash Attention,一种用于加速Transformer模型的优化技术,可能导致数值偏差,影响模型权重稳定性。实验显示Flash Attention在BF16精度下的偏差是基线的10倍,权重偏差是低精度训练的2-5倍。虽然能提升效率,但其引入的不稳定性对训练过程构成挑战。该研究提出新方法评估数值偏差对训练稳定性的影响,为未来优化技术的研究提供了方向。[论文链接:https://arxiv.org/pdf/2405.02803]
350 2
|
运维 安全 Linux
Softether详解(一)——V*N与softether概述
Softether详解(一)——V*N与softether概述
944 3
|
缓存 监控 架构师
Linux 性能分析工具汇总
Linux 性能分析工具汇总
411 0
|
Android开发
【系统问题】WiFi联网,日期时间不同步
【系统问题】WiFi联网,日期时间不同步
924 0
【系统问题】WiFi联网,日期时间不同步
|
缓存 监控 网络协议
mPaas-MGS全链路压测
随着越来越多的金融行业基于mPaas搭建并上线新的App,App整体架构的负载能力,各个环节的优化逐步成为各个客户关注的重点。   压力测试是实现以上功能的主要方案,一般可以基于压力测试,测试后端业务的负荷瓶颈,评估整体架构性能,业务稳定峰值,排查出各节点的薄弱关系,优化系统资源,避免短板效应,也可以为运营提供准确的用户承载量作为作证,避免活动/新应用的上线带来的突发流量造成的用户体验不佳。
680 0
mPaas-MGS全链路压测