一、导读
Jupyter Notebook的官网定义:是一个基于网络的交互式计算平台。该笔记本结合了实时代码、方程式、叙述性文本、可视化、交互式仪表板和其他媒体。换句话来说,假如你有数据加工、数据分析、模型训练、绘图、写作的需求,那Jupyter Notebook绝对是你不二的选择。
二、背景:
众所周知,虽然Jupyter的生态相当的丰富,但Jupyter Notebook的安装、上手成本是较高,而且由于Jupyter Notebook的原生设计限制,导致使用不便。我花了一些时间收集社区上对Jupyter的使用意见,总结分以下几点:
- 安装成本高:依赖操作系统;依赖Python环境
- 上手成本高:过程由纯代码实现;没有AI辅助
- 浏览数据困难:
- 对于DB、Excel、JSON的数据来说,没办法方便地查看数据,只能用Py代码查询出来看
- 如下图所示,由于Jupyter Notebook采用了数据探索性分析(Exploratory Data Analysis,简称EDA),上一个单元格的输出作为下一个单元格的输入。但原生的Jupyter Notebook没有把所有变量管理起来,而且没办法看到kernel内变量的具体值,每次分析都变得无法追溯。
- 交互性弱:通常在Jupyter Notebook中都是使用matplotlib来绘图,但绘图的美观性和交互性都不如人意。
- IDE的功能弱:无法选中运行;代码提示弱
三、分享
分享阿里云旗下的一款基于Jupyter底座的工具(DataV Note,智能分析文档)给大家。这是一款以Notebook文档形式为基础、由强大AI模型驱动的智能分析、允许多人协作的数据可视分析平台。
这款工具不仅能完美地解决以上的问题,并且在可视化领域和大模型辅助的领域有出人意料的效果,这就给大家介绍一下:
(1)无安装成本
不需要安装,直接云上使用,默认帮你配置初始化Jupyter依赖的所有环境,并且内核配备了常用的Py库进去,假如你需要安装自己需要的库,简单执行以下命令即可:
完全适配原生ipynb文件格式导入
(2)上手成本低:AI全面加持
- NLP2SQL(自然语言生成SQL):业务人员可一键生成SQL并进行取数、聚合
- NLP2Python(自然语言生成Python):相比于SQL,Python代码具有更高的灵活性,通过 Python 代码可以生成算法预测和归因分析模块
- AI智能绘图:系统将自动识别表中每个字段的数据类型,并根据抽样数据的特征智能推荐最适合的数据可视化图表
(3)管理数据源:中间变量、文件、数据库;并轻松浏览数据
(4)图表交互高
- 丰富的图表类型
- 拖拽实现绘图
- 强大的信息标注功能
- 丰富的主题样式设置功能
(5)IDE的功能增强
- 可选择运行
- 提示增强
- 代码可折叠
四、点睛之笔
惊喜的是,DataV Note是分为两种形态:编辑态、预览态。编辑态为上述分析的过程;在预览态中,提供了丰富的定制化功能,包括主题选择、布局调整、样式优化和水印添加等,确保展示材料既专业又美观。与此同时,还支持导出为Png、Pdf、Word格式,并可通过钉钉、微信或邮件轻松分享,满足多样化的汇报需求。
五、总结:
从本地传统Jupyter Notebook的工具,到全新Jupyter Notebook云时代,跨部门在同一个Notebook画布中协同创作,边写代码边绘图的感觉非常爽,而且做好的文档还能数字化下来月度、年度复用;同时,DataV Note提供了很多AI小功能十分惊喜,例如:根据数据AI绘图、自然语言生成SQL、Python等等;此外,价格感人,有任何问题直接放到钉钉群答疑,服务到位,绝对是Jupyter用户不错的选择。