DataV Note:让Jupyter Notebook绽放新活力

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 分享阿里云旗下的一款基于Jupyter底座的工具(DataV Note,智能分析文档)给大家。这是一款以Notebook文档形式为基础、由强大AI模型驱动的智能分析、允许多人协作的数据可视分析平台。

一、导读

Jupyter Notebook的官网定义:是一个基于网络的交互式计算平台。该笔记本结合了实时代码方程式叙述性文本可视化交互式仪表板其他媒体。换句话来说,假如你有数据加工数据分析模型训练绘图写作的需求,那Jupyter Notebook绝对是你不二的选择。

image.png

二、背景:

众所周知,虽然Jupyter的生态相当的丰富,但Jupyter Notebook的安装、上手成本是较高,而且由于Jupyter Notebook的原生设计限制,导致使用不便。我花了一些时间收集社区上对Jupyter的使用意见,总结分以下几点:

  • 安装成本高:依赖操作系统;依赖Python环境
  • 上手成本高:过程由纯代码实现;没有AI辅助
  • 浏览数据困难
  • 对于DB、Excel、JSON的数据来说,没办法方便地查看数据,只能用Py代码查询出来看
  • 如下图所示,由于Jupyter Notebook采用了数据探索性分析(Exploratory Data Analysis,简称EDA),上一个单元格的输出作为下一个单元格的输入。但原生的Jupyter Notebook没有把所有变量管理起来,而且没办法看到kernel内变量的具体值,每次分析都变得无法追溯。

image.png

  • 交互性弱:通常在Jupyter Notebook中都是使用matplotlib来绘图,但绘图的美观性和交互性都不如人意。

image.png

  • IDE的功能弱:无法选中运行;代码提示弱

三、分享

分享阿里云旗下的一款基于Jupyter底座的工具(DataV Note,智能分析文档)给大家。这是一款以Notebook文档形式为基础、由强大AI模型驱动的智能分析、允许多人协作的数据可视分析平台。

image.png

这款工具不仅能完美地解决以上的问题,并且在可视化领域和大模型辅助的领域有出人意料的效果,这就给大家介绍一下:

(1)无安装成本

不需要安装,直接云上使用,默认帮你配置初始化Jupyter依赖的所有环境,并且内核配备了常用的Py库进去,假如你需要安装自己需要的库,简单执行以下命令即可:

image.png

完全适配原生ipynb文件格式导入

image.png

(2)上手成本低:AI全面加持
  • NLP2SQL(自然语言生成SQL):业务人员可一键生成SQL并进行取数、聚合

nl2sql.gif

  • NLP2Python(自然语言生成Python):相比于SQL,Python代码具有更高的灵活性,通过 Python 代码可以生成算法预测和归因分析模块

nl2py.gif

  • AI智能绘图:系统将自动识别表中每个字段的数据类型,并根据抽样数据的特征智能推荐最适合的数据可视化图表

ai_draw.gif

(3)管理数据源:中间变量、文件、数据库;并轻松浏览数据

image.png

(4)图表交互高
  • 丰富的图表类型
  • 拖拽实现绘图
  • 强大的信息标注功能
  • 丰富的主题样式设置功能

image.png

(5)IDE的功能增强
  • 可选择运行
  • 提示增强
  • 代码可折叠

image.png

四、点睛之笔

惊喜的是,DataV Note是分为两种形态:编辑态预览态。编辑态为上述分析的过程;在预览态中,提供了丰富的定制化功能,包括主题选择布局调整样式优化水印添加等,确保展示材料既专业又美观。与此同时,还支持导出为PngPdfWord格式,并可通过钉钉微信邮件轻松分享,满足多样化的汇报需求。

image.png

image.png

五、总结:

从本地传统Jupyter Notebook的工具,到全新Jupyter Notebook云时代,跨部门在同一个Notebook画布中协同创作,边写代码边绘图的感觉非常爽,而且做好的文档还能数字化下来月度、年度复用;同时,DataV Note提供了很多AI小功能十分惊喜,例如:根据数据AI绘图自然语言生成SQL、Python等等;此外,价格感人,有任何问题直接放到钉钉群答疑,服务到位,绝对是Jupyter用户不错的选择。

相关实践学习
DataV Board用户界面概览
本实验带领用户熟悉DataV Board这款可视化产品的用户界面
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
相关文章
|
8月前
|
数据采集 数据可视化 数据挖掘
交互式数据分析:使用Jupyter Notebooks和IPython提高生产力
【4月更文挑战第12天】Jupyter Notebooks和IPython是交互式数据分析的强大工具,提供了一个集成环境,支持多种编程语言,提升效率并减少错误。它们具有交互式编程、丰富库支持、可扩展性和协作功能。基本流程包括数据导入(如使用Pandas从CSV加载)、预处理、分析(利用Pandas、NumPy、Matplotlib等)、模型选择与训练(如Scikit-learn的RandomForestClassifier)以及模型评估和优化。
201 2
|
7月前
|
数据采集 机器学习/深度学习 数据可视化
使用Jupyter Notebook进行数据分析:入门与实践
【6月更文挑战第5天】Jupyter Notebook是数据科学家青睐的交互式计算环境,用于创建包含代码、方程、可视化和文本的文档。本文介绍了其基本用法和安装配置,通过一个数据分析案例展示了如何使用Notebook进行数据加载、清洗、预处理、探索、可视化以及建模。Notebook支持多种语言,提供直观的交互体验,便于结果呈现和分享。它是高效数据分析的得力工具,初学者可通过本文案例开始探索。
|
5月前
|
数据可视化 JavaScript 定位技术
这款地图可视化神器终于支持新版jupyter lab了!
这款地图可视化神器终于支持新版jupyter lab了!
81 2
|
5月前
|
机器学习/深度学习 数据可视化 数据挖掘
Jupyter Notebook: 数据科学的最佳实践
【8月更文第29天】Jupyter Notebook 是一个交互式的计算环境,非常适合进行数据分析、可视化和机器学习任务。它不仅支持多种编程语言(如 Python、R 和 Julia),还能将文本、代码、图表和多媒体元素融合在一起,非常适合编写可重复使用的分析报告。
370 1
|
7月前
|
文字识别 异构计算 Python
关于云端Jupyter Notebook的使用过程与感想
在自学Python时,由于家庭电脑使用冲突和设备老旧,转向云端平台。体验了多个服务:1. 魔搭modelscope(最喜欢,赠送资源丰富,社区活跃),2. Colaboratory(免费GPU,但有时重启,建议用阿里云),3. Deepnote(免费环境有限,但GPT-4代码生成功能强大),4. 飞桨aistudio(适合PaddlePaddle用户),5. ModelArts(曾有免费实例,现难找)。综合来看,阿里云的稳定性与服务更优,尤其是魔搭的自动代码修正功能。对于AIGC,推荐魔搭和付费版PAI-DSW。欢迎分享更多云端Jupyter平台体验。
399 1
|
8月前
|
数据可视化 安全 数据挖掘
技术小白如何轻松安装Jupyter Notebook
技术小白如何轻松安装Jupyter Notebook
325 0
|
8月前
|
存储 数据可视化 Shell
18 个 Jupyter Notebook 小技巧,帮助你快速腾飞
18 个 Jupyter Notebook 小技巧,帮助你快速腾飞
111 0
|
机器学习/深度学习 数据可视化 Python
【机器学习2】什么是Jupyter notebook & 新手使用Jupter notebook
【机器学习2】什么是Jupyter notebook & 新手使用Jupter notebook
389 0
|
JSON 数据格式 Python
墙裂推荐!几个Jupyter Notebook 超实用插件(一)
墙裂推荐!几个Jupyter Notebook 超实用插件(一)