是的,机器学习PAI的source支持JDBC。您可以使用JDBC连接器来连接支持JDBC的数据库,如MySQL、Oracle等,并将其作为数据源用于机器学习任务。
机器学习平台PAI(Platform of Artificial Intelligence)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
目前PAI Studio并不支持直接接入第三方数据源。官方推荐的方式是使用Dataworks的数据集成功能,将数据通过离线同步将数据导入到maxcompute中,然后进行后续操作。本文以Mysql数据库为例,结合GBDT二分类算法组件,演示相关过程的操作流程。
在数据准备阶段,机器学习平台底层支持两种数据源,一种是MaxCompute存储数据,另一种是OSS存储数据。
使用MaxCompute作为存储,建议当数据小于20MB时使用机器学习IDE环境上传,当数据大于20MB时使用命令行工具上传。
具体详见产品文档: https://help.aliyun.com/product/30347.html
付费方式详见:https://www.aliyun.com/price/product
阿里云机器学习平台(PAI)的 source 不直接支持 JDBC 连接。source 是用于指定数据源的关键字,用于指定数据的输入源。PAI 支持多种数据源,包括文件系统(如 OSS、MaxCompute)、表格存储(Tablestore)等,但不直接支持通过 JDBC 连接数据库
【回答】
是的,阿里云机器学习PAI的数据源(source)支持 JDBC。 可以在PAI Studio中使用JDBC数据源,通过配置JDBC连接信息和SQL语句,将数据源中的数据导入到PAI Studio中,以供机器学习任务使用。
具体的操作步骤如下:
1、在PAI Studio中创建一个新的数据集,选择“JDBC数据源”作为数据集类型。
2、配置JDBC连接信息,包括数据库类型、主机名、端口号、数据库名、用户名、密码等。
3、编写SQL语句,从数据源中获取需要的数据。您可以使用标准的SQL语句,也可以使用特定数据库的扩展语法。
4、配置数据集的其他参数,如数据格式、分隔符等。
5、保存数据集配置,等待数据导入完成。
没单独的,现在是分开的,比方说mysql。。一类的。一些方言啥的,单独的jdbc不好用。此回答整理自钉群“Alink开源--用户群”
阿里云机器学习PAI的数据源(source)目前不支持JDBC连接方式。但是,PAI支持多种数据源类型,包括OSS、MaxCompute、RDS等,您可以根据具体业务需求选择合适的数据源类型,进行数据的读写操作。同时,您可以使用阿里云的数据集成服务(DataWorks),将各种数据源中的数据进行整合和清洗,再将处理后的数据存储到所需的数据源中,以满足业务需求。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。