问题一:DataWorks数据集成资源对数据同步影响大么?其他没有的,我看了下,目前提交成功的任务id字段也是和上面这个图一致的,应该不是数据类型问题感觉
DataWorks数据集成资源对数据同步影响大么?其他没有的,我看了下,目前提交成功的任务id字段也是和上面这个图一致的,应该不是数据类型问题感觉
输入输出应该都没有关系的,还有比这个长的呢,都可以成功,而且其他地域都可以,这两天发现成都地域有这个任务无法提交的问题,是的,今天早上我修改了个之前正常跑的离线任务,重新提交就还是无法提交,数据源没有改动,之前一直用的这个,而且带参运行都可以的,就是提交提交不了
参考回答:
那使用的是数据集成调试(公共)资源组吗 调试资源组主要是测试使用 且全阿里云租户一起抢占 建议是切换独享资源组, 当前任务如果着急运行的话 只能先把其他占用着调试资源组的离线任务先终止下 释放出资源
这个任务和其他提交能成功的任务 除了有一个字段类型不太相同 其他还有特殊的地方么
比如调度配置 或者其他地方 有没有配置很长的参数等,输入输出名列表是否很长
调度配置部分再看下是只有这个离线任务有问题 其他都没问题对吧 如果新建一个离线任务 按相同的来源和去向表 依旧报错数据源有做啥改动吗 比如某项配置参数比较长
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/505035?spm=5176.8068049.0.0.77566d19PXNmxo
问题二:DataWorks数据集成添加rds,mysql的数据源,怎么配置ssl加密?
DataWorks数据集成添加rds,mysql的数据源,怎么配置ssl加密?
参考回答:
mysql数据源可以配置
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503142?spm=5176.8068049.0.0.77566d19PXNmxo
问题三:这个dataworks版本的数据集成不支持可视化调度,只能用josn脚本来进行调度,但是每次只能对一张表进行导入
问题描述
...
这个dataworks版本的数据集成不支持可视化调度,只能用josn脚本来进行调度,但是每次只能对一张表进行导入
期望结果
...有没有方法能多张表同时进行调度
已尝试的方法
这样做数据对不上
...
参考回答:
用DataWorks的数据集成的同步解决方案功能吧,可以参考一下文档:https://help.aliyun.com/document_detail/302449.htm
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/502221?spm=5176.8068049.0.0.77566d19PXNmxo
问题四:odps开启ip白名单后,dataworks数据集成无法获取表结构,应该添加哪些ip
odps开启ip白名单后,dataworks数据集成无法获取表结构,应该添加哪些ip
参考回答:
1.调度部分 1.1在公共调度资源组上运行shell、pyodps等任务访问外部服务(本地库、阿里云服务器等等),服务器无防火墙且有公网能力 ==》在工作空间配置中添加沙箱白名单。
1.2 在公共调度资源组上运行shell、pyodps等任务访问外部服务(本地库、阿里云服务器等等),服务地址非公网==》不支持 1.3 在独享调度资源组上运行shell、pyodps等任务访问外部服务(本地库、阿里云服务器等等),服务器有防火墙但有公网能力的==》 将独享调度资源组eip加到防火墙名单内。
1.4 在独享调度资源组上运行shell、pyodps等任务访问(阿里云数据库、服务等),服务器是内网地址的==》 独享调度资源组需通过vpn、云企业网(跨域、跨账号适用)等与对应服务器进行vpc绑定。 指导链接:https://developer.aliyun.com/article/766753 1.5 在独享调度资源组上运行shell、pyodps等任务访问线下服务器、数据库等,服务器是内网地址的==》 服务需连上阿里云(可使用云企业网等工具)之后独享调度资源组需要与线下库云企业网的vpc做绑定。 独享调度资源组==》vpc==》云企业网==》线下库
2.数据集成部分,原理同上
数据服务白名单。
如果您需要使用公共资源组数据服务创建api,请在数据库添加数据服务公共资源组白名单。
数据服务公共资源组白名单配置
4.元数据采集名单:
如果您需要进行元数据采集的数据库已开启白名单访问控制,请在数据库白名单列表中,添加需要使用的DataWorks所在地域的IP网段,详情请参考文档:数据地图配置元数据采集白名单
如果您maxcompute项目设置白名单后数据地图界面访问报错ip不在白名单列表中,请参考配置数据地图白名单
5.maxcompute访问外网或VPC网络,请参见:https://help.aliyun.com/document_detail/187866.html?spm=a2c4g.11186623.6.905.786877cbkDYtbT#title-tcw-nuz-kxt
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/501307?spm=5176.8068049.0.0.77566d19PXNmxo
问题五:DataWorks数据集成任务长时间等待为什么?
DataWorks数据集成任务长时间等待为什么?
参考回答:
【数据集成任务执行状态】
SUBMIT: 同步任务已经渲染完成提交状态 WAIT: 等待数据集成运行资源 RUN: 同步任务运行中 SUCCESS: 同步任务运行成功 FAIL: 同步任务运行失败
【长时间wait状态排查】 当前数据集成资源组上执行的任务超过了机器支持的并发上限。请检查正在运行的任务并发数总和是否超过了机器支持的最大并发数。
是否存在任务并发设置是否过大,检查日志(任务配置)中concurrent参数值。 如果单个任务并发设置超过了机器支持的最大并发数,请将这些大并发任务全都停掉,修改任务并发数后再去执行。【查看运行中的数据集成任务】
控制台-资源组列表-使用率点击进去
运维大屏-数据集成-下拉查看“同步任务执行详情”
【注意】
任务并发配置需要结合机器支持的最大并发数,以及需要同时运行的任务数及并发和,来分配单个任务并发数配置。 若重保任务较多,可选择扩容独享数据集成资源组。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/500667?spm=5176.8068049.0.0.77566d19PXNmxo