文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks的hive writer parquent存储bigint类型

已解决

DataWorks的hive writer parquent存储bigint类型

2021-12-23 12:30:35.356 630912445-0-0-writer ERROR StdoutPluginCollector - 脏数据: {"exception":"error starting field servertimestamp at 10","message":"error starting field servertimestamp at 10","record":{"byteSize":8,"index":0,"rawData":1640058849855,"type":"LONG"},。。。com.alibaba.datax.common.exception.DataXException: Code:HdfsWriter-04, Description:您配置的文件在写入时出现IO异常.. - java.lang.ClassCastException: parquet.io.PrimitiveColumnIO cannot be cast to parquet.io.GroupColumnIO

展开

收起

阿里云服务支持 2022-12-09 15:11:46 593 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

阿里云服务支持

推荐回答

官方回答

hive writer parquent存储bigint类型需要parameter里增加参数 "dataxParquetMode": "fields"

加该参数原因：这个是写parquet的实现有不同，不加这个参数是个老模式，那个模式处理null的情况会有些限制，源端bigint字段有null就会报错。

2022-12-09 15:18:29

赞同展开评论

问答分类：

SQL 存储 DataWorks HIVE 大数据开发治理平台 DataWorks 数据集成 Data Integration

问答标签：

Hive存储大数据开发治理平台 DataWorks类型 dataworks Hive 大数据开发治理平台 DataWorks hive 大数据开发治理平台 DataWorks存储

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks完全不同的两种类型做比较，结果竟然相等（python）？

203

1

0

dataworks中的sql是基于hive sql吗？

286

3

0

StarRocksOnHive和TrinoOn Hive查询的是哪一份数据，数据是如何存储和压缩的？

148

1

0

DataWorks不是一个账户的hive数据可以同步到odps吗？

137

1

0

DataWorks可以把timestamp转成date吐给lindorm writer阿妈？

132

0

0

DataWorks中string类型怎么转化成日期格式 yyyy-MM-dd？

219

1

0

DataWorks这个是类型不匹配吗？

122

0

0

云原生大数据计算服务 MaxCompute数据上云方面，DataWorks数据集成是怎样的？

1290

1

0

使用三个odps sql节点，同时向同一张表的同一个分区写入数据，有时报错，有时不会报错，是什么原因

3632

1

0

Dataworks的数据地图可以查看CDH集群 hive的表以及血缘信息嘛

1983

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

阿里云支持与服务

2305

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

相关文章

2026年阿里云服务器租用价格表明细及优惠政策、OpenClaw部署与成本优化指南

考虑需求响应的电-热综合能源系统两阶段日前日内多时间尺度优化调度策略研究（Matlab代码实现）

含光热电站、有机有机朗肯循环、P2G的综合能源优化调度（Matlab代码实现）

风力涡轮机系统与压缩空气储能联合运行的建模与实验研究（Matlab代码实现）

【无标题】

相关解决方案

更多

SelectDB实现日志高效存储与实时分析

高效存储和处理多媒体数据

高可用及共享存储 Web 服务

轻松实现客服数据智能分析与高效存储

视频网站的存储与媒体处理方案

热门讨论

热门文章

DataWorks表管理创建表报precision and scale is not current

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

DataWorks报Dirty data 是什么原因？

DataWorks概述API网关是什么？

数据服务报429请求次数过多咋办呀

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

求大佬解答一下，我现在有个flink cdc任务该怎么处理呢？

DataWorks中78xxxxx_out的输出是什么?

如何使用DataWorks数据集成从MySQL导入数据到GDB配置同步任务脚本？

数据服务是否必须开通API网关？数据服务是否必须开通API网关？

展开全部

云上一指禅：大数据产品DataWorks每日问答

欢迎加入飞天大数据平台交流群

DataWorks操作报错合集之资源组切换后仍然报错，并且提示了新的IP地址172.25.0.67，该如何排查

DataWorks产品使用合集之DataWorks一键maxcompute数据同步的操作步骤是什么

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks操作报错合集之调用CreateQualityRule API时，BlockType参数为0，会报错："blockType less than minimum"，该怎么办

大数据公共数据集上线，免费试用TB级数据分析

DataWorks常见问题之一样IP的分库只有部分网络连通如何解决

长文详解｜DataWorks Data+AI一体化开发实战图谱

展开全部

还有其他疑问?