文档备案控制台

开发者社区问答正文

Spark scala让类找不到scala.Any

val schema = df.schema
val x = df.flatMap(r =>
(0 until schema.length).map { idx =>

((idx, r.get(idx)), 1l)

}
)
这会产生错误

java.lang.ClassNotFoundException: scala.Any

展开

收起

社区小助手 2018-12-21 13:13:25 8233 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区小助手

社区小助手是spark中国社区的管理员，我会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关spark的问题及回答。

一种方法是将所有列强制转换为String。请注意，我正在将代码中的r.get（idx）更改为r.getString（idx）。以下工作。

scala> val df = Seq(("ServiceCent4","AP-1-IOO-PPP","241.206.155.172","06-12-18:17:42:34",162,53,1544098354885L)).toDF("COL1","COL2","COL3","EventTime","COL4","COL5","COL6")
df: org.apache.spark.sql.DataFrame = [COL1: string, COL2: string ... 5 more fields]

scala> df.show(1,false)

COL1 COL2 COL3 EventTime COL4 COL5 COL6

ServiceCent4 AP-1-IOO-PPP 241.206.155.172 06-12-18:17:42:34 162 53 1544098354885

only showing top 1 row

scala> df.printSchema
root
|-- COL1: string (nullable = true)
|-- COL2: string (nullable = true)
|-- COL3: string (nullable = true)
|-- EventTime: string (nullable = true)
|-- COL4: integer (nullable = false)
|-- COL5: integer (nullable = false)
|-- COL6: long (nullable = false)

scala> val schema = df.schema
schema: org.apache.spark.sql.types.StructType = StructType(StructField(COL1,StringType,true), StructField(COL2,StringType,true), StructField(COL3,StringType,true), StructField(EventTime,StringType,true), StructField(COL4,IntegerType,false), StructField(COL5,IntegerType,false), StructField(COL6,LongType,false))

scala> val df2 = df.columns.foldLeft(df){ (acc,r) => acc.withColumn(r,col(r).cast("string")) }
df2: org.apache.spark.sql.DataFrame = [COL1: string, COL2: string ... 5 more fields]

scala> df2.printSchema
root
|-- COL1: string (nullable = true)
|-- COL2: string (nullable = true)
|-- COL3: string (nullable = true)
|-- EventTime: string (nullable = true)
|-- COL4: string (nullable = false)
|-- COL5: string (nullable = false)
|-- COL6: string (nullable = false)

scala> val x = df2.flatMap(r => (0 until schema.length).map { idx => ((idx, r.getString(idx)), 1l) } )
x: org.apache.spark.sql.Dataset[((Int, String), Long)] = [_1: struct<_1: int, _2: string>, _2: bigint]

scala> x.show(5,false)

_1 _2

[0,ServiceCent4] 1

[1,AP-1-IOO-PPP] 1

[2,241.206.155.172] 1

[3,06-12-18:17:42:34] 1

[4,162] 1

only showing top 5 rows

scala>

2019-07-17 23:23:22

赞同展开评论

问答分类：

分布式计算 Scala Spark

问答标签：

Scala类 apache spark Scala Scala Spark apache spark类 spark Scala类

问答地址：

开发者社区 > 大数据 > 问答

相关问答

DataWorks请问这个该从什么方向去排查，我在EMR侧没有找到Spark相关的监控之类的？

146

4

0

MaxCompute Spark是否支持交互式和流计算类需求

147

1

0

spark.aliyun.odps.datasource 有没有基于scala 2.12构建的版本？

258

4

0

用Scala写Spark这种工具比用Java写有什么优点啊？

883

1

0

Scala是一种什么类的语言啊？

553

1

0

Spark当中有哪些聚合类的算子,我们应该尽量避免什么类型的算子呢？

805

1

0

scala中的伴生类和伴生对象是什么？

612

1

0

使用Spark读写OSS文件示例代码（以Scala为例）是什么？

1297

1

0

spark算子可以分为多少类？

640

1

0

spark2.0弃用akka怎么理解呢，scala不是使用了akka吗

503

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

如何在阿里云服务器上部署网站？2026年阿里云服务器怎么选？

部署OpenClaw多少钱？2026年阿里云 OpenClaw（Clawdbot）怎么部署及收费标准

阿里云百炼Coding Plan是什么意思？

有传言通义灵码不再增加新功能了，是这样吗？

OpenClaw（原Clawdbot）阿里云一键部署后，2026年有哪些应用场景可用到？

相关文章

基于三机九节点系统的模块化潮流计算程序设计（MATLAB实现）

诗悦游戏基于DLF与EMR StarRocks降本38%

数仓-湖仓-湖流，人力家基于阿里云OpenLake架构演进与思考

全球生成式AI “领导者” ——阿里云，中国AI云市场份额超过2-4名总和

碾压级优势！阿里云AI云市场份额超过2-4名总和，2026新晋AI时代”领导者“

还有其他疑问?