一、Yarn相关配置:
1、yarn-site配置文件:开启日志聚合参数 yarn.log-aggregation-enable 设置为true;
2、yarn-site配置文件:在删除聚合日志之前保留聚合日志的时间参数 yarn.log-aggregation.retain-seconds 单位为毫秒;
3、yarn-site配置文件:yarn日志聚合保留检查间隔yarn.log-aggregation.retain-check-interval-seconds 参数 单位为毫秒;
二、Spark相关配置:
1、spark-defaults.conf配置文件:spark历史保留作业数目 spark.history.retainedApplications 参数;
2、spark-defaults.conf配置文件:指定历史记录服务器是否应定期从存储中清除事件日志 spark.history.fs.cleaner.enabled 参数,设置为true;
3、spark-defaults.conf配置文件:spark日志清理时间间隔 spark.history.fs.cleaner.interval 参数,参考值:1d;
4、spark-defaults.conf配置文件:spark日志清理最大日期天数 spark.history.fs.cleaner.maxAge 参数,参考值:3d;