使用LSTM深度学习模型进行温度的时间序列单步和多步预测（一）-阿里云开发者社区

使用LSTM深度学习模型进行温度的时间序列单步和多步预测（一）

2022-12-20 950

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

交互式建模 PAI-DSW，5000CU*H 3个月

模型训练 PAI-DLC，5000CU*H 3个月

简介： 使用LSTM深度学习模型进行温度的时间序列单步和多步预测

本文的目的是提供代码示例，并解释使用python和TensorFlow建模时间序列数据的思路。

本文展示了如何进行多步预测并在模型中使用多个特征。

本文的简单版本是，使用过去48小时的数据和对未来1小时的预测(一步)，我获得了温度误差的平均绝对误差0.48(中值0.34)度。

利用过去168小时的数据并提前24小时进行预测，平均绝对误差为摄氏温度1.69度(中值1.27)。

所使用的特征是过去每小时的温度数据、每日及每年的循环信号、气压及风速。

使用来自https://openweathermap.org/的API获取数据。这些数据从1990年1月1日到2020.11月30日每小时在维尔纽斯电视塔附近收集一次。维尔纽斯不是一个大城市，电视塔就在城市里，所以电视塔附近的温度应该和城市所有地方的温度非常相似。

这里和整篇文章的主数据对象被称为d。它是通过读取原始数据创建的:

d=pd.read_csv(‘data/weather.csv’)
#Convertingthedtcolumntodatetimeobjectd[‘dt’] = [datetime.datetime.utcfromtimestamp(x) forxind[‘dt’]]
#Sortingbythedated.sort_values(‘dt’, inplace=True)

数据集中共有271008个数据点。

数据似乎是具有明确的周期模式。

上面的图表显示，气温有一个清晰的昼夜循环——中间温度在中午左右最高，在午夜左右最低。

这种循环模式在按月份分组的温度上更为明显——最热的月份是6月到8月，最冷的月份是12月到2月。

数据现在的问题是，我们只有date列。如果将其转换为数值(例如，提取时间戳(以秒为单位))并将其作为建模时的特性添加，那么循环特性将丢失。因此，我们需要做的第一件事就是设计一些能够抓住周期性趋势的特性。

我们想让机器知道，23点和0点比小时0点和4点更接近。我们知道周期是24小时。我们可以用cos(x)和sin(x)函数。函数中的x是一天中的一个小时。

#Extractingthehourofdayd["hour"] = [x.hourforxind["dt"]]
#Creatingthecyclicaldailyfeatured["day_cos"] = [np.cos(x* (2*np.pi/24)) forxind["hour"]]
d["day_sin"] = [np.sin(x* (2*np.pi/24)) forxind["hour"]]

得到的dataframe如下:

新创建的特征捕捉了周期性模式。可能会出现一个问题，为什么我们同时使用sin和cos函数？

在上图中绘制一条水平线并仅分析其中一条曲线，我们将得到例如cos（7.5h）= cos（17.5h）等。在学习和预测时，这可能会导致一些错误，因此为了使每个点都唯一，我们添加了另一个循环函数。同时使用这两个功能，可以将所有时间区分开。

为了在一年中的某个时间创建相同的循环逻辑，我们将使用时间戳功能。python中的时间戳是一个值，用于计算自1970.01.01 0H：0m：0s以来经过了多少秒。python中的每个date对象都具有timestamp（）函数。

#Extractingthetimestampfromthedatetimeobjectd["timestamp"] = [x.timestamp() forxind["dt"]]
#Secondsindays=24*60*60#Secondsinyearyear= (365.25) *sd["month_cos"] = [np.cos((x) * (2*np.pi/year)) forxind["timestamp"]]
d["month_sin"] = [np.sin((x) * (2*np.pi/year)) forxind["timestamp"]]