# First, let's import the needed libraries.
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from datetime import datetime


import requests, zipfile, io

url = "https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/monthly/kl/historical/monatswerte_KL_00403_17190101_20211231_hist.zip"

r = requests.get(url)
z = zipfile.ZipFile(io.BytesIO(r.content))
z.extractall("../data")


data_meta = pd.read_csv("../data/Metadaten_Geographie_00403.txt", sep=";")
data_meta


data_meta["Status"] = ["not active", "active"]


import folium

# Create a map, centered on Berlin
m = folium.Map(location=[52.45, 13.3], zoom_start=13)

# Add marker FU in Berlin - Dahlem
folium.Marker(
    location=[
        data_meta["Geogr.Breite"][0],
        data_meta["Geogr.Laenge"][0],
    ],  # coordinates for the marker
    popup=data_meta["Status"][0],  # pop-up label for the marker
).add_to(m)

folium.Marker(
    location=[
        data_meta["Geogr.Breite"][1],
        data_meta["Geogr.Laenge"][1],
    ],  # coordinates for the marker
    popup=data_meta["Status"][1],  # pop-up label for the marker
).add_to(m)


# Display m
m


filename = "../data/produkt_klima_monat_17190101_20211231_00403.txt"
dwd_raw = pd.read_csv(filename, sep=";")
dwd_raw.dtypes

STATIONS_ID            int64
MESS_DATUM_BEGINN      int64
MESS_DATUM_ENDE        int64
QN_4                   int64
MO_N                 float64
MO_TT                float64
MO_TX                float64
MO_TN                float64
MO_FK                float64
MX_TX                float64
MX_FX                float64
MX_TN                float64
MO_SD_S              float64
QN_6                   int64
MO_RR                float64
MX_RS                float64
eor                   object
dtype: object


dwd_raw = pd.read_csv(filename, sep=";", na_values=["-999"], skipinitialspace=True)

dwd_raw.sample(n=4, random_state=1)


dwd_raw["MESS_DATUM_BEGINN"] = pd.to_datetime(
    dwd_raw["MESS_DATUM_BEGINN"], format="%Y%m%d"
)
first_date = min(dwd_raw["MESS_DATUM_BEGINN"])
print(first_date)

dwd_raw["MESS_DATUM_ENDE"] = pd.to_datetime(dwd_raw["MESS_DATUM_ENDE"], format="%Y%m%d")
last_date = max(dwd_raw["MESS_DATUM_BEGINN"])
print(last_date)

1719-01-01 00:00:00
2021-12-01 00:00:00


expected_length = len(pd.date_range(first_date, last_date, freq="MS"))
expected_length == dwd_raw.shape[0]

False


# create new DataFrame
dwd_month = pd.DataFrame(
    {"Date": pd.date_range(first_date, last_date, freq="MS")}
)  ## 'MS' for the beginning (month start frequency)


dwd_month = pd.merge(
    dwd_month, dwd_raw, left_on="Date", right_on="MESS_DATUM_BEGINN", how="left"
)


dwd_month.head(15)


expected_length == dwd_month.shape[0]

True


dwd_month["MO_TT"][1:10]

1     1.1
2     5.2
3     9.0
4    15.1
5    19.0
6    21.4
7    18.8
8    13.9
9     9.0
Name: MO_TT, dtype: float64


ts_FUB_monthly = pd.Series(dwd_month["MO_TT"].values, index=dwd_month["Date"])


plt.figure(figsize=(18, 4))
ts_FUB_monthly.plot()
plt.show()


url = "https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/daily/kl/historical/tageswerte_KL_00403_19500101_20211231_hist.zip"


r = requests.get(url)
z = zipfile.ZipFile(io.BytesIO(r.content))
z.extractall("../data")


data_raw = pd.read_csv(
    "../data/produkt_klima_tag_19500101_20211231_00403.txt",
    sep=";",
    na_values=["-999"],
    skipinitialspace=True,
)
data_raw


data_raw["MESS_DATUM"] = pd.to_datetime(data_raw["MESS_DATUM"], format="%Y%m%d")


ts_FUB_daily = pd.DataFrame(
    {"Temp": data_raw["TMK"], "Rain": data_raw["RSK"]}
).set_index(data_raw["MESS_DATUM"])


fig, ax = plt.subplots(2, 1, figsize=(18, 8))

ax[0].plot(ts_FUB_daily["Temp"])
ax[0].set_title("Temp")

ax[1].plot(ts_FUB_daily["Rain"], color="orange")
ax[1].set_title("Rain")
plt.show()


url = "https://opendata.dwd.de/climate_environment/CDC/observations_germany/climate/hourly/precipitation/historical/stundenwerte_RR_00403_20020128_20211231_hist.zip"


r = requests.get(url)
z = zipfile.ZipFile(io.BytesIO(r.content))
z.extractall("../data")


data_raw = pd.read_csv(
    "../data/produkt_rr_stunde_20020128_20211231_00403.txt",
    sep=";",
    na_values=["-999"],
    skipinitialspace=True,
)
data_raw


data_raw["MESS_DATUM"] = pd.to_datetime(data_raw["MESS_DATUM"], format="%Y%m%d%H")


ts_FUB_hourly = pd.Series(data_raw["R1"].values, index=data_raw["MESS_DATUM"])
ts_FUB_hourly.fillna(0)

MESS_DATUM
2002-01-28 11:00:00    0.0
2002-01-28 13:00:00    0.0
2002-01-28 15:00:00    1.7
2002-01-28 18:00:00    1.1
2002-01-28 21:00:00    0.0
                      ... 
2021-12-31 19:00:00    0.7
2021-12-31 20:00:00    0.7
2021-12-31 21:00:00    0.1
2021-12-31 22:00:00    0.1
2021-12-31 23:00:00    0.0
Length: 174023, dtype: float64


plt.figure(figsize=(18, 4))
ts_FUB_hourly.plot()
plt.ylabel('Rainfall in mm/h', Fontsize = 13)
plt.xlabel('Date', Fontsize = 13)
plt.show()


# convert pandas series to DataFrames
ts_FUB_monthly_df = ts_FUB_monthly.to_frame(name="rainfall").reset_index()
ts_FUB_hourly_df = ts_FUB_hourly.to_frame(name="rainfall").reset_index()
ts_FUB_daily_df = ts_FUB_daily.reset_index()


# save them as json files, remember to set date_format = "iso"
ts_FUB_monthly_df.to_json("../data/ts_FUB_monthly.json", date_format = "iso")
ts_FUB_hourly_df.to_json("../data/ts_FUB_hourly.json", date_format = "iso")
ts_FUB_daily_df.to_json("../data/ts_FUB_daily.json", date_format = "iso")


#ts_FUB_monthly


ts_FUB_monthly_df = pd.read_json("../data/ts_FUB_monthly.json")
ts_FUB_monthly_df["Date"] = pd.to_datetime(ts_FUB_monthly_df['Date'], format="%Y-%m-%d", errors = 'coerce')
ts_FUB_monthly_df

	Stations_id	Stationshoehe	Geogr.Breite	Geogr.Laenge	von_datum	bis_datum	Stationsname
0	403	51.0	52.4625	13.3000	19500101	19970711	Berlin-Dahlem (FU)
1	403	51.0	52.4537	13.3017	19970712		Berlin-Dahlem (FU)

	STATIONS_ID	MESS_DATUM_BEGINN	MESS_DATUM_ENDE	QN_4	MO_N	MO_TT	MO_TX	MO_TN	MO_FK	MX_TX	MX_FX	MX_TN	MO_SD_S	QN_6	MO_RR	MX_RS	eor
364	403	17591101	17591130	5	NaN	2.7	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
136	403	17370101	17370131	5	NaN	2.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
99	403	17331201	17331231	5	NaN	4.6	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
943	403	18080201	18080229	5	NaN	-1.3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor

	Date	STATIONS_ID	MESS_DATUM_BEGINN	MESS_DATUM_ENDE	QN_4	MO_N	MO_TT	MO_TX	MO_TN	MO_FK	MX_TX	MX_FX	MX_TN	MO_SD_S	QN_6	MO_RR	MX_RS	eor
0	1719-01-01	403.0	1719-01-01	1719-01-31	5.0	NaN	2.8	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
1	1719-02-01	403.0	1719-02-01	1719-02-28	5.0	NaN	1.1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
2	1719-03-01	403.0	1719-03-01	1719-03-31	5.0	NaN	5.2	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
3	1719-04-01	403.0	1719-04-01	1719-04-30	5.0	NaN	9.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
4	1719-05-01	403.0	1719-05-01	1719-05-31	5.0	NaN	15.1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
5	1719-06-01	403.0	1719-06-01	1719-06-30	5.0	NaN	19.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
6	1719-07-01	403.0	1719-07-01	1719-07-31	5.0	NaN	21.4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
7	1719-08-01	403.0	1719-08-01	1719-08-31	5.0	NaN	18.8	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
8	1719-09-01	403.0	1719-09-01	1719-09-30	5.0	NaN	13.9	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
9	1719-10-01	403.0	1719-10-01	1719-10-31	5.0	NaN	9.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
10	1719-11-01	403.0	1719-11-01	1719-11-30	5.0	NaN	6.6	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
11	1719-12-01	403.0	1719-12-01	1719-12-31	5.0	NaN	0.3	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
12	1720-01-01	403.0	1720-01-01	1720-01-31	5.0	NaN	2.6	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
13	1720-02-01	403.0	1720-02-01	1720-02-29	5.0	NaN	1.4	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor
14	1720-03-01	403.0	1720-03-01	1720-03-31	5.0	NaN	3.1	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	eor

	STATIONS_ID	MESS_DATUM	QN_3	FX	FM	QN_4	RSK	RSKF	SDK	SHK_TAG	NM	VPM	PM	TMK	UPM	TXK	TNK	TGK	eor
0	403	19500101	NaN	NaN	NaN	5	2.2	7	NaN	0.0	5.0	4.0	1025.60	-3.2	83.00	-1.1	-4.9	-6.3	eor
1	403	19500102	NaN	NaN	NaN	5	12.6	8	NaN	0.0	8.0	6.1	1005.60	1.0	95.00	2.2	-3.7	-5.3	eor
2	403	19500103	NaN	NaN	NaN	5	0.5	1	NaN	0.0	5.0	6.5	996.60	2.8	86.00	3.9	1.7	-1.4	eor
3	403	19500104	NaN	NaN	NaN	5	0.5	7	NaN	0.0	7.7	5.2	999.50	-0.1	85.00	2.1	-0.9	-2.3	eor
4	403	19500105	NaN	NaN	NaN	5	10.3	7	NaN	0.0	8.0	4.0	1001.10	-2.8	79.00	-0.9	-3.3	-5.2	eor
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
26293	403	20211227	NaN	NaN	NaN	3	0.0	8	0.183	0.0	5.9	3.8	998.13	-3.7	79.67	-0.7	-7.9	-9.9	eor
26294	403	20211228	NaN	NaN	NaN	3	1.5	6	0.000	0.0	6.4	5.3	990.17	-0.5	88.46	2.7	-3.9	-5.1	eor
26295	403	20211229	NaN	NaN	NaN	3	0.3	6	0.000	0.0	7.5	8.2	994.40	4.0	100.00	5.6	1.8	0.0	eor
26296	403	20211230	NaN	NaN	NaN	3	3.2	6	0.000	0.0	7.9	11.5	1001.70	9.0	98.54	12.7	4.6	2.3	eor
26297	403	20211231	NaN	NaN	NaN	3	5.5	6	0.000	0.0	7.7	12.5	1004.72	12.8	84.96	14.0	11.5	10.7	eor

	Date	rainfall
0	1719-01-01 00:00:00+00:00	2.80
1	1719-02-01 00:00:00+00:00	1.10
2	1719-03-01 00:00:00+00:00	5.20
3	1719-04-01 00:00:00+00:00	9.00
4	1719-05-01 00:00:00+00:00	15.10
...	...	...
3631	2021-08-01 00:00:00+00:00	17.43
3632	2021-09-01 00:00:00+00:00	15.55
3633	2021-10-01 00:00:00+00:00	10.49
3634	2021-11-01 00:00:00+00:00	6.28
3635	2021-12-01 00:00:00+00:00	2.19

Monthly time series data Berlin-Dahlem (FU)¶

Daily time series data Berlin-Dahlem (FU)¶

Hourly time series data Berlin-Dahlem (FU)¶

	STATIONS_ID	MESS_DATUM	QN_8	R1	RS_IND	WRTR	eor
0	403	2002012811	1	0.0	0.0	NaN	eor
1	403	2002012813	1	0.0	0.0	NaN	eor
2	403	2002012815	1	1.7	1.0	NaN	eor
3	403	2002012818	1	1.1	1.0	NaN	eor
4	403	2002012821	1	0.0	0.0	NaN	eor
...	...	...	...	...	...	...	...
174018	403	2021123119	3	0.7	1.0	6.0	eor
174019	403	2021123120	3	0.7	1.0	6.0	eor
174020	403	2021123121	3	0.1	1.0	NaN	eor
174021	403	2021123122	3	0.1	1.0	6.0	eor
174022	403	2021123123	3	0.0	1.0	6.0	eor