【Amazon Forecastで時系列予測】③予測モデルの作成(CNN-QR)

AWSでAI・データ活用
Amazon Forecastは、Amazon.comの機械学習予測技術に基づいて、統計アルゴリズムと機械学習アルゴリズムを使用し、高い精度の時系列予測を提供する完全マネージド型サービスです。
全5回のコラムを通して、Amazon Forecastの概要、そして時系列予測を実際にAmazon Forecastでどのように実施していくのかを操作手順ベースでご紹介していきます。
前回の記事では、AutoMLを利用した予測子の作成(予測モデルの学習)についてご説明しましたが、第4回となる今回はCNN-QRアルゴリズムを指定して予測子の作成を行います。
1. はじめに
今回はCNN-QRアルゴリズムを指定して予測子の作成を行います。
せっかくなので、マネジメントコンソールからの操作ではなく、以下のサンプルコードを参照してAWS SDK for Python(Boto3)経由でAmazon Forecastを操作してみます。
2. 環境
事前にPython、Boto3、Jupyter Labを導入しました。
- Python: 3.7.3
- Boto3: 1.17.7
- Jupyter Lab: 0.35.4
3. 予測子の作成
create_predictorに対して、利用するアルゴリズムなどのパラメータを指定して、予測子を作成します。
※画像をクリックすると新しいタブで開きます。
- 予測子名:bisol_covid19_predictor3_cnnqr
- 予測範囲(期間):30
- 予測の時間単位:day
- 予測アルゴリズムの選択:CNN-QR
- Backtest window
- Number of windows:5
- Offset:30
AWSコンソール上で該当のPredictorが作成されていることを確認します。
※画像をクリックすると新しいタブで開きます。
予測子のトレーニングが完了するとステータスが「Active」に変わります。
このプロセスは、AutoMLでは1時間超かかりましたが、今回の手動選択では30分程度で完了しました。
※画像をクリックすると新しいタブで開きます。
4. 予測子の評価
予測子のメトリクス(評価指標)を取得します。
※画像をクリックすると新しいタブで開きます。
マネジメントコンソールの予測子の詳細ページでも確認します。
※画像をクリックすると新しいタブで開きます。
5. バックテストパラメータの設定について
Amazon Forecastは、インポートした時系列データを学習データ(Training)とテストデータ(Testing)に分割し、バックテストにより予測メトリクスを生成します。
バックテストのパラメータでは、バックテストウィンドウの長さとバックテストシナリオの数の両方を設定できます。
前回はバックテストシナリオの数をデフォルトの「1」のまま進めましたが、今回は最大の「5」を指定してみました(1から5までのバックテストを選択できます)。
バックテストウィンドウは「30」のまま変更していません。
6. おわりに
これで予測モデルの作成に関する作業は完了です。
次回は、作成した予測子を使用して予測(推論)を行います。
■商標について
Amazon Web Services、および、かかる資料で使用されるその他のAWS商標は、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。
【Amazon Forecastで時系列予測】シリーズ コラム一覧(全5回)
第1回:Amazon Forecastとは
第2回:①データセットの準備
第3回:②予測モデルの作成(AutoML)
第5回:④予測実行(推論)