ブロックリファレンス

BLOCKS Reference

機械学習

クラスタリングモデルの作成

概要

このブロックは、BigQuery MLを使い、BigQuery上のトレーニングデータでK平均法クラスタリングのモデルを作成します。作成したモデルは、BigQueryとDataEditorに登録されます。

このブロックを利用することで、K平均法クラスタリングのモデルを利用した以下のようなユースケースに対応できます。

  • 蓄積されていくデータを用いた再学習
  • モデル作成の試行錯誤
留意事項
  • K平均法クラスタリングは、教師なし学習にあたるため、トレーニングデータに推論/予測の対象となるカラムは必要ありません。
  • このブロックは、モデル作成の完了を待たずに終了します。
    トレーニングの状態や結果は、DataEditorのモデル一覧で確認できます。
  • Slack通知設定」プロパティを利用すると、モデル作成の完了をSlackで確認できます。
    Slack通知設定」プロパティで指定する内容は、あらかじめプロジェクト設定の通知設定で作成しておきます。

プロパティ

プロパティ名 説明
ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

GCPサービスアカウント

GCPサービスアカウントのリストから適切なGCPサービスアカウントを選択します。

入力BigQueryデータセット

トレーニングデータを格納したBigQueryテーブルが属するBigQueryデータセットを指定します。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
入力BigQueryテーブル

トレーニングデータを格納したBigQueryテーブルを指定します。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
モデル名

DataEditorで参照する際のモデルの名前を指定します。

DataEditorに登録済の名前を指定するとモデルは更新されます。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
トレーニング完了時に付加するタグ名

トレーニングが完了した際に、タグも同時に付けたい場合に指定します。

タグは、別途「推論/予測に使用するタグの設定」ブロックを使って、後付けできます。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
ブロックメモ このブロックに関するメモが記載できます。このブロックの処理に影響しません。
トレーニング完了時からのモデル保持日数(0は制限なし)

トレーニング完了時点からモデルを保持する日数を指定します。指定した日数を経過するとモデルは自動で削除されます。0日を指定すると、自動削除されません。

初期値は、0日です。

クラスタ数

トレーニングデータで識別するクラスタの数を指定します。

指定可能な値は、2から100です。

データ分割方法

クラスターの初期化方法を指定します。

  • ランダム:ランダムにクラスターを割り振ります。
  • 自動:KMEANS++アルゴリズムでクラスタを割り振ります。ランダムより優れたモデルが作成できます。
距離の種類

クラスタリングに用いるデータ間の距離(類似度)を測定する方法を指定します。

  • ユークリッド:ユークリッド距離を用います。一般的に用いられる方法です。
  • コサイン:コサイン類似度を用います。一般的にデータ間の数値的な大きさを考慮しない場合に使用する測定方法です。典型的な使用方法は、テキストデータを扱う場合で、単語の類似度を重視したい場合に用います。
数値の特徴を標準化する

トレーニングデータを標準化するかしないかを指定します。

  • :データを標準化する
  • :データを標準化しない
トレーニングの反復またはステップの最大数

トレーニングの反復回数またはステップ回数の最大値を指定します。

早期停止(相対損失の改善が値よりも小さい最初の反復の後にトレーニングを停止するかどうか)

最初の反復の後で、「トレーニングを継続するために必要な最小相対損失の改善」で指定された値よりも小さいときに、トレーニングを停止するかどうかを指定します。

  • :停止する
  • :停止しない
トレーニングを継続するために必要な最小相対損失の改善

早期停止」を指定した場合、トレーニングを継続するために必要な相対的な損失の最小改善量を指定します。

たとえば、0.01の値を指定すると、トレーニングを継続するためには、各反復で損失を1%減少させる必要があります。

Slack通知設定(省略可)

モデル作成完了時に、Slackへその旨のテキストメッセージを送信したい場合に、プロジェクト設定の通知設定で設定したSlack通知の名称を指定します。

Slack通知のイメージ:

モデルの作成が完了したにも関わらずSlackに通知が来ない場合は、何らかの原因(指定したチャンネルがないなど)でSlackの通知に失敗している可能性があります。その場合は、プロジェクト設定の通知設定を確認してください。Slackの通知に失敗している場合は、失敗に関するメッセージが確認できます。

変数展開の指定が可能][%形式の文字列書式の指定が可能]
Slack通知チャンネル設定(省略可)

通知先のSlackチャンネルを指定します。

チャンネルを指定した場合は、プロジェクト設定の通知設定のチャンネルは無視されます。

省略した場合は、通知設定で指定されたチャンネルへ通知されます。

Slack通知ユーザー名設定(省略可)

通知する際のユーザー名を指定します。

ユーザー名を指定した場合は、プロジェクト設定の通知設定のユーザー名は無視されます。

省略した場合は、プロジェクト設定の通知設定で指定されたユーザー名が使われます。

Slack通知アイコン絵文字設定(省略可)

通知する際の絵文字を指定します。

絵文字を指定した場合は、プロジェクト設定の通知設定の絵文字は無視されます。

省略した場合は、プロジェクト設定の通知設定で指定された絵文字が使われます。

この情報は役に立ちましたか?