Watson
自然言語分類器の作成とトレーニング【ベータ版】
MAGELLAN BLOCKSのお問い合わせ機能から問い合わせ願います。
このブロックの利用にあたっては、概要
このブロックは、IBM Watson Natural Language Classifier API open_in_newのCreate classifierをBLOCKSから利用できるようにしたものです。
このブロックを実行すると、自然言語分類器(分類器)の作成とトレーニングが行えます。下図は、このブロックの位置づけを表したものです。
-
自然言語分類器の作成とトレーニングブロック
分類器は、テキスト形式のトレーニングデータから学習(トレーニング)を行います。
-
テキストの分類ブロック
トレーニング済みの分類器は、トレーニングされていないテキストデータから、そのテキストの意図を解釈し分類します。分類は、トレーニング時に定められた分類の中から最も適切なもが選択されます。
トレーニングデータの形式は、以下の3種類の中から選べます。
- Natural Language Classifier独自のテキスト形式(CSV)open_in_new
- Googleスプレッドシート(BLOCKS独自機能)
- 配列形式(BLOCKS独自機能)
以下、各トレーニングデータの形式と、そのデータをBLOCKS(フローデザイナー)でどう扱うかの簡単な解説です。
Natural Language Classifier独自のテキスト形式(CSV)
info_outlineNatural Language Classifier独自のテキスト形式については、IBM Cloud資料open_in_newを参照願います。
ここでは、Natural Language Classifier独自のデータをフローデザイナーでどう扱うかを解説します。
BLOCKSでは、[GCSから変数へロード]ブロックを使うと、Google Cloud Storage(GCS)上のファイルを読み取ってくれます。あとは、このブロックと、[自然言語分類器の作成とトレーニング]ブロックを組み合わせるだけです。
まず、データをGCSへアップロードします。ここでは、weather_data_train.csvというファイルをmy-blocks-bucketというGCS上にバケットにアップロードしたとします(GCS URL: gs://my-blocks-bucket/weather_data_train.csv)。
info_outlineBLOCKSの機能GCS Explorerを使うと簡単にローカルPCのファイルをGCSへアップロードできます。
フローを以下のように作成すると、分類器の作成とトレーニングができます。
warning[GCSから変数へロード]ブロックと[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、いずれもnoneにしなければなりません。
Googleスプレッドシート(BLOCKS独自機能)
Googleスプレッドシートのデータがトレーニングデータとして使えます(BLOCKS独自機能)。形式は、以下のとおりです。
スプレッドシートの準備ができたら、フローを以下のように作成すると、分類器の作成とトレーニングができます。
warningスプレッドシートには、GCPサービスのアカウントのメールアドレスを共有者として登録しておいてください。また、[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、JSONとしてください。
配列形式(BLOCKS独自機能)
オブジェクトの各メンバーの値が配列値のデータもトレーニングデータとして扱えます(BLOCKS独自機能)。
以下は、[オブジェクト生成]ブロックでトレーニングデータを設定した例です。データの内容は、前述のGoogleスプレッドシートと同じものです。
(画像をクリックすると拡大表示されます。)
- 1つのObject型を用意(この例の場合、Key名
data
) - その子要素としてArray型のメンバーを用意
- Array型のKeyが分類値(この例の場合、「
気温
」と「天候
」) - Array型の子要素が分類するテキスト(型はString)
[オブジェクト生成]ブロックの準備ができたら、フローを以下のように作成すると、分類器の作成とトレーニングができます。
warning[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、Noneとしてください。
warningこのブロックの利用にあたっては、お客さまのIBM Cloud open_in_new環境上で、 Natural Language Classifierサービスopen_in_newが利用可能となっている必要があります。また、Natural Language Classifierの資格情報も必要です。
プロパティ
プロパティ名 | 説明 |
---|---|
ブロック名 |
ブロックの名前を指定します。ブロックに表示されます。 |
ユーザー名 |
Natural Language Classifierサービスの以下のような資格情報のusernameの値を指定します。 (画像をクリックすると拡大表示されます。) |
パスワード |
Natural Language Classifierサービスの以下のような資格情報のpasswordの値を指定します。 (画像をクリックすると拡大表示されます。) |
トレーニングデータが格納された変数 |
トレーニングデータが格納されている変数を指定します。 |
ファイル形式 |
トレーニングデータのデータ形式を指定します。
|
分類器名 |
分類器を識別するための一意な名前を指定します。 |
ブロックメモ |
ブロックに対するコメントを指定します。 |
言語 |
トレーニングデータの言語を選択します。 |