Watson
自然言語分類器の作成とトレーニング【ベータ版】
MAGELLAN BLOCKSのお問い合わせ機能から問い合わせ願います。
このブロックの利用にあたっては、概要
このブロックは、IBM Watson Natural Language Classifier API open_in_newのCreate classifierをBLOCKSから利用できるようにしたものです。
このブロックを実行すると、自然言語分類器(分類器)の作成とトレーニングが行えます。下図は、このブロックの位置づけを表したものです。

-
自然言語分類器の作成とトレーニングブロック
分類器は、テキスト形式のトレーニングデータから学習(トレーニング)を行います。
-
テキストの分類ブロック
トレーニング済みの分類器は、トレーニングされていないテキストデータから、そのテキストの意図を解釈し分類します。分類は、トレーニング時に定められた分類の中から最も適切なもが選択されます。
トレーニングデータの形式は、以下の3種類の中から選べます。
- Natural Language Classifier独自のテキスト形式(CSV)open_in_new
- Googleスプレッドシート(BLOCKS独自機能)
- 配列形式(BLOCKS独自機能)
以下、各トレーニングデータの形式と、そのデータをBLOCKS(フローデザイナー)でどう扱うかの簡単な解説です。
Natural Language Classifier独自のテキスト形式(CSV)
info_outlineNatural Language Classifier独自のテキスト形式については、IBM Cloud資料open_in_newを参照願います。
ここでは、Natural Language Classifier独自のデータをフローデザイナーでどう扱うかを解説します。
BLOCKSでは、[GCSから変数へロード]ブロックを使うと、Google Cloud Storage(GCS)上のファイルを読み取ってくれます。あとは、このブロックと、[自然言語分類器の作成とトレーニング]ブロックを組み合わせるだけです。
まず、データをGCSへアップロードします。ここでは、weather_data_train.csvというファイルをmy-blocks-bucketというGCS上にバケットにアップロードしたとします(GCS URL: gs://my-blocks-bucket/weather_data_train.csv)。
info_outlineBLOCKSの機能GCS Explorerを使うと簡単にローカルPCのファイルをGCSへアップロードできます。
フローを以下のように作成すると、分類器の作成とトレーニングができます。

warning[GCSから変数へロード]ブロックと[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、いずれもnoneにしなければなりません。
Googleスプレッドシート(BLOCKS独自機能)
配列形式(BLOCKS独自機能)
オブジェクトの各メンバーの値が配列値のデータもトレーニングデータとして扱えます(BLOCKS独自機能)。
以下は、[オブジェクト生成]ブロックでトレーニングデータを設定した例です。データの内容は、前述のGoogleスプレッドシートと同じものです。

(画像をクリックすると拡大表示されます。)
- 1つのObject型を用意(この例の場合、Key名
data
) - その子要素としてArray型のメンバーを用意
- Array型のKeyが分類値(この例の場合、「
気温
」と「天候
」) - Array型の子要素が分類するテキスト(型はString)
[オブジェクト生成]ブロックの準備ができたら、フローを以下のように作成すると、分類器の作成とトレーニングができます。

warning[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、Noneとしてください。
warningこのブロックの利用にあたっては、お客さまのIBM Cloud open_in_new環境上で、 Natural Language Classifierサービスopen_in_newが利用可能となっている必要があります。また、Natural Language Classifierの資格情報も必要です。