ブロックリファレンス

BLOCKS Reference

Watson

自然言語分類器の作成とトレーニング【ベータ版】

errorこのブロックの利用にあたっては、MAGELLAN BLOCKSのお問い合わせ機能から問い合わせ願います。

概要

このブロックは、IBM Watson Natural Language Classifier API のCreate classifierをBLOCKSから利用できるようにしたものです。

このブロックを実行すると、自然言語分類器(分類器)の作成とトレーニングが行えます。下図は、このブロックの位置づけを表したものです。

自然言語分類器の作成とトレーニングブロックの概略図
  1. 自然言語分類器の作成とトレーニングブロック

    分類器は、テキスト形式のトレーニングデータから学習(トレーニング)を行います。

  2. テキストの分類ブロック

    トレーニング済みの分類器は、トレーニングされていないテキストデータから、そのテキストの意図を解釈し分類します。分類は、トレーニング時に定められた分類の中から最も適切なもが選択されます。

トレーニングデータの形式は、以下の3種類の中から選べます。

以下、各トレーニングデータの形式と、そのデータをBLOCKS(フローデザイナー)でどう扱うかの簡単な解説です。

Natural Language Classifier独自のテキスト形式(CSV)

Natural Language Classifier独自のテキスト形式については、IBM Cloud資料open_in_newを参照願います。

ここでは、Natural Language Classifier独自のデータをフローデザイナーでどう扱うかを解説します。

BLOCKSでは、[GCSから変数へロード]ブロックを使うと、Google Cloud Storage(GCS)上のファイルを読み取ってくれます。あとは、このブロックと、[自然言語分類器の作成とトレーニング]ブロックを組み合わせるだけです。

まず、データをGCSへアップロードします。ここでは、weather_data_train.csvというファイルをmy-blocks-bucketというGCS上にバケットにアップロードしたとします(GCS URL: gs://my-blocks-bucket/weather_data_train.csv)。

info_outlineBLOCKSの機能GCS Explorerを使うと簡単にローカルPCのファイルをGCSへアップロードできます。

フローを以下のように作成すると、分類器の作成とトレーニングができます。

サンプルフローと各ブロックのプロパティ値の例

GCSから変数へロード]ブロックと[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、いずれもnoneにしなければなりません。

Googleスプレッドシート(BLOCKS独自機能)

Googleスプレッドシートのデータがトレーニングデータとして使えます(BLOCKS独自機能)。形式は、以下のとおりです。

自然言語分類器の作成とトレーニングブロックのGoogleスプレッドシートによるトレーニングデータのサンプル

スプレッドシートの準備ができたら、フローを以下のように作成すると、分類器の作成とトレーニングができます。

サンプルフローと各ブロックのプロパティ値の例

スプレッドシートには、GCPサービスのアカウントのメールアドレスを共有者として登録しておいてください。また、[自然言語分類器の作成とトレーニング]ブロックのファイル形式は、JSONとしてください。

配列形式(BLOCKS独自機能)

オブジェクトの各メンバーの値が配列値のデータもトレーニングデータとして扱えます(BLOCKS独自機能)。

以下は、[オブジェクト生成]ブロックでトレーニングデータを設定した例です。データの内容は、前述のGoogleスプレッドシートと同じものです。

オブジェクト生成ブロックの使用例

(画像をクリックすると拡大表示されます。)

  • 1つのObject型を用意(この例の場合、Key名data
  • その子要素としてArray型のメンバーを用意
  • Array型のKeyが分類値(この例の場合、「気温」と「天候」)
  • Array型の子要素が分類するテキスト(型はString)

オブジェクト生成]ブロックの準備ができたら、フローを以下のように作成すると、分類器の作成とトレーニングができます。

サンプルフローと各ブロックのプロパティ値の例

自然言語分類器の作成とトレーニング]ブロックのファイル形式は、Noneとしてください。

このブロックの利用にあたっては、お客さまのIBM Cloud 環境上で、 Natural Language Classifierサービスが利用可能となっている必要があります。また、Natural Language Classifierの資格情報も必要です。

プロパティ

プロパティ名 説明
ブロック名

ブロックの名前を指定します。ブロックに表示されます。

ユーザー名

Natural Language Classifierサービスの以下のような資格情報のusernameの値を指定します。

補足説明図:ユーザー名入力時の資格情報の例

(画像をクリックすると拡大表示されます。)

パスワード

Natural Language Classifierサービスの以下のような資格情報のpasswordの値を指定します。

補足説明図:パスワード入力時の資格情報の例

(画像をクリックすると拡大表示されます。)

トレーニングデータが格納された変数

トレーニングデータが格納されている変数を指定します。

ファイル形式

トレーニングデータのデータ形式を指定します。

  • None:Natural Language Classifier独自のテキスト形式(CSV)および配列形式(BLOCKS独自機能)の場合は、Noneを選択
  • JSON:Googleスプレッドシート(BLOCKS独自機能)の場合は、JSONを選択
分類器名

分類器を識別するための一意な名前を指定します。

ブロックメモ

ブロックに対するコメントを指定します。

言語

トレーニングデータの言語を選択します。

この情報は役に立ちましたか?