ブロックリファレンス

BLOCKS Reference

機械学習

物体検出(オンライン)

概要

このブロックは、物体検出サービスでトレーニングしたモデルを使って、指定された画像(1 枚のみ)内にある複数のオブジェクトを検出します。

物体検出(オンライン)ブロックの概念図

上図の出力変数の画像はイメージです。実際には、画像ではなく検出された個々の物体情報が出力されます。詳しくは、「判定結果を格納する変数名」プロパティの説明を参照願います。

物体検出を使うと、画像内に「なにが」・「どこに」・「いくつある」と言った情報が得られます。これを利用することで、製造業における外観検査、ブランド品の判別や自動運転での歩行者検出など、アイデア次第でさまざまな応用が可能です。

複数の画像内の物体を検出したい場合は、「物体検出(バッチ)」ブロックを利用してください。

プロパティ

プロパティ名 説明
ブロック名

編集パネルに配置した当該ブロックの表示名が変更できます。

ブロックリストパネル中のブロック名は変更されません。

モデル名

物体検出サービスでトレーニングしたモデルを選択します。

判定したい画像(JPEG)を格納した変数名

判定したい JPEG 画像を格納した変数を指定します。

変数の内容は以下のいずれかの形式で指定します。

  • オブジェクトを判定したい JPEG 画像そのもの(Base64 エンコードされた JPEG 画像データ)

    例:「GCS から変数へロード」ブロックを使って、GCS 上の画像ファイルをロードした際に変数へ格納されたデータ(名前 "content" の値)(「バイナリ(Base64)」形式でロードした場合)

    (変数 _ にロードした場合は、_.content を指定)

  • オブジェクトを判定したい JPEG 画像への GCS URL

    例:gs://my-bucket/foo/bar.jpg

画像は 1 枚のみ指定可能です。複数の画像は指定できません。

判定結果を格納する変数名

判定結果を格納する変数を指定します。変数に格納された値は、以下のような形式です。

{
  "bboxes": [ { "label_id": 1, "label_name": "cat", "xmin": 0.6, "ymin": 0.0, "xmax": 0.9, "ymax": 0.5, "score": 0.6 }, ...]
}
名前 説明
"label_id" ラベルの ID
"label_name" ラベルの名称
"xmin" オブジェクト矩形領域の左上の X 座標(画像の左上原点)
"ymin" オブジェクト矩形領域の左上の Y 座標(画像の左上原点)
"xmax" オブジェクト矩形領域の右下の X 座標(画像の左上原点)
"ymax オブジェクト矩形領域の右下の Y 座標(画像の左上原点)
"score" 判定したオブジェクトのスコア(確からしさ)
画像の分割幅(px)(カンマ(,)区切りで複数指定可)

画像の分割幅をピクセルで指定します。カンマ(,)で区切ることにより複数の分割幅が指定できます。

分割幅の最低値は、300 ピクセルです。

画像を分割する時のオーバーラップ幅(%)

オーバーラップ幅を「画像の分割幅」に対する比率で指定します。

指定可能な値は、0 から 50 までの数値です。

画像の分割は分割領域が重なり合うように分割します。その重なり合った部分をオーバーラップ幅と呼びます。

オーバーラップ幅の解説図
ブロックメモ このブロックに関するメモが記載できます。このブロックの処理に影響しません。
結果を残す検出の score の閾値

結果を残すオブジェクト検出スコアのしきい値を指定します。

指定可能な値は、0 から 1 までの数値です(0.1 刻み)。

検出矩形を融合させる IoU の閾値

IoU のしきい値(同一のオブジェクトに対して重複して検出された矩形を 1 つにする後処理の際のしきい値)を指定します。

指定可能な値は、0 から 1 までの数値です(0.1 刻み)。

この情報は役に立ちましたか?