BigQuery
GCS から複数テーブルへロード
概要
このブロックは、指定された Google Cloud Storage(GCS)上のファイル群の各データを、BigQuery の複数テーブルへ並列にデータを格納(投入)します。
プロパティ
プロパティ名 | 説明 |
---|---|
ブロック名 | ブロックの名前を指定します。ブロックに表示されます。 |
GCP サービスアカウント | このブロックで使用する GCP サービスアカウントを選択します。 |
投入データのファイル群 GCS URL |
投入データの GCS 上のファイル URL("gs://バケット名/オブジェクト名-*.csv" のような URL)を指定します。URL 中の *(アスタリスク)の部分を長さ 0 文字以上の任意の文字列として、それに合致するファイル名のファイルをすべて読み込みます。
[変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
投入先のデータセット |
投入先テーブルのデータセット ID を指定します。
[変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
投入先のテーブル |
投入先テーブルのテーブル ID のプリフィックスを指定します。 テーブル ID は、「投入データのファイル群 GCS URL」プロパティで指定された URL に合致したファイル名(拡張子を除く)を元に作成します。このとき、ここで指定されたプリフィックスが先頭に追加されます。
[変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
スキーマ設定をデータから自動生成する |
投入データ群のファイル形式が、ヘッダー付きの CSV ファイルもしくは JSON ファイルの場合、そのファイル内容からスキーマの自動生成ができます。 スキーマを自動生成する場合は、チェックボックスにチェックを付けます。 info_outline 自動生成を有効にし投入データのファイル形式が CSV の場合は、[読み飛ばし行数]プロパティに 1 が指定されたものとして扱います。ただし、[読み飛ばし行数]プロパティに値を直接指定した場合は、その値が使用されます。 |
スキーマ設定 |
投入先テーブルのスキーマを指定します。 複数テーブルすべてが同一のスキーマとなります。この場合、投入データすべてのスキーマも同一でなければなりません。スキーマが異なる場合は、エラーとなります。 JSON 形式のファイルから読み込む場合は、省略可能です。 ※[JSON で編集]リンクをクリックすると、JSON 形式の文字列を直接指定できます。 info_outline 画面上には表示されませんが、description キーが自動で追加されます。JSON で編集の場合は、description キーは表示され編集も可能です。 info_outline 使い方は、基本操作ガイドの「スキーマ設定プロパティの使い方」を参照願います。 info_outline [スキーマ設定をデータから自動生成する]プロパティが有効になっている場合は、ここで設定したスキーマは無視されます。 |
空でないテーブルが存在したとき |
投入先となる BigQuery テーブルが存在したときの動作を選択します。
|
ブロックメモ | ブロックに対するコメントを指定します。 |
ファイル形式 |
GCS 上のファイルの形式を選択します。選択できるフォーマットは次のいずれかです。
|
CSV の区切り文字 |
[ファイル形式]プロパティ値が CSV の場合の区切り文字を選択もしくは指定します。選択できる区切り文字は以下のいずれかです。
[その他]を選択した場合は、[その他]の入力フィールドに、区切り文字を 1 文字で指定します。 |
読み飛ばし行数 | [ファイル形式]プロパティ値が CSV の場合、先頭何行を読み飛ばすかの行数を指定します。 |
フィールド数が足りない行を許容する | [ファイル形式]プロパティ値が CSV の場合、フィールド数が足りない行を許容するかしないかを選択します。 |
クオート記号を指定 | [ファイル形式]プロパティ値が CSV の場合のクオート記号を指定します。 |
クオートされた文字列に改行を含む | [ファイル形式]プロパティ値が CSV の場合、クオートされた文字列に改行が含まれることを許容するかしないかを指定します。 |
不正な行の許容数 | 不正なレコードの許容数を指定します。このレコード数を超える不正なレコードがあると読み込み失敗となります。 |
余分なフィールドを無視する | 余分なフィールドを無視するかしないかを指定します。 |
ファイルの存在チェック URL |
このプロパティを使用すると、指定したファイルが存在するときのみ、本ブロックを実行します。ファイルは、GCS URL で指定します(gs://my-bucket/item.csv のような形式)。 空欄の場合は、無条件に本ブロックを実行します。 error_outline ここで指定したファイルは、本ブロックの正常終了時に削除されます。
[変数展開の指定が可能][% 形式の文字列書式の指定が可能]
|
チェック回数 | ファイル存在チェックの最大試行回数を指定します。 |
チェック間隔 | ファイルの存在チェックで、ファイルが存在しないときに、再度ファイルの存在チェックを繰り返すまでの時間を秒単位で指定します。 |