ETLとELTの違いとは？5つの比較軸とELTが主流になった理由

「BigQueryを導入したのに、データ連携は5年前に組んだETLサーバーのまま」「最近ELTという言葉をよく聞くが、ETLと何が違うのか社内に説明できない」——データ基盤の刷新を検討している企業から、こうした相談が増えています。

ETLとELTの違いは、ひとことで言えば「データの変換をどこで・いつ行うか」です。アルファベットの順番が入れ替わっただけに見えますが、この順序の違いが処理性能・コスト構造・運用体制にまで波及し、クラウド時代のデータ基盤ではELTが主流の座を占めるようになりました。

まず両者の仕組みを短く押さえたうえで、次の順に整理します。

違いを5つの軸で比較
ELTが主流になった背景
自社での選び方
ELT導入時の注意点

ETLとELTの基本：違いは変換を行う「順番」と「場所」

ETLとは：DWHに入れる「前」に変換する従来型の方式

ETLとは、Extract（抽出）・Transform（変換）・Load（格納） の頭文字を取った言葉です。複数のシステムからデータを抜き出し、ETLツールや専用サーバーの上で分析に適した形へ変換してから、DWH（データウェアハウス。分析用にデータを集約しておくデータベース）に格納します。DWHそのものの仕組みやクラウドDWHの比較についてはDWH（データウェアハウス）とは？データレイク・データマートとの違いを解説で整理しています。

ELTとは：DWHに入れた「後」にSQLで変換するクラウド時代の方式

一方のELTは、同じ3つの工程を「Extract → Load → Transform」の順で行います。抽出したデータをまず生のままDWHに格納し、変換はDWHの内部でSQLを使って実行する方式です。

次の図のように、両者の差は工程の中身ではなく、TransformとLoadの順番——つまり変換を担う場所にあります。

ETL（従来型）

Extract

→

TransformETLツール内で変換

→

DWHへLoad

ELT（クラウドDWH時代）

Extract

→

DWHへLoad生データのまま

→

TransformSQL / dbt で変換

ETLでは変換の主役がETLツールとその実行サーバーであるのに対し、ELTでは変換の主役がDWH自身に移ります。

後述する性能・コスト・柔軟性の差は、すべてこの一点から派生します。

なお、ETLそのものの仕組みや代表的なツールはETLの基礎解説記事で図解つきで詳しく扱っています。このページでは「両者の違いと使い分け」に絞って進めます。

ETLとELTの5つの違いを比較表で整理

両者の違いを、「変換のタイミングと場所」「処理性能とスケーラビリティ」「コスト構造」「柔軟性・再利用性」「セキュリティ・ガバナンス」という5つの軸で比較します。まず全体を表で俯瞰してから、各項目を掘り下げます。

比較軸	ETL	ELT
変換のタイミングと場所	DWHに入れる前、ETLツール上で変換	DWHに入れた後、DWH内部で変換
処理性能とスケーラビリティ	ETLサーバーの性能が上限	クラウドDWHの並列処理で拡張しやすい
コスト構造	ツールライセンス＋変換サーバーの維持費	DWHのストレージ＋クエリの従量課金
柔軟性・再利用性	変換後のデータのみ保持、やり直しは再抽出	生データを保持し、何度でも変換し直せる
セキュリティ・ガバナンス	DWH投入前にマスキングなどの加工が可能	生データがDWHに入るため権限設計が必須

【違い1】変換のタイミングと場所：ETLは「DWHの手前」、ELTは「DWHの中」

ETLでは、データはETLツールの中で加工が完了してからDWHに届きます。DWHに入る時点で「きれいなデータ」だけが存在する状態です。

ELTでは、データソースの内容がほぼそのままDWHにコピーされ、その後にSQLで加工されます。DWHの中に「生データ」と「加工済みデータ」が共存するため、設計の自由度が上がる反面、整理整頓の責任もDWH側に移ります。

【違い2】処理性能とスケーラビリティ：ELTはDWHの並列処理を使い切れる

ETLの処理性能は、変換を実行するETLサーバーのCPU・メモリが上限になります。データ量が増えるたびにサーバー増強が必要で、スケーラビリティ（データ量の増加に応じて処理能力を拡張できる性質）の面では分が悪い構造です。

ELTの変換はBigQueryやSnowflakeといったクラウドDWHが実行します。これらは数千台規模のマシンで処理を分散する設計のため、数億行のテーブル同士の結合・集計も数十秒〜数分で完了することが珍しくありません。

Evastの現場でも、日次5,000万行規模の広告ログ基盤をETLサーバーでの変換からBigQuery内での変換に切り替えた結果、夜間4時間かかっていたバッチが20分前後まで短縮された例があります。

【違い3】コスト構造：ETLは固定費中心、ELTは従量課金中心

ETLは、ツールのライセンス費用（エンタープライズ製品では年間数百万円規模のものもあります）と、変換サーバーの維持費という固定費が中心です。データ量が少なくても一定のコストがかかります。

ELTは、DWHのストレージ料金と計算リソースの従量課金が中心です。課金の単位はDWHごとに異なり、BigQueryのオンデマンド料金はクエリがスキャンしたデータ量に、Snowflakeは仮想ウェアハウス（クエリを処理する計算リソースの単位）の稼働時間に応じて課金されます。

ストレージはBigQueryで1GBあたり月数円程度と安いため、小さく始めて使った分だけ払う形にできます。ただし後述のとおり、計算側の課金は設計を誤ると膨らみやすい点に注意が必要です。

【違い4】柔軟性・再利用性：生データを残すELTは「やり直し」に強い

ETLでは変換後のデータしかDWHに残らないため、「集計の粒度を変えたい」「半年前のデータを別の切り口で見たい」となったとき、変換ロジックを直してデータソースから再抽出するしかありません。元システム側でログが消えていれば、復元は不可能です。

ELTは生データをDWHに保持しているので、SQLを書き直して再実行すれば、過去にさかのぼって何度でも変換をやり直せます。分析要件が頻繁に変わる組織ほど、この差が効いてきます。

【違い5】セキュリティ・ガバナンス：DWHに入れる前に加工できるのはETL

ガバナンス（誰がどのデータにアクセスできるかを統制する管理ルール）の観点では、ETLに分があります。DWHに入れる前にマスキング（個人名などを伏せ字に置き換える処理）や不要列の除外ができるため、「個人情報をDWHに置かない」という方針を構造的に守れるからです。

ELTでは生データがそのままDWHに入るため、raw層へのアクセス権限の絞り込みや、カラム単位のマスキング設定など、DWH側での権限設計が必須になります。クラウドDWHにはこうした機能が標準で備わっていますが、「設定する人と運用ルール」を用意しないと機能しません。

Modern Data StackでELTが主流になった3つの背景

Modern Data Stack（クラウドサービスを組み合わせて構成する現代型のデータ基盤パターン）では、ELTが事実上の標準になっています。FivetranやTROCCOでデータを運び、BigQueryやSnowflakeに貯め、dbtで変換する——この組み合わせはすべてELT前提の設計です。

ETLが劣っていたから置き換わったのではなく、2010年代に進んだ技術変化がELTの弱点を消し、強みを際立たせました。背景は大きく3つあります。

【ELT普及の背景1】クラウドDWHの性能向上と低価格化：「とりあえず全部入れる」が許される時代に

ELT普及の最大の推進力は、BigQuery（2011年に一般提供開始）、Amazon Redshift（2013年）、Snowflake（2015年）に代表されるクラウドDWHです。

従来のオンプレミスDWHは、ハードウェア導入に数千万円かかるうえ容量も固定で、「生データを全部入れる」という発想自体が非現実的でした。だからこそ、DWHに入れる前に変換して容量を節約するETLが合理的だったのです。

クラウドDWHはこの前提を覆しました。

鍵になったのが「ストレージとコンピュートの分離」、つまりデータの保管領域と計算リソースを別々に拡張・課金できる仕組みです。保管は安価に大量に、計算は必要なときだけ強力に使えるため、「先に全部入れて、あとからDWHの計算力で変換する」ELTが経済的にも性能的にも合理的になりました。

【ELT普及の背景2】dbtの登場：SQLの変換ロジックを「開発」として管理できるようになった

ELT最大の課題は、DWH内に書き散らかされるSQLが無法地帯になりやすいことでした。この課題を解決したのが、2016年に米Fishtown Analytics（現dbt Labs）がオープンソースとして公開した dbt です。

dbtを使うと、SQLの変換ロジックをGitでバージョン管理し、テストを自動実行し、テーブル間の依存関係を可視化できます。「SQLを書ける人なら誰でも、ソフトウェア開発と同じ品質管理のもとで変換処理を作れる」状態になり、ELTの実用性が一気に高まりました。dbtの詳細はdbtの解説記事で扱っています。

【ELT普及の背景3】FivetranやTROCCOなど「運ぶだけ」のツールが成熟した

変換をDWHに任せられるなら、データ転送ツールは「抽出して運ぶ」ことに専念できます。この割り切りで成功したのがFivetranやAirbyteで、SalesforceやGoogle Analyticsなど数百種類のコネクタを使い、ノーコードで数時間後にはDWHへのデータ連携が動き始めます。

国内でも、TROCCOが広告媒体や国産SaaSへの対応と日本語サポートを強みに広く使われています。「転送はSaaSに任せ、変換はdbtで書く」という分業が確立したことで、ELTは少人数のデータチームでも運用できる現実的な選択肢になりました。Fivetran・trocco・Airbyte・ASTERIA Warpなど主要ツールをコスト・サポート・コネクタ数の3軸で比較した詳細は、データ連携ツールの選び方：コスト・サポート・コネクタ数で比較をご覧ください。

ETLとELT、どちらを選ぶべきか？4つの質問で判断する

主流はELTとはいえ、すべての企業にELTが向くわけではありません。前章の5つの違いのうち、方式選定を実際に左右しやすいのは「セキュリティ・ガバナンス」「処理性能」「柔軟性」の3つです。これに連携先システムの事情を加えた、次の4つの質問に順に答えると、自社に合う方式が見えてきます。

生データをDWHに置けない制約（法規制・社内規程）があるか？ → YES なら、DWH投入前に加工できる ETL（または投入前マスキングとの併用）
データ量は今後も増え続ける見込みか？ → YES なら、DWHの計算力で拡張できる ELT
分析の要件・切り口は頻繁に変わるか？ → YES なら、生データからやり直せる ELT
連携先はオンプレミスの基幹システムが中心か？ → YES なら、実績あるETLツールの方が接続性で有利な場合が多い

質問1は違い5（セキュリティ・ガバナンス）、質問2は違い2（処理性能）、質問3は違い4（柔軟性）にそれぞれ対応します。質問4だけは5つの違いではなくツールの成熟度の話です。なお、コスト構造（違い3）は方式を決めた結果としてついてくる面が大きいため、質問で絞り込んだ後に試算する項目と考えてください。

それぞれの方式が向くケースをまとめると、次のようになります。

ETLが向くケース：

個人情報・機微情報をDWHに生のまま置けない
オンプレミスのレガシーシステムとの連携が中心
データ量が小さく、分析要件もほぼ固定されている

ELTが向くケース：

大量データ（目安として日次数百万行以上）を扱う
分析要件が頻繁に変わり、過去データの再集計が多い
SQLを書けるメンバーがいて、データの民主化（エンジニア以外の社員も自分でデータを扱える状態）を進めたい

なお、実務では二者択一にしないケースも多くあります。Evastのプロジェクトでも、文字コード変換や個人情報の除外といった最低限の加工だけ転送ツール側で行い、ビジネスロジックを含む変換はdbtでDWH内に寄せる、というハイブリッド構成が定番です。

重要なのは「変換ロジックの本体をどこに集約するか」を最初に決めておくことです。

ETL／ELTを含むデータパイプライン全体の考え方や、バッチ／ストリーミングというもう1つの分類軸については、データパイプラインとは？ETLとの違いと仕組みを図解で解説で図解つきで整理しています。

ELT導入時の注意点：レイヤー設計とコスト管理が成否を分ける

ELTは「とりあえず全部DWHに入れられる」手軽さが魅力ですが、その手軽さが裏目に出る失敗も現場では頻繁に見かけます。導入時に押さえるべきポイントは3つです。

生データとマートの乱立を防ぐ：raw・staging・martの3層で管理する

ELT導入企業でもっとも多い失敗が、テーブルの無秩序な増殖です。実際に、運用開始から半年でテーブルが300個を超え、「売上の正しい集計がどれなのか誰もわからない」状態に陥った基盤の立て直しを支援したこともあります。

予防策は、レイヤードアーキテクチャ（データを役割ごとの層に分けて管理する設計）の採用です。図のように、DWH内をraw・staging・martの3層に分け、テーブル名の接頭辞で層を明示します。

データソースSaaS / DB / ログ

→

クラウドDWHの内部

raw層raw_◯◯
生データのまま保管

→

staging層stg_◯◯
型変換・クレンジング

→

mart層mart_◯◯
集計済み・分析用

→

BIツールダッシュボード

raw層（raw_）：データソースの生データをそのまま保管。手を加えない
staging層（stg_）：型変換・名寄せ・クレンジングを済ませた中間データ
mart層（mart_）：データマート（特定の分析用途向けに集計済みのテーブル群）。BIツールが参照するのはこの層だけ

従来型の構成にあてはめると、raw層がデータレイク（生データを加工せず安価に貯めておく置き場）、mart層がデータマートに相当します。かつては別々のシステムとして組んでいたこの3層を、ELTではDWH内部のレイヤーとして実現するわけです。

なお、同じ3層をDWH内部の「データレイク層・データウェアハウス層・データマート層」と呼ぶ流派もあります（『実践的データ基盤への処方箋』など日本の書籍でよく使われる命名です）。名前は違っても、役割分担はraw・staging・martとほぼ同じと考えて差し支えありません。

「BIや業務部門が触ってよいのはmart層のみ」と決めるだけでも、数字の食い違いと重複テーブルの大半は防げます。

クエリ課金を暴走させない：コスト管理は設計段階から組み込む

ELTでは変換や分析のクエリを実行するたびにDWHの計算コストが発生し、無対策だと月額費用が想定の数倍に膨らむことがあります。とくにBigQueryのオンデマンド料金はクエリがスキャンしたデータ量に応じた課金のため、生データへの全件クエリを毎日回すような使い方は禁物です。

mart層の集計テーブルを参照させる、テーブルを日付で分割するといった設計面の対策が有効です。具体的なテクニックはBigQueryのコスト最適化記事にまとめています。

raw層には個人情報が眠る：アクセス権限の設計を後回しにしない

生データを丸ごと取り込むELTでは、raw層に顧客の氏名・メールアドレスなどが含まれがちです。raw層へのアクセスをデータチームの数名に限定する、個人情報カラムにはDWHのマスキング機能を適用するといった権限設計を、運用開始前に済ませておきましょう。

「あとで整備しよう」と先送りした結果、全社員が生の顧客データを参照できる状態で監査の指摘を受ける——というのは、決して珍しくない失敗です。

まとめ：違いの本質は「変換の場所」、選ぶ基準は「ビジネス要件」

ETLとELTの違いと、ELTが主流になった理由を整理しました。要点は次の5つです。

違いの本質：変換をDWHの手前で行うのがETL、DWHの中で行うのがELT
5つの比較軸：変換の場所・処理性能・コスト構造・柔軟性・セキュリティで両者の向き不向きが分かれる
ELTが主流になった背景：クラウドDWHの性能向上と低価格化、dbtの登場、転送特化ツールの成熟
選び方：生データの取り扱い制約・データ量・要件の変化頻度・連携先で判断。ハイブリッドも有力
ELTの注意点：raw・staging・martのレイヤー設計、クエリコスト管理、権限設計を最初に固める

方式の選択はあくまで手段であり、出発点は「何のためにデータを使うのか」というビジネス要件です。要件を整理したうえで、自社のデータ量・体制・制約に合った方式を選んでください。この「何のためにデータを使うのか」を経営の視点から整理する考え方については、なぜ今データマネジメントが必要なのか？DX成功の本質を解説もあわせてご覧ください。

ETL／ELTの方式選定・データ基盤構築のご相談はEvastへ

株式会社Evastでは、ETL／ELTの方式選定からDWH構築、dbtによる変換パイプライン整備、BIダッシュボード開発まで、一貫したデータ基盤構築を支援しています。

「既存のETL基盤をELTに移行すべきか判断したい」
「ELTを導入したが、テーブルが乱立して管理しきれない」
「Modern Data Stackでデータ基盤をゼロから設計したい」

このようなお悩みがあれば、お気軽にご相談ください。現状診断からアーキテクチャ設計、移行計画の策定までを伴走します。

→ データ基盤構築サービスを見る → 無料相談を申し込む