その他サービス

Kinesis Data Firehose とは?S3 / Redshift へのストリーム配信

Amazon Kinesis Data Firehose は ストリーミングデータを S3 / Redshift / OpenSearch / Splunk / HTTP エンドポイントに自動配信するフルマネージドサービス。Kinesis Data Streams より シ...

ストリーミングデータを S3 / Redshift / OpenSearch / Splunk に簡単配信するサーバーレスサービス。


1. 概要(端的に)

Amazon Kinesis Data Firehose は ストリーミングデータを S3 / Redshift / OpenSearch / Splunk / HTTP エンドポイントに自動配信するフルマネージドサービス。Kinesis Data Streams より シンプル・サーバーレスで、コンシューマー実装不要。バッファリング・圧縮・暗号化・Lambda 変換に対応。


2. 何ができるか

  • 配信先:S3 / Redshift / OpenSearch / Splunk / HTTP
  • バッファリング:時間 or サイズ単位
  • データ変換:Lambda で変換・加工
  • データ圧縮:GZIP / Snappy
  • データ暗号化:KMS
  • フォーマット変換:JSON → Parquet / ORC

3. 特徴

観点特徴
追加料金取り込みデータ量
管理不要サーバーレス
遅延60 秒 〜 数分(バッファ依存)
対象S3 / Redshift / OpenSearch / Splunk

vs Kinesis Data Streams

観点FirehoseData Streams
用途配信特化リアルタイム処理
管理サーバーレスシャード管理
遅延60 秒〜サブ秒
保持なし(即時配信)24 時間〜

4. 仕組み

Firehose は プロデューサー → 内部バッファ → 配信先 のフロー。途中で Lambda 変換やフォーマット変換が挟める。


5. ユースケース

ユースケース 1:ログ収集

アプリログを S3 に集約 → Athena で分析。

ユースケース 2:データレイク投入

IoT データ → Parquet 変換 → S3。

ユースケース 3:リアルタイム分析

データ → OpenSearch → Kibana ダッシュボード。

ユースケース 4:監査ログ

CloudWatch Logs → Firehose → S3 長期保管。


6. 関連用語


7. 関連サイト


🎓 試験での出題傾向

試験重要度主な出題パターン
CLFストリーミング配信の概念
SAAデータレイク・ログ集約設計
DVAデータ変換実装
SOAログ運用