【解説】DP-900の試験対策方法・重要サービスまとめ
私自身、以下の4つの試験対策を行い、DP-900に一発合格できました。別記事で合格体験記はまとめています。
特にWhizlabsのDP-900の問題集は難易度が高く、良質な問題集だったので、試験慣れできました。Whizlabsは、グローバルで評判のIT学習サイトで信頼度も高いためおすすめです。
- Microsoft Learnのコースをすべて受講
- WhizlabsのDP-900の問題集で知識のアウトプット
- 公式ドキュメントで知識の拡充
- Azure Data fundamentals(DP-900)の模擬試験で仕上げ
【対策1】試験ガイドで試験範囲と出題割合を把握する
Azure Data fundamentals(DP-900)の試験ガイドは必ず確認しましょう。各試験の出題内容や割合が詳細に記載されているので、試験ガイドに沿って対策することを強くお勧めします。
試験ガイドに記載のあるサービス内容や機能はひととおり説明できるレベルであれば、合格できる可能性が高いです。
【対策2】参考書や問題集を活用して、学習を進める
Azure Data fundamentals(DP-900)におすすめの参考書・問題集は別記事で紹介しています。
WhizlabsのDP-900の問題集は難易度が高く、良質な問題集だったので、試験慣れできました。Whizlabsの問題集は英語になりますが、Google翻訳やDeepLなどの高品質翻訳を利用すれば日本語の問題集とほぼ差はありません。
サンプル問題も用意されているので、Google翻訳で実際に試しながら利用を検討してみてください。
【対策3】公式ドキュメントでAzureサービスの理解を深める
Azureは資格試験用の公式ドキュメントが非常に充実しています。特にMicrosoft LearnのAzureトレーニングは、無料ながら試験対策として非常に役立つので利用をおすすめします。Microsoft LearnのAzureトレーニングの詳細内容は以下を参考にしてください。
【対策4】模擬試験を受験する(無料)
Azure Data fundamentals(DP-900)の模擬試験は必ず受験しましょう。本番の試験に近い難易度であり、ご自身の知識定着度をはかるのに非常に有益です。
日本語で模擬試験を受験する方法は以下のとおりです。
- Azure Data fundamentals(DP-900)の模擬試験にアクセス
- 左下の「日本語」をクリックし、「English (United States)」などに変更する
- Google翻訳で日本語訳する
DP-900の試験対策・重要サービスまとめ
【DP-900対策】AI基本知識
リアルタイムでのデータの追加、更新、削除といったトランザクションを処理するデータ処理方法
オンライントランザクション処理 (OLTP)
複雑なクエリや集計操作を行い、データのパターンや傾向を理解するのに役立つデータ処理方法
オンライン分析処理 (OLAP)
連続的に発生するデータストリームをリアルタイムに処理する方法
ストリーム処理
一定の量のデータをまとめて処理する方法
バッチ処理
データの要素や関係を明確に定義し、データの意味や目的を明示的に表現したデータ
構造化データ
ウェブのクローリングデータ、ログファイル、XML文書、JSONデータなどの形式でよく使用され、構造化されたデータと構造化されていないデータを含むデータ
半構造化データ
テキスト文書、画像、音声、ビデオ、ウェブページのテキストなど明確なデータ構造が存在せず、自由形式の情報やコンテンツを指すデータ
非構造化データ
データを列(フィールド)と行(レコード)から構成される複数のテーブルに分割し、テーブル間の関係を使用してデータを結びつけるデータベース
リレーショナルデータベース
データをテーブルや関係でなく、柔軟なデータモデルで表現するデータベース
非リレーショナルデータベース
非リレーショナルデータベースの1種で、データを一意のキーとそれに対応する値のペアで格納するデータモデルを持つデータベース
キーバリューデータベース
非リレーショナルデータベースの1種で、データをドキュメントの形式で格納し、階層的な構造を持つデータベース
ドキュメントデータベース
非リレーショナルデータベースの1種で、大規模なデータセットを効率的に管理できるデータベース
列ファミリデータベース(Column-Family Database)
非リレーショナルデータベースの1種で、ノード(頂点)とエッジ(辺)の関係性を重視したデータベース
グラフデータベース(Graph Database)
データベーストランザクションの特性を表すACIDを構成する4つの性質
- 原子性(Atomicity)
- 一貫性(Consistency)
- 分離性(Isolation)
- 持続性(Durability)
データベーストランザクションの特性を表すACIDを構成する性質で、トランザクションは不可分の単位として扱われ、途中でエラーが発生した場合はロールバックされ、以前の状態に戻す性質
原子性(Atomicity)
データベーストランザクションの特性を表すACIDを構成する性質で、トランザクションの実行前後で、データベースは一貫性のある状態を保持する性質
一貫性(Consistency)
データベーストランザクションの特性を表すACIDを構成する性質で、複数のトランザクションが同時に実行されている場合でも、各トランザクションは他のトランザクションと独立して実行される性質
分離性(Isolation)
データベーストランザクションの特性を表すACIDを構成する性質で、システムの故障や障害が発生しても、データの永続性が保つ性質
持続性(Durability)
大量のデータから情報を抽出し、分析および意思決定のためのインタラクティブな操作を可能にするデータ処理の手法
オンライン分析処理 (OLAP)
様々な種類や形式のデータを原始的な形式のままで保存し、大容量でスキーマレスに格納するためのアーキテクチャ
データレイク
さまざまなデータソースからデータを抽出し、統合・変換・整形した後に、構造化された形式で保存するためのアーキテクチャ
データウェアハウス
データを抽出し、データストレージにロードしてから、必要な変換を行うデータ処理方法
ELT(Extract, Load, Transform)
データレイク内のデータファイルを直接使用して、データの探索とモデル化を行うデータ関連の役割・担当者
データサイエンティスト
複雑なレポートと視覚化を生成するために、データウェアハウス内のテーブルに直接クエリを実行するデータ関連の役割・担当者
データアナリスト
レポートまたはダッシュボードの形式で、分析モデル内で事前に集計済みのデータを使用するデータ関連の役割・担当者
ビジネスユーザー
ユーザーにアクセス許可を割り当て、データのバックアップ コピーを格納してデータベースを管理し、障害が発生した場合にはデータを復元するデータ関連の役割・担当者
データベース管理者
組織全体のデータの統合、データクリーニングルーチンの適用、データガバナンスルールの特定、およびシステム間でデータ転送とデータ変換を行うパイプラインの実装に関して、インフラストラクチャとプロセスを管理するデータ関連の役割・担当者
データエンジニア
データを調査および分析して視覚化やグラフを作成し、組織が情報に基づいた意思決定を行えるようサポートするデータ関連の役割・担当者
データアナリスト
データベースの構造やスキーマを定義するために使用されるデータベース操作言語。CREATE、ALTER、DROPなどデータベース、テーブル、ビュー、インデックスなどの作成、変更、削除を行う。
DDL(Data Definition Language、データ定義言語)
データベースからデータを抽出するために使用されるデータベース操作言語。SELECTなどでクエリを実行してデータベース内のデータを取得、表示、フィルタリングする。
DQL(Data Query Language、データクエリ言語)
データベース内のデータの操作や変更を行うために使用されるデータベース操作言語。INSERT、UPDATE、DELETEなどデータの挿入、更新、削除などの操作を実行する。
DML(Data Manipulation Language、データ操作言語)
データベースのセキュリティやアクセス制御を管理するために使用されるデータベース操作言語。GRANT、REVOKEなどユーザーの作成、権限の付与、トランザクションの管理などを行う。
DCL(Data Control Language、データ制御言語)
データベース内のテーブルまたはクエリの結果セットを仮想的なテーブルとして表現するオブジェクト
ビュー
データベース内でのデータ処理、ビジネスロジックの実行、データの整合性の確保などで利用され、コマンドで実行できるSQLステートメントを定義するもの
ストアドプロシージャ(Stored Procedure)
データベース内でデータ処理や計算を効率的に実行するための重要な要素
関数(function)
テーブル内の各レコードを一意に特定するために使用され、データの整合性と参照の一貫性を確保するデータベーステーブル内の一意な識別子
主キー(Primary Key)
関連する2つのテーブル間の参照整合性を確保するために使用されるキー
外部キー(Foreign Key)
生データを分析に適した形式に変換およびマッピングするプロセス
ラングリング(Wrangling)
履歴データに基づいて、何が起きたかという質問に答えるのに役立つ分析手法
記述的分析(Descriptive Analysis)
データの変動やパターンの原因や要因を特定し、問題の根本原因や影響要因を明らかにするための分析手法
診断的分析(Diagnostic Analysis)
過去のデータから未来のイベントや傾向を予測するための分析手法
予測的分析(Predictive Analysis)
最適な行動や意思決定のための洞察を提供する分析手法
処方的分析(Prescriptive Analysis)
機械学習や人工知能の手法を使用して、データの解釈や理解を支援するための分析手法
認知的分析(Cognitive Analysis)
高速なデータ処理と柔軟性のある分析機能を提供し、大規模なデータセットを並列処理して処理できるオープンソースのクラスター処理フレームワーク
Apache Spark
バッチ処理に特化し、大規模なデータセットを処理・保存・分析するためのオープンソースのフレームワーク
Apache Hadoop
【DP-900対策】主要なAzureサービス
Microsoft SQL Server データベース エンジンに基づくリレーショナル データベースソリューションファミリの総称
Azure SQL
Azureでホストされるフルマネージドのサービスとしてのプラットフォーム (PaaS) データベース
Azure SQL Database
既存のSQL Serverワークロードのクラウド移行に適しており、自動メンテナンス機能を備えたSQL Serverのホストされたインスタンス
Azure SQL Managed Instance
Microsoft Azureクラウド上で実行される仮想マシン(VM)でSQL Serverエンジンをホストする仮想マシン
Azure SQL VM
オープンソースのPostgreSQL、MongoDB、Apache Cassandraをサポートするフルマネージドでサーバーレス分散型のNoSQLデータベース
Azure Cosmos DB
大容量の非構造化データ(画像、ビデオ、ドキュメントなど)を保存するためのオブジェクトストレージサービス
Azure Blob Storage
SMBやNFSプロトコルを利用し、クラウド上での共有ファイルシステムを提供するサービス
Azure Files
異なるデータソースからデータを収集し、変換し、ロードするためのワークフローやデータパイプラインを作成および管理するデータ統合サービス
Azure Data Factory
データウェアハウスやビッグ データシステム全体にわたって分析情報を取得する時間を早めるエンタープライズ分析サービス
Azure Synapse Analytics
Apache Sparkベースの高速でスケーラブルなクラウドベースの分析プラットフォーム
Azure Databricks
Apache Spark、Apache Hive、LLAP、Apache Kafka、Apache Hadoop などを使って、大量かつ高速のビッグデータフレームワークを簡単に実行できるエンタープライズ向け分析サービス
Azure HDInsight
データストリームからのリアルタイムデータの取得、変換、分析を行い、リアルタイムな洞察とアクションを可能にするサービス
Azure Stream Analytics
大量のデータをほぼリアルタイムで簡単に分析できるようにする、フルマネージドかつハイパフォーマンスなビッグデータ分析プラットフォーム
Azure Data Explorer
組織内のデータアセットの可視性と管理を向上させる、Microsoftのデータガバナンスおよびデータカタログサービス
Microsoft Purview
データソースからデータを収集し、洞察を得るために直感的なダッシュボード、レポート、視覚化ツールを提供するサービス
Microsoft Power BI
非構造化データや構造化データを保存し、データの処理や分析に使用されるデータレイクサービス
Azure DataLake Storage
構造化されたデータをキーバリューペア形式で保存し、大量のデータをスケーラブルに格納できるNoSQLデータストレージサービス
Azure Table Storage
Azure Cosmos DBのAPIの1つで、非構造化または半構造化データを効率的に処理できるAPI
Azure Cosmos DB for NoSQL
Azure Cosmos DBのAPIの1つで、データがバイナリJSON (BSON) 形式で格納される一般的なオープンソースデータベースを提供するAPI
Azure Cosmos DB for MongoDB
Azure Cosmos DBのAPIの1つで、PostgreSQLのグローバル分散リレーショナル データベースを提供するAPI
Azure Cosmos DB for PostgreSQL
Azure Cosmos DBのAPIの1つで、Azure Table Storageと同様に、キー値テーブル内のデータを操作するために利用されるAPI
Azure Cosmos DB for Table
Azure Cosmos DBのAPIの1つで、列ファミリストレージ構造を使用する一般的なオープンソースデータベースであるApache Cassandraと互換性のあるAPI
Azure Cosmos DB for Apache Cassandra
Azure Cosmos DBのAPIの1つで、グラフデータを効率的に保存、クエリ、操作できるAPI
Azure Cosmos DB for Apache Gremlin
データを取り込み、処理するためのパイプラインを作成できるAzureサービスを2つ
- Azure Data Factory
- Azure Synapse Analytics
パイプラインとは
1つのタスクを連携して実行するアクティビティの論理的なグループ
すべてのデータ ソースに共通のクエリ言語を使用して、テキスト ログ、Web サイト、IoT デバイスからの大量のデータのオンデマンド分析を実行できるサービス
Azure Data Explorer
高スループットで大量のイベントデータを受信、保存、処理するためのクラウドベースのイベントストリーミングプラットフォームサービス
Azure Event Hubs
Azure Data fundamentals(DP-900)に役立つ情報まとめ
DP-900の合格体験記
自身のAzure Data fundamentals(DP-900)の合格体験記を別記事でまとめています。
DP-900におすすめの参考書・問題集
Azure Data fundamentals(DP-900)におすすめの参考書・問題集を別記事でまとめているのでぜひ参考にしてください。
DP-900の難易度と勉強期間
Azure Data fundamentals(DP-900)の15個の合格体験記から難易度、勉強期間、勉強時間を調べてみたので、ぜひ参考にしてください。