データサイエンスの初学者向けの資格であるデータサイエンス検定。
2021年から開始した新設の資格で注目が集まるものの過去問も非公開なため、「どのように対策すればよいかわからない」といった方も多いのではないでしょうか?
本記事では現役のデータサイエンティストかつG検定講師に監修いただき、DS検定の難易度・勉強方法を徹底解説していきます。
編集部では他にもDS検定のおすすめ参考書・おすすめ講座の記事も公開していますので、気になる方はそちらもご覧ください!
監修者
經田 原弘
東京大学大学院新領域創成科学研究科複雑理工学専攻修了。大学時代は3次元の医療データの平滑化処理を研究テーマとし、大学院時代はJAXAと協業し、月探査機かぐやの衛星データから、月面上の水の存否について調査していた。新卒では株式会社リクルートにてレコメンドシステムの開発等に従事し、現在は製造業系スタートアップにてデータサイエンティストとして勤務。応用情報技術者試験・E資格合格者。
DS検定の試験概要
DS検定(データサイエンティスト検定)とは?
データサイエンティスト(DS検定)は、データサイエンス初学者向けに実務能力と知識を有することを証明する試験です。
データサイエンティスト協会はデータサイエンティストに必要なスキルを、①データサイエンス力、②データエンジニアリング力、③ビジネス力の3つに大別しています。
①データサイエンス力 | 情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力 |
②データエンジニアリング力 | データサイエンスを意味のある形に使えるように実装・運用できるようにする力 |
③ビジネス力 | 課題背景を理解した上でビジネス課題を整理し解決する力 |
DS検定の取得メリットは、3つのスキルに対して、見習いレベルの実務能力や知識、数理統計の知識を有していることを証明できることです。 数理統計の理解から、データ抽出・データベースなどの実装能力、プロジェクトマネジメントまで広くデータサイエンティストに必要となる基礎知識を網羅的に学ぶことが大きなメリットです。
DS検定の出題範囲
試験形式・問題
試験は選択式で90問、制限時間は90分です。記述や小論文等の問題はないため途中式の解答が必要なく、また問題としても数式を扱って答えを出すような問題は少ないですが、1問1分とスピーディに回答を作成する必要があります。
基本的には「用語の理解」や「大まかな分析手法の理解」など、数学よりも国語としての理解を問うものが多いため、入門向け(文系でも学習しやすい)資格です。
試験範囲は膨大!スキルチェックリストを活用して全体像を把握しよう
DS検定の試験範囲は、①スキルチェックリスト ②モデルカリキュラムの大きく2つから構成されています。2つとも一般公開されており、各単元でどのような理解が必要か・どのような難易度かまでしっかりと表にまとめられています。
- スキルチェックリスト
- モデルカリキュラム (リテラシーレベル) *今回の説明では割愛
スキルチェックリストは「データサイエンティスト協会 スキル定義委員会」が定義する、データサイエンティストが求められる知識・スキルをその名の通りチェックリスト形式でまとめたものです。
上述の「ビジネス力」「データサイエンス力」「データエンジニアリング力」の3分野に分け、それぞれの分野のスキルレベルとして、①業界を代表するレベル、②棟梁レベル、③独り立ちレベル、④見習いレベルの4段階を定義しています。
DS検定の出題範囲
チェックリストの数はビジネス力で114個、データサイエンス:271個、データエンジニアリングで144個と、全部で380項目もあります。この膨大なチェックリストの中の★がひとつの「アシスタントデータサイエンティスト」レベルに該当するのがDS検定の範囲になります。
スキルチェックリストの中で3つのスキルセットに対して、アシスタント(見習いレベル)のものをまとめたのが下記の表です。かなり広い試験範囲であることがわかります。
データサイエンス力 | 統計数理基礎、線形代数基礎、微分・積分基礎、集合論基礎、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、回帰・分類、評価、推定・検定、グルーピング、性質・関係性の把握、因果推論、サンプリング、データクレンジング、データ加工、特徴量エンジニアリング、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、時系列分析、機械学習、深層学習、自然言語処理、画像認識、映像認識、音声認識、パターン発見 |
データエンジニアリング力 | システム企画、システム設計、アーキテクチャ設計、クライアント技術、通信技術、データ抽出、データ収集、データ構造の基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、前処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、拡張プログラミング、アルゴリズム、分析プログラム、SQL、ITセキュリティの基礎知識、攻撃と防御手法、暗号化技術、認証、ソース管理、AutoML、MLOps、AIOps |
ビジネス力 | ビジネスマインド、データ・AI倫理、コンプライアンス、契約、MECE、構造化能力、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、AI活用検討、KPI、スコーピング、データ入手、分析アプローチ設計、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント |
DS検定とG検定の違いは?
G検定が機械学習の「歴史・概略・最新動向」だったのに対して、DS検定は「統計・分析・ビジネス」と実務寄りのものが多いです。
出題範囲のなかでG検定との大きな違いとなるのは「データエンジニアリング」、つまりSQLやER図というデータベースがらみの知識です。この領域はG検定ではほぼ出てこないので、実際にSQLを触ってみるなどして時間をかけて勉強した方が良いです。
ちなみに編集部では下記記事でER図の解説も行っておりますのでぜひ参考にしてみてください!
DS検定の難易度
次はDS検定の難易度を公開されている情報をもとにまとめていきます。また、統計検定やG検定など他のAI・統計系の資格受験を並行で検討されている方も多いと思いますので、他の資格との合格率・合格点の比較もします。
合格率・合格点
受検者数 | 約1400名 |
合格者数 | 927名 |
合格率 | 約66% |
合格ラインの目安 | 正答率約80% |
データサイエンス協会の公式HPによると、合格点は正答率80%が求められるため相当高い数値となっています。ただし、後述する通り受験者の多くは7割程度の正答率でも合格となっていることから、難易度により可変、または高めに公表している可能性があります。
まだ新設の資格で情報も少ない中、どれくらいの難易度の資格かパッとイメージがつかない方も多いでしょう。
そこで編集部で独自に調査し、データサイエンス・AI・統計の他の資格との合格率を比較し、まとめた表が下記になります。
他のデータサイエンス系資格との難易度の比較
資格名 | 合格率 | 合格点(正答率) | 合格者数 | 受験者数 |
---|---|---|---|---|
DS検定 | 66% | 80% | 927名 | 1,400名 |
G検定 | 62% | 非公開 | 4,198名 | 6,760名 |
E資格 | 75% | 非公開 | 872名 | 1,170名 |
統計検定2級 | 35% | 70% | 249名 | 731名 |
統計検定3級 | 76% | 70% | 242名 | 320名 |
ほか資格との合格率のみで単純比較をすると、G検定と同等程度の合格率であることがわかります。また受験者の総数を見ると、より専門的な実装が問われるE資格や数理知識を問われる統計検定よりも規模が大きく、割とマスを対象とした試験であることもわかるでしょう。
G検定とどちらが難しい?
詳細は後述にまとまっていますが、G検定・DS検定どちらも合格している人の合格者体験談をみてみると、G検定よりDS検定の方がやや簡単という声が多かったです。
理由の一つは問題形式。G検定は1問30秒というハイペースで回答しなければならないものの、DS検定は1問1分と比較的考える時間があります。
もう一つは試験範囲。G検定は機械学習の歴史や最新動向など、過去~現在の機械学習のトレンドを問う問題があり、DS検定はより普遍的な実務の基礎を扱うので簡単な印象だそうです。
DS検定の勉強方法・独学で合格可能?
DS検定の合格率は高いものの、2021年開始の新設資格のため「過去」に関する情報が少なく、傾向と対策を練りにくいことも特徴です。
そこで今回は編集部がGoogle検索で合格者体験談ブログを5つピックアップし、受験対象者の前提知識、学習にかかった勉強時間、勉強につかった手段(本、講座など)を具体的にまとめてみました。
DS検定の合格者体験ブログ
記事タイトル | 前提知識 | 勉強時間・勉強方法 | 勉強方法 |
---|---|---|---|
データサイエンティスト検定を受けてみた。勉強法と感想 | ・G検定保有者 ・実務経験なし | 2週間 | ・公式本 ・App |
DS検定を受験しました | ・G検定、E資格、統計検定2級、保有者 ・データサイエンスの実務経験はなし | 4週間 | ・本 ・講座 ・アプリ |
データサイエンティスト検定リテラシーレベルという試験を受けてみたのでレビューしてみます | ・G検定保有者 ・理系卒 | 2か月(約20時間) | ・講座 |
データサイエンティスト検定の受験体験記:G検定保有者向け | ・G検定保有者 | 30時間 | ・公式本 ・アプリ |
【速報】データサイエンティスト検定を受けてみた。 | ・データ分析実務経験あり | 10時間 | ・公式本 ・アプリ |
勉強時間は30時間程度・学習期間は4週間程度で合格可能
合格者体験談をベースにみていくと、DS検定は余裕を持っていたとしても勉強時間は10~30時間程度、期間は大体2週間~4週間程度で合格できることがわかります。
ただし、上記の対象者はほぼ全員が、G検定取得者または、実務で何かしらのデータ業務に携わったことがある方です。初めて受験される方にとっては、上記の学習範囲の通りかなり広い内容となっていますので、余裕を持って勉強をしましょう。
勉強方法は公式本で全体理解、講座・アプリで問題演習
DS検定合格者の体験談を読んでみると、勉強方法は「公式リファレンスブック」で全体像を理解し、「アプリ」+「講座」で練習問題を解いていくというパターンが多いです。
DS検定は試験範囲が広いことから、確かに公式リファレンスブックはかなり広く薄い内容になっており、演習問題の数としては少ないです。また、過去問も発売されていないことから、演習をしようと思うとオリジナル問題が豊富な講座を受講するか、アプリでの練習問題の活用がおすすめです。
DS検定のおすすめ参考書・対策本
ここからは編集部おすすめの参考書を紹介しています。
ちなみに下記記事ではより詳しく、DS検定の対策本を紹介した記事です。現役データサイエンティストの監修を受けて、対策本の選び方や、試験範囲であるPython・SQLなどへの応用も含めて網羅的に紹介していますので、詳細が気になる方はぜひこちらも参考ください。
【公式】最短突破 データサイエンティスト検定(リテラシーレベル)公式リファレンスブック
AI教育の専門スタートアップの「スキルアップAI」から公式対策本が出版されています。
公式の名前がついている通り、試験範囲の「スキルチェックシート」の各単元に対して1、2ページの解説が書かれており、網羅的に学習することができます。
模擬試験やサンプル問題なども各章末についており、試験の全体像や出題問題のざっくりとしたイメージをつかむには十分でしょう。
【公式問題集】徹底攻略データサイエンティスト検定問題集[リテラシーレベル]対応
こちらもデータサイエンティスト検定の公式の問題集になります。
前述の通り、データサイエンティスト検定では、データサイエンティストが求められる知識・スキルを「スキルチェックリスト」として公開しています。
検定問題集のありがたいところは、問題集で出ている問題がそのまま前述のスキルチェックリストのどこに当たるかがしっかりとわかることです。
自身のスキルがチェックリストの中のどこに対して足りていないかを適宜チェックしながら、合格点に近づけていきましょう。
合格対策 データサイエンティスト検定[リテラシーレベル]教科書
また、出題範囲に対してより多角的に理解を深めたい方は、2023年6月に新たに出版された「合格対策 データサイエンティスト検定[リテラシーレベル]教科書」の活用もおすすめです。
今までDS検定はG検定やITパスポートなどの他の資格と異なり教科書形式で解説する対策本が公式リファレンスブック以外になく、受験希望の方にとっては対策手段が限られる資格でしたが、公式リファレンスブックと同様の「単元の解説」+「模擬問題」形式で執筆がされています。
別の切り口からの解説を目にすることで、より理解が深まり対策が進むと思いますのでこちらもおすすめです。
DS検定のおすすめ講座3選
ここからは数あるDS検定対策講座のなかからおすすめをピックアップします。
ちなみに下記記事ではより詳しく、DS検定の対策講座を紹介しています。現役データサイエンティストの監修を受けて、対策講座の選び方や、どんな人におすすめかをしっかりと解説していますので、詳細が気になる方はぜひこちらも参考ください。
①Agarootアカデミー「DS検定対策講座」
講義時間 | 約9時間半 |
価格 | 29,800円~59,800円 |
受講期限 | 申込み日より120日 |
特徴 | ・数学知識の補填からできる・90問の模擬試験 ・講師と常に質疑応答できるコーチングオプション付き |
こんな人におすすめ | 念入りなサポートを受け、確実に合格したい |
講義の内容も数学の知識の補填から始まり、模擬試験、質疑応答まで、フルパッケージで合格に向けたフォローが非常に手厚い講座になっています。確実に合格したい方や、データサイエンス知識をしっかりと定着させたい方は特におすすめです。
②AVILEN「全人類がわかるDS検定対策コース」
講義時間 | 約10時間 |
価格 | 42,900円 |
受講期限 | 受講開始より1年間 |
特徴 | ・数学・プログラミング基礎を高校相当から学習・順序を適切に並び替え知識を補完することで、効率よく学べるカリキュラムに再編成・300問のWebテスト |
こんな人におすすめ | ひたすら問題を解いてきちんと理解したい |
演習問題の豊富さで選ぶならAVILENの「全人類がわかるDS検定対策コース」がおすすめです。前述のようにDS検定は検定開始から日が浅く、過去問が公開されていません。また、公式ガイドブック・過去問では問題数が足りていないことから、実際に合格するには
AVILENの講座は章立てごとに、動画視聴+小テストがついているため、動画視聴で学んだ理論をアウトプットして、定着させることが可能です。
③スキルアップAI「DS検定リテラシーレベル対応 データサイエンティスト基礎講座」
講義時間 | 約10.5時間 |
価格 | 無料~8800円 |
受講期限 | 受講開始より1年間 |
特徴 | ・DS検定運営元である一般社団法人データサイエンティスト協会が監修・無料でオンライン講座の受講が可能(オプションにて課金)・オリジナル模試の受験が可能 |
こんな人におすすめ | 費用を安く済ませたい方向け |
スキルアップAIの「DS検定リテラシーレベル対応 データサイエンティスト基礎講座」の特徴は、他の講座と比較して講座価格が各段に安いことです。講義時間も10.5時間と量的にも申し分ないですし、スキルアップAIはDS検定の問題集である「徹底攻略データサイエンティスト検定問題集」の著者でもあり、質的にも十分すぎる程です。
講座の内容は、「オンライン講座(無料で視聴可能)」+「講座資料+模試セット(有料)」という構成になっています。講座を資料で見たい場合や、Webでの模擬試験を受けたい場合は課金が必要です。
【アプリ】スキルアップAIが提供する「DS検定™リテラシーレベル対策アプリ」もおすすめ
スキルアップAIが提供するアプリ「DS検定™リテラシーレベル対策アプリ」もおすすめです。
スキルアップAIはDS検定の公式問題集のの著者でもあり信頼性もさることながら、110問のオリジナル問題・進捗管理機能がついて980円とかなりお手頃です。