データサイエンスの初学者向けの資格である統計検定データサイエンス基礎(以下、DS基礎と呼称)。
2021年から開始した新設の資格で注目が集まるものの、公式参考書も過去問もまだ出版されていないため「どのように対策すればよいかわからない」といった方も多いのではないでしょうか。
本記事では現役のデータサイエンティストかつG検定講師に監修いただき、統計検定 DS基礎の難易度・勉強方法を徹底解説していきます。記事の最後にはおすすめの本・講座もご紹介していますので、ぜひ最後までご覧ください。
監修者
經田 原弘
東京大学大学院新領域創成科学研究科複雑理工学専攻修了。大学時代は3次元の医療データの平滑化処理を研究テーマとし、大学院時代はJAXAと協業し、月探査機かぐやの衛星データから、月面上の水の存否について調査していた。新卒では株式会社リクルートにてレコメンドシステムの開発等に従事し、現在は製造業系スタートアップにてデータサイエンティストとして勤務。応用情報技術者試験・E資格合格者。
統計検定データサイエンス基礎の試験概要
統計検定とは?
「統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。
統計検定の各級の分類を行うと、大きく ①数理・統計知識が身につくもの ②統計調査の知識が身につくもの ③データサイエンティストとしての分析・実装能力が問われるもの の3つに分類できます。
統計検定の種別
身に付く知識 | 統計検定の分類 |
---|---|
数理・統計の知識が身につく | 統計検定4級~1級 |
統計調査の知識が身につく | 統計調査士、専門統計調査士 |
データサイエンスの知識が身につく | データサイエンス基礎・発展・エキスパート |
統計検定には、2021年から新たに「データサイエンス」が設置されており、基礎、発展、エキスパートの3段階で構成されています。統計検定データサイエンス基礎(以下、DS基礎と呼称)は、Excelを活用したデータ活用・分析に関する試験です。
試験名 | 使用ツール | 学べること |
---|---|---|
DS基礎 | Excel | Excelを活用したデータ処理・アナリティクス基礎 |
DS発展 | Python | 数理、計算、統計、倫理に関する大学教養レベルの内容 |
DSエキスパート | Python | 計算、統計、モデリング、領域知識に関する大学専門レベルの内容 |
試験形式・問題
試験はCBT方式で、問題数は45問程度・制限時間は90分です。1問あたり2分つかうことができますが、Excelを使って計算した結果を選択肢で選択、または数値入力する必要があるため、ひとつひとつ慎重に解答する必要があります。
出題範囲と必要なExcel操作
DS基礎では統計知識をExcelで応用することを目指した資格です。例えば、試験範囲の「重回帰分析」「t検定」などは実務でもよく使用されますので、「明日からExcelで使える統計知識が幅広く身につく」という点で非常に投資対効果の高い資格だといえるでしょう。
Excel操作 | 項目(学習しておくべき用語) |
---|---|
データのソート(並び替え) ピボットテーブル RAND 関数 データの分析 四則演算 IF 関数 | 構造化データ(レコード×フィールド、ケース×変数)、欠測値、データの結合、データ形式(ロングフォーマット⇔ワイドフォーマット)、データ抽出(ランダムサンプリング、無作為標本抽出) 、乱数、質的データ、量的データ、データの尺度、層別、水準(レベル)化、変数変換、Z 変換(標準化)、偏差値 |
グラフの作成 | 円グラフ、棒グラフ、折れ線グラフ、帯グラフ、ツリーマップ、パレート図、ヒストグラム、箱ひげ図等 |
SUM 関数 ピボットテーブル CHISQ.TEST 関数 | パレート表、パレート図、構成割合(確率)、累積度数(累積相対度数、累積確率)、クロス集計表、行(列)比率、セル比率、期待度数とカイ 2 乗統計量、連関係数、特化係数、多重クロス表 |
データの分析 AVERAGE 関数 VAR 関数 STDEV 関数 CORREL 関数 | 階級、階級値、標準階級幅、度数分布表、ヒストグラム、基本統計量(平均、標準偏差、分散、四分位数、パーセント点)、箱ひげ図、変動係数、管理図、外れ値、層別ヒストグラム、並列箱ひげ図、相関、相関係数、散布図、単回帰分析、重回帰分析、寄与率、回帰係数、標準回帰係数、残差 |
BINOM.DIST 関数 NORM.DIST 関数 NORM.S.DIST 関数 NORM.INV 関数 Z.TEST 関数 T.TEST 関数 CHI.DIST 関数 CHI.INV 関数 CONFIDENCE.NORM 関数 CONFIDENCE.T 関数 CHISQ.TEST 関数 データの分析 | 場合の数、確率、条件付き確率、ベイズの定理、尤度、事後確率、期待値、2項分布、正規分布、確率的シミュレーション、信頼区間、信頼率(信頼度)、標本誤差、標準誤差、母平均、母比率、帰無仮説、対立仮説、有意水準(危険率)、有意確率(p 値)、第一種の過誤、第二種の過誤、帰無仮説の棄却、2項検定、Z 検定、t検定、χ2 検定、AB テスト |
AVERAGE 関数 | 指数、移動平均、伸び率、成長率、平均成長率、季節調整 |
統計検定2級とDS基礎の違いは?
類似資格である統計検定2級とは試験範囲も大きく被っている部分がありますが、異なる点は統計検定2級は「数式・計算など理論的な理解を問う」問題形式となっていますが、DS基礎ではその理論を「実践できるかどうかを問う」問題形式という点で大きく異なるといえるでしょう。
DS基礎の試験難易度
また求められる数学知識も統計検定3級程度と低く、リテラシーレベルの内容からスタートできるため、データサイエンス初学者が最初にとる資格としてはおすすめです。
試験ごとに求められる数学知識は以下の通りです。
試験名 | 求められる数学知識 | 項目例 |
---|---|---|
DS基礎 | 大学入試レベル | ・確率(数学A)・データの分析(数学Ⅰ) |
DS発展 | 大学基礎課程レベル | ・線形代数学・微積分・数列 |
DSエキスパート | 大学専門課程レベル | ・推測統計・計算統計・ベイズ理論・最適化 |
数学Ⅰ・数学A・数学B・数学Cと求められる数学知識は大学入試レベルと容易です。ただし、確率・線形代数・微積分など比較的難しい数学知識も必要なため、不安な方は数学の学び直しから始めるとよいでしょう。
数学の学び直しには下記の本がおすすめです。
また、編集部ではDS基礎対策にも使える、データサイエンスに必要な数学を学べるオススメ参考書を記事で紹介しています。興味のある方は下記リンクから確認ください。
DS基礎の勉強方法
2021年開始の新設資格のため「過去」に関する情報が少なく、公式問題集なども出版されていないため、傾向と対策を練りにくいことも特徴です。
そこで今回は編集部がGoogle検索で合格者体験談をピックアップし、受験対象者の前提知識、学習にかかった勉強時間、勉強につかった手段(本、講座など)を具体的にまとめてみました。
記事タイトル | 前提知識 | 勉強時間 | 勉強方法 |
---|---|---|---|
統計検定「データサイエンス基礎」の学習あと | 統計検定2級程度 | 20~30時間 | オープンデータを利用してのExcel操作 |
統計検定 合格者の声 | 統計検定2級程度? | ー | 出題範囲に類似した参考書の活用 |
DS基礎合格に必要な勉強時間
前提としてどの程度統計知識があるかにより、勉強時間が大きく変わります。統計検定2・3級程度の数理・統計知識を保持していれば、Excelを使って理論を実践していくことのみに集中して学習することができます。
DS基礎の勉強時間は、統計検定2級程度の知識を保持していれば15〜20時間程度・統計検定初挑戦であれば、40〜60時間くらいを見積るとよさそうです。
STEP①:出題範囲表から統計の「理論」を学ぶ
DS基礎合格者の体験談を読んでみると、勉強の進め方は、①統計学の基礎理論は本を通じて学び、②Excelで理論を実践するという2つのステップに分かれます。
まずは公開されている試験範囲を参考に、実際のExcel操作に移る前に、「項目(学習しておくべき用語)」について、用語の意味や理論的な部分、手法の用途などを一通り理解しましょう。
統計知識の学習には、下記の『完全独習 統計学入門』がおすすめです。中学校で習う数学(ルートと1次不等式)と丁寧な計算式の解説で、文系読者でも統計検定2〜3級の知識を独習することができます。
「標準偏差」「正規分布」などの統計学の基礎項目から「カイ二乗分布」「t分布」までDS基礎で出題される統計知識を幅広く学ぶことができるので、統計学初学者に非常におすすめです。
STEP②:とにかくExcelで手を動かしながら学ぶ
次は「統計理論」をExcelで手を動かしながら学習し、定着させていくことが必要になります。しかし上述の通り、DS基礎には公式の参考書や問題集が存在していません(2022年12月時点)。
そのため、合格者は類似資格の「ビジネス統計スペシャリスト」の公式対策本である『Excelで学ぶビジネスデータ分析の基礎』と『Excelで学ぶ 実践ビジネスデータ分析』を活用していました。
実際、統計検定DS基礎とビジネス統計スペシャリストは出題範囲がかぶっており、「仮説検定」「推定」などはビジネス統計スペシャリストの公式対策本からExcel操作を学ぶことができます。
ビジネス統計スペシャリストの対策本には章末問題も付いており、問題を通じてExcelの関数の使い方を学んでいくことができます。ビジネス統計スペシャリストの公式対策本が気になる方は下記のリンクから購入が可能です。
また、試験中は時間との戦いになることが想定されるため、効率的に進めるためにもピボットテーブル・ソート、ショートカットキーなど基本的なExcel操作がわからない方はまずそこから勉強をしましょう。Excelの基本操作を学ぶには下記の本がおすすめです。
DS基礎対策のおすすめ対策本・参考書3選
前述の通り、DS基礎は新設の資格であるため、試験対策となる参考書や公式問題集が存在していません(2022年12月時点)。
そのため、DS基礎の出題範囲と類似していて、DS基礎対策として活用できる本・参考書をここからは紹介していきます。
また、編集部では、DS基礎の対策本・参考書について「選び方」や「参考書を活用した勉強方法」などを、より詳しく下記の記事で解説しています。気になる方はぜひ下記の記事も参考にしてみてください。
おすすめ本➀:Excelで学ぶビジネスデータ分析の基礎
本書は「ビジネス統計スペシャリストエクセル分析ベーシック」の対策本ですが、「相関」「回帰分析」など出題範囲がDS基礎と被っている部分も多くあるため、DS基礎の対策本としておすすめです。
初学者向けの本のため「平均」「最頻値」など基礎から学びたい方にとっても良い本といえるでしょう。
また、各章の最後には章末問題があり、実際に手を動かしてExcelでのデータ分析を行えるため、学んだ内容を定着させることができます。
本書をマスターすることで統計学3級程度の知識とExcel操作を結び付けて理解できるようになるでしょう。
おすすめ本②:Excelで学ぶビジネスデータ分析
こちらも上記の本と同様に「ビジネス統計スペシャリスト」の対策本で、統計学をExcelで学ぶことができます。
ひとつ前に紹介した「Excelで学ぶビジネスデータ分析の基礎」との違いは、「カイ二乗検定」や「重回帰分析」など難易度の少し高い項目を取り扱っていることです。
『Excelで学ぶビジネスデータ分析の基礎』と併せて2冊学習することで、DS基礎の出題範囲を網羅的にカバーすることができるでしょう。
実際に統計検定公式HP記載されているDS基礎の合格者体験談では『Excelで学ぶビジネスデータ分析の基礎』と『Excelで学ぶビジネスデータ分析』を活用して合格したという方もいるため、試験対策には有効といえそうです。
おすすめ本➂:統計学の基礎から学ぶExcelデータ分析の全知識
「統計学の基礎からしっかり学ぶ」「学んだことをExcelを使って実践する」という構成になっており、DS基礎の対策本として活用することができます。
Excelの操作も一つひとつ画面を見せながら解説しているため、Excelでの分析が初めてでも迷わず実践できます。DS基礎の対策をしたい方はもちろん、ビジネスで活用できるデータ分析を学びたい方にも非常におすすめです。
また、Excelの分析ツールの解説だけでなく、データ分析に関連する統計知識まで学ぶことができ、統計知識とExcel操作の基礎固めに最適といえるでしょう。
DS基礎対策のおすすめ講座3選
おすすめ講座①:ちゃんと分かる推定と検定入門 ~データ分析のための統計学入門&実務スキル講座
DS基礎の出題範囲に含まれ、統計学の基礎項目である「正規分布」「母平均・母分数」「仮説検定」にフォーカスして学ぶことができます。
イラストやイメージ図を豊富に活用しており、上記の項目を数式をあまり使わずに学ぶことができるので、統計学初学者や数学の苦手な方におすすめです。
また、Excelを活用した演習問題もあるため、統計を学びつつ、統計に関するExcel操作も学ぶことができるので、DS基礎対策としても活用できます。
おすすめ講座②:はじめての統計(推定・検定編) 〜記述統計から推測統計へ!しっかり9時間、97レクチャーでデータ時代の入場券を手に入れる
9時間・97レクチャーの動画コースで「箱ひげ図」「分散」「標準偏差」などの統計学の基礎項目から、「仮説検定」までを学ぶことができます。
ただ、「回帰分析」「多変量解析」は解説していないため、DS基礎の出題範囲をすべて網羅できていませんが、統計学の基礎知識をしっかり学びたいという方に非常におすすめの講座です。
統計に対する抵抗感を3つ(①統計的発想の難しさ、②数学に対する抵抗感、③Excelなどの関数に対する抵抗感)に分け、それぞれを意識した対策・説明を行っているため、統計学に挫折したことのある方にもおすすめです。
おすすめ講座➂:[日本数学検定協会]データサイエンス数学ストラテジスト資格試験対策講座(中級・上級)
データサイエンス数学ストラテジスト対策の講座ですが、統計学で活用する数学の基礎を学べるので、数学が苦手な方におすすめの講座です。具体的には、「確率」「微分積分」「数列」など統計学を数式で学ぶうえで必要不可欠な数学知識を学ぶことができます。
また、数学に加えて、データサイエンスの知識や考え方を学ぶことで、データの信頼性を確かめる力、データからその意味を考える力、データに基づいて適切に意思決定する力を身につけることができます。
今後データ分析だけでなく、データサイエンスの知識を深めていきたいと考えてる方には数学とデータサイエンスの基礎を学ぶことができるので、非常におすすめです。
まとめ
DS基礎にフォーカスしてご紹介してきました。DS基礎の理解は深まったでしょうか。DS基礎では学んだ統計知識を身近なExcelというツールで応用することができるので、実務にすぐに活かすことができます。
編集部では、DS基礎の対策本・参考書について「選び方」や「参考書を活用した勉強方法」などを、より詳しく下記の記事で解説しています。気になる方はぜひ下記の記事も参考にしてみてください。
また、プログラミングなどを活用してDS基礎よりも深くデータ分析を学びたい方には「統計検定データサイエンス発展(DS発展)」がおすすめです。興味のある方はぜひこちらの記事もご覧ください。