データサイエンスの初学者向けの資格である統計検定データサイエンス基礎(以下、DS基礎と呼称)。
2021年から開始した新設の資格で注目が集まるものの、公式参考書も過去問もまだ出版されていないため「どのように対策すればよいかわからない」といった方も多いのではないでしょうか。
本記事では現役のデータサイエンティストかつG検定講師に監修いただき、自分に合うDS基礎の学習本の選び方と、おすすめ本をご紹介していきます。
監修者
經田 原弘
東京大学大学院新領域創成科学研究科複雑理工学専攻修了。大学時代は3次元の医療データの平滑化処理を研究テーマとし、大学院時代はJAXAと協業し、月探査機かぐやの衛星データから、月面上の水の存否について調査していた。新卒では株式会社リクルートにてレコメンドシステムの開発等に従事し、現在は製造業系スタートアップにてデータサイエンティストとして勤務。応用情報技術者試験・E資格合格者。
統計検定データサイエンス基礎の試験概要
統計検定とは?
「統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。
統計検定の各級の分類を行うと、大きく ①数理・統計知識が身につくもの ②統計調査の知識が身につくもの ③データサイエンティストとしての分析・実装能力が問われるもの の3つに分類できます。
身に付く知識 | 統計検定の分類 |
---|---|
数理・統計の知識が身につく | 統計検定4級~1級 |
統計調査の知識が身につく | 統計調査士、専門統計調査士 |
データサイエンスの知識が身につく | データサイエンス基礎・発展・エキスパート |
統計検定には、2021年から新たに「データサイエンス」が設置されており、基礎、発展、エキスパートの3段階で構成されています。統計検定データサイエンス基礎(以下、DS基礎と呼称)は、Excelを活用したデータ活用・分析に関する試験です。
試験名 | 使用ツール | 学べること |
---|---|---|
DS基礎 | Excel | Excelを活用したデータ処理・アナリティクス基礎 |
DS発展 | Python | 数理、計算、統計、倫理に関する大学教養レベルの内容 |
DSエキスパート | Python | 計算、統計、モデリング、領域知識に関する大学専門レベルの内容 |
試験形式・問題
試験はCBT方式で、問題数は45問程度・制限時間は90分です。1問あたり2分つかうことができますが、Excelを使って計算した結果を選択肢で選択、または数値入力する必要があるため、ひとつひとつ慎重に解答する必要があります。
出題範囲と必要なExcel操作
DS基礎では学んだ統計知識を身近なExcelというツールで応用することができ、実務に活かしやすいことが特徴です。統計検定2・3級で学んだ理論を活かす、実務寄りの資格といえるでしょう。
出題範囲
Excel操作 | 項目(学習しておくべき用語) |
---|---|
データのソート(並び替え) ピボットテーブル RAND 関数 データの分析 四則演算 IF 関数 | 構造化データ(レコード×フィールド、ケース×変数)、欠測値、データの結合、データ形式(ロングフォーマット⇔ワイドフォーマット)、データ抽出(ランダムサンプリング、無作為標本抽出) 、乱数、質的データ、量的データ、データの尺度、層別、水準(レベル)化、変数変換、Z 変換(標準化)、偏差値 |
グラフの作成 | 円グラフ、棒グラフ、折れ線グラフ、帯グラフ、ツリーマップ、パレート図、ヒストグラム、箱ひげ図等 |
SUM 関数 ピボットテーブル CHISQ.TEST 関数 | パレート表、パレート図、構成割合(確率)、累積度数(累積相対度数、累積確率)、クロス集計表、行(列)比率、セル比率、期待度数とカイ 2 乗統計量、連関係数、特化係数、多重クロス表 |
データの分析 AVERAGE 関数 VAR 関数 STDEV 関数 CORREL 関数 | 階級、階級値、標準階級幅、度数分布表、ヒストグラム、基本統計量(平均、標準偏差、分散、四分位数、パーセント点)、箱ひげ図、変動係数、管理図、外れ値、層別ヒストグラム、並列箱ひげ図、相関、相関係数、散布図、単回帰分析、重回帰分析、寄与率、回帰係数、標準回帰係数、残差 |
BINOM.DIST 関数 NORM.DIST 関数 NORM.S.DIST 関数 NORM.INV 関数 Z.TEST 関数 T.TEST 関数 CHI.DIST 関数 CHI.INV 関数 CONFIDENCE.NORM 関数 CONFIDENCE.T 関数 CHISQ.TEST 関数 データの分析 | 場合の数、確率、条件付き確率、ベイズの定理、尤度、事後確率、期待値、2項分布、正規分布、確率的シミュレーション、信頼区間、信頼率(信頼度)、標本誤差、標準誤差、母平均、母比率、帰無仮説、対立仮説、有意水準(危険率)、有意確率(p 値)、第一種の過誤、第二種の過誤、帰無仮説の棄却、2項検定、Z 検定、t検定、χ2 検定、AB テスト |
AVERAGE 関数 | 指数、移動平均、伸び率、成長率、平均成長率、季節調整 |
編集部ではDS基礎の難易度・勉強方法を詳細に解説した記事も提供していますので、参考にしたい方はこちらもご覧ください。
DS基礎の参考書の選び方
下記は編集部独自で公式ホームページや受験者の合格者体験談を調査してまとめた、「DS基礎の対策本の選び方」になります。
参考書の選び方
- 統計学を「Excelで学べる」本を選ぶ
- 演習問題やデータのダウンロードが可能
①統計学を「Excelで学べる」本を選ぶ
前述の通り、DS基礎は「統計学をExcelで実践する」試験ですので、「統計学」と「Excel」それぞれを深く勉強することが必要です。統計学だけを学んだとしてもExcelの関数がわからなければ、問題を解くことができませんので、Excelで統計学を学べる本を選びましょう。
そして、統計学の知識自体に不安がある方は一般的な統計学の本で補ったり、Excelの操作に不安がある方はそれぞれ専門書で補完すると効率よく勉強することができるでしょう。
統計学を基礎から勉強したい方には下記の『完全独習 統計学入門』がおすすめです。「これ以上何かを削ったら、統計学にならない」という、最小限の知識と簡単さで書かれた「超入門書」です。
また、編集部では統計学・データ分析をExcel学べるおすすめ書籍をまとめた記事も執筆しておりますので、ぜひそちらもご確認ください。
不安な方は数学の学び直しも忘れずに!
DS基礎は統計学の各単元を数式レベルで理解できている必要があります。
特に出題範囲である「ベイズの定理」「仮説検定」などは高校数学のⅢCや大学レベルの応用数学の知識が不可欠となっています。
「文系で数Ⅲ+Cを勉強していない」「しばらく数学から離れていて知識に不安がある」という方は数学の学び直しも忘れずにしましょう。
また、編集部では機械学習・データサイエンスに必要な数学を学べるおすすめ書籍をまとめた記事も執筆しておりますので、ぜひそちらもご確認ください。
②演習問題やデータのダウンロードは可能か
DS基礎ではExcelでの実践が求められるので、統計知識をただインプットするだけでなく、実際に手を動かして理解することが重要です。演習用のデータがついているものや、それをベースに演習できる対策本を選んだ方がよいでしょう。
DS基礎のおすすめ参考書7選
ここからは前述した選び方をもとに、編集部で厳選した参考書を紹介していきます。
- 統計学を「Excelで学べる」本を選ぶ
- 演習問題やデータのダウンロードは可能
*編集部おすすめの本にはセルを着色しています。
本のタイトル | 教材のレベル | 統計学について学べる | Excelについて学べる | 演習問題・データダウンロード |
---|---|---|---|---|
Excelで学ぶビジネスデータ分析の基礎 | ・初学者向け | ○ | ○ | ○(演習問題) |
Excelで学ぶビジネスデータ分析 | ・初学者向け | ○ | ○ | ○(演習問題) |
統計学の基礎から学ぶExcelデータ分析の全知識 | ・初学者~中級者 | ○ | ○ | ○(練習用のExcelファイル) |
完全独習 統計学入門 | ・初学者向け | ○ | × | ○(演習問題) |
データ分析の先生! 文系の私に超わかりやすく統計学を教えてください! | ・初学者向け | ○ | × | ○(書籍内で使用したデータのExcelファイル) |
統計学入門 (基礎統計学Ⅰ) | ・中級者向け(数学に自信のある方) | ○ | × | ○(演習問題) |
Excel 最強の教科書 | ・初学者~中級者 | × | ○ | ○(書籍内で使用したデータのExcelファイル) |
【おすすめ】Excelで学ぶビジネスデータ分析の基礎
まず紹介するのは、類似資格の「ビジネス統計スペシャリスト」の対策本である『Excelで学ぶビジネスデータ分析の基礎』です。
この本はまさに統計学をExcelで学ぶ本ですので、DS基礎の対策に非常におすすめです。
同資格「エクセル分析ベーシック」の出題範囲は「相関」「回帰分析」などDS基礎と被っている部分も多くあります。なお、初学者向けの本のため「平均」「最頻値」など基礎的な分野から学びたい方にとっても良い本といえるでしょう。
【おすすめ】Excelで学ぶビジネスデータ分析
こちらも同様に「ビジネス統計スペシャリスト」の対策本で、統計学をExcelで学ぶことができます。
ひとつ前に紹介した「Excelで学ぶビジネスデータ分析の基礎」との違いは、難易度が少し高くなっていることです。
「カイ二乗検定」や「回帰分析」など難易度の高いExcelのデータ分析の出題が多いため、『Excelで学ぶビジネスデータ分析の基礎』と併せて2冊学習することで、DS基礎の出題範囲を広くをカバーすることができるでしょう。
実際に統計検定公式HP記載の合格者体験談では「Excelで学ぶビジネスデータ分析の基礎」「Excelで学ぶビジネスデータ分析」を活用して合格したという記載もあるため、試験対策には有効といえそうです。
【おすすめ】統計学の基礎から学ぶExcelデータ分析の全知識
「統計学の基礎からしっかり学ぶ」「学んだことをExcelを使って実践する」という構成になっており、DS基礎の対策本として活用することができます。
ビジネスでの活用を前提にして、データ分析の基本的な考え方や全体像を分かりやすく解説しています。単にExcelの分析ツールや簡単な事例の解説にとどまらず、データ分析を支える統計学まで学ぶことができ、統計知識とExcel操作の基礎固めに最適といえるでしょう。
Excelの操作も一つひとつ画面を見せながら解説しているため、分析が初めてでも迷わず実践できます。DS基礎の内容を一冊で学びたい方、ビジネスで活用できるデータ分析を学びたい方は本書が非常におすすめです。
【必須・おすすめ】基礎から学ぶ統計学
統計学の基礎を学ぶにあたり、編集部が心からおすすめする参考書が「基礎から学ぶ統計学」です。2022年に発売されているのにもかかわらず、Amazonレビューがほかの統計系の書籍と比較しても、ほぼ最高評価(★4.7 *2023年7月時点)です。
著者は北海道大学で20年以上教鞭に立って理系学部2-3年への統計学講義を続けてきた実績があり、カリキュラムは「仮説検定」「相関分析」「単回帰分析」など統計検定2級程度の必須統計知識を非の打ち所がない王道です。
本書の特徴は、①とにかく数学のハードルが低く(高校1-2年程度)、初心者が学習を始めるにあたってのレベルがほどよく、②カラーかつ図でわかりやすく説明していることです。
金額を無視できるほどの高品質ですので、買っても自分の身の丈に合わず買い直すよりははるかによいでしょう。
【統計学の基礎固めなら】完全独習 統計学入門
「これ以上何かを削ったら、統計学にならない」という、最小限の知識と簡単さで書かれた「超入門書」なので、統計学を初めて学ぶ方に非常におすすめです。
中学校で習う数学(ルートと1次不等式)と丁寧な計算式の解説で、文系読者でも統計検定2〜3級の知識を独習することができます。
2部構成になっており、1部では「ヒストグラム」「標準偏差」など初歩からスタートしながらも、「検定」「区間推定」という統計学の最重要項目に最短時間で到達することを目指しています。
第2部では、第1部の内容を発展させ、t分布を使った小標本の検定・区間推定などデータ分析で活用する統計知識を身に付けることができます。
データ分析の先生! 文系の私に超わかりやすく統計学を教えてください!
「統計学ってそもそも何?」「統計学を学ぶと何にどう役立つの?」というような疑問から「推定」「重回帰分析」に至るまでわかりやすく統計学を説明しています。
対話形式で構成されているので、初学者が疑問を抱きやすい点を突っ込みながら学ぶことができます。
より詳しい解説や数式を使った導入などはないため、数字が苦手な「文系人間」を自負する方々はもちろん、統計学を初めて学ぶ方に非常におすすめです。
統計学入門 (基礎統計学Ⅰ)
長年愛されている統計学の定番ロングセラーであり、統計学の重要項目が網羅的にカバーされています。
主に統計検定2級相当の統計学をまとめた書籍となりますが、モーメント母関数や中心極限定理の導出など、統計検定1級に出るような内容も一部取り扱われています。
そのため、”入門”とありますが、統計学初学者には難解な内容が多いため、統計学の前提知識がある程度ある人、統計検定2級程度の統計知識を数式で理解したい人におすすめの一冊です。
Excelを使ったことがなく、Excel操作に不安のある方はExcelについて基礎から学べる下記の本もおすすめです。
Excel 最強の教科書
すぐに利用できるExcelの業務直結のノウハウを濃縮した一冊で、Excel操作を網羅的に学ぶことができます。
作業効率を劇的に改善できる時短ワザから、ワンランク上のデータ集計・分析テクニックまで、さまざまな用途で使えるExcelスキルを身に付けることができます。
データ分析はもちろん、「グラフ化の方法」や「データ管理するうえでの便利機能」も学び、Excelを使いこなせるようになりたい方には非常におすすめの一冊です。
ただ、統計学に関する内容はほぼないため、統計学の知識も学びたい方は、前述の『統計学の基礎から学ぶExcelデータ分析の全知識』の方がよいでしょう。
まとめ
DS基礎の本選び方やおすすめ対策本をご紹介してきました。自分に合いそうな対策本は見つかったでしょうか。
DS基礎試験の概要をさらに詳しく知りたいという方はこちらの記事もご覧ください。
また、データサイエンスについてさらに発展的な内容を学びたい方はDS発展の概要や勉強方法がわかるこちらの記事がおすすめです。
本記事でも紹介した通り、以下の2つが対策本を選ぶ上で非常に重要なポイントになります。
- 出題範囲のどの分野を学べるか
- 演習問題やデータのダウンロードは可能か
自分に合った対策本を見つけて、DS基礎最短合格を目指しましょう。