データサイエンスを学ぶのであれば基礎中の基礎となる数学ですが、「どこから学び直せばよいかわからない」という方も多いのが事実。
そんな方におすすめしたいのが、データサイエンスにつかう数学のみに絞って出題する資格試験「データサイエンス数学ストラテジスト」です。
しかしながら、試験範囲の幅広さとは裏腹に公式対策本は中級・上級各1冊のみの上に、解説は限定的で何をどのように選べばよいかわからない方も多いのではないでしょうか?
本記事では現役データサイエンティスト兼資格講師が、データサイエンス数学ストラテジストの中級・上級の対策に必要な参考書の選び方や具体的な参考書を紹介していきます。
監修者
經田 原弘
東京大学大学院新領域創成科学研究科複雑理工学専攻修了。大学時代は3次元の医療データの平滑化処理を研究テーマとし、大学院時代はJAXAと協業し、月探査機かぐやの衛星データから、月面上の水の存否について調査していた。新卒では株式会社リクルートにてレコメンドシステムの開発等に従事し、現在は製造業系スタートアップにてデータサイエンティストとして勤務。応用情報技術者試験・E資格合格者。
データサイエンス数学ストラテジストとは?
まずはデータサイエンス数学ストラテジストの試験概要をみていきましょう。
試験概要
データサイエンス数学ストラテジストはデータサイエンスの基盤となる数学スキルを問う資格試験です。
運営母体の日本数学検定協会は「実用数学技能検定、通称(数検)」を30年以上運営しており、カリキュラムへの一定の信頼性・権威性があります。
中級と上級の2種階級があり、データサイエンスの基盤となる基礎的な数学(確率統計・線形代数・微分積分など)と実践的な数学(機械学習系・アルゴリズム系・ビジネス系数学など)の習熟度・理解度を測定する問題を出題します。
データサイエンスにつかう数学を「正しい順番で、正しい量」学ぶことで、再度の学び直しや学習モレを防ぐことができることが資格取得の大きな意味となるでしょう。
出題範囲・難易度
データサイエンス数学ストラテジストは中級・上級の二段階に分かれており、それぞれ試験範囲が大きく異なります。ここで押さえておきたいポイントは各級(中級・上級)で難易度が大きく変わるということです。
データサイエンス数学ストラテジストの中級・上級の違いは「①数学のレベル」と「②出題の構成比」の2点です。
違い①:出題の構成比
具体的な出題範囲の違いをまとめたのが下記の表です。
中級・上級ともに「数学」の配分は50%ずつ、その他(機械・深層学習、アルゴリズム・プログラミング、ビジネス)の構成比が中級はそれぞれ16.7%ずつなのに対して、上級は機械・深層学習の配分が多くなっています。
学習分野 | 詳細 | 構成比(中級) | 構成比(上級) |
---|---|---|---|
AI・データサイエンスを支える計算能力と数学的理論の理解 | 確率統計系分野(統計・確率・場合の数など) 線形代数系分野(行列・ベクトルなど) 微分積分系分野(微積分・関数・写像など) | 50% | 50% |
機械学習・深層学習の数学的理論の理解 | 基礎理論(活性化関数・類似度・最小二乗法) 機械学習(回帰・分類・クラスタリングなど) 深層学習(ニューラルネットワークなど) | 16.7% | 25% |
アルゴリズム・プログラミングに必要な数学リテラシー | アルゴリズム(探索・ソート・暗号、計算量) プログラミング言語に依存しない手続き型思考 数学的課題解決(論理的思考+数学的発想) | 16.7% | 12.5% |
ビジネスにおいて数学技能を活用する能力 | 把握力(データ・グラフの特徴の把握など) 分析力(売上・損益等財務的な分析など) 予測力(データに基づいた業績予測など) | 16.7% | 12.5% |
違い②:数学のレベル
中級・上級ともに学習の分野としては同一ですので若干混乱もありますが、求められる数学のレベルが異なります。
中級は高校1年レベルの数学なのに対して、上級は大学1〜2年度の基礎数学の知識が満遍なく出題されるため、大学入試で理系を学んでいない場合は勉強時間をかなり多く見積もる必要があります。
上級は想定以上に範囲も広く(極限、微積分、三角関数、指数・対数関数、2項定理など)計算の多いヘビーな問題も多く出題されるため、合格者でも時間が足りないという方も多いです。
試験レベル | 高等教育でのカリキュラム | 数検で表したときのレベル |
---|---|---|
中級 | 数学Ⅰ・Aまで | 数検準2級程度 |
上級 | 大学初学年程度まで | 数検2級・準1級 |
編集部ではデータサイエンス数学ストラテジストの難易度や勉強方法を詳細にまとめた記事や、データサイエンスに必要な数学を学ぶためのおすすめ参考書を解説した記事も用意していますので、気になる方は下記のリンクからご一読ください。
データサイエンス数学ストラテジストの参考書の選び方
「数学」を解説する本はたくさんあり、出題範囲を網羅するために参考書を余分に買いすぎてしまったり、難易度が合わないこともしばしば……。
ここからは編集部独自で公式HPや受験者の合格者体験談を調査してまとめた、データサイエンス数学ストラテジストの対策本の選び方」を紹介していきます。
- 学習目的に合わせて参考書を変える
- 問題数の多い過去問でとにかく反復練習
- 上位資格・類似資格の取得を見据えた教科書を選ぶ
選び方①:学習目的に合わせて参考書を変える
筆者がおすすめするのは、目的とする勉強方法に併せて参考書を変えていく勉強方法です。
データサイエンス数学ストラテジストという一つの資格への対策の方法を細分化し、各参考書で対策方法の位置づけを変えていき、対策を効果的なものにしていきましょう。
そして、学習する上で先んじて絶対に確認したいのが、自身の数学知識のレベル。特に上級は高校数学がわかることが前提となっており、数学ができる人とそうでない人で学習時間が大きく変わってきます。
下記は合格者が実際に使っていた本を参考に、試験範囲に含まれる学習分野・各参考書のすみわけを簡単に記載したのが下記の表になります。
学習分野 | 本のタイトル |
---|---|
微分・積分 | 解析入門 Ⅰ(基礎数学2) |
線形代数 | 線型代数入門 (松坂和夫 数学入門シリーズ 2) |
確率・統計 | 確率・統計入門 |
機械学習・深層学習 | ディープラーニングAIはどのように学習し、推論しているのか |
選び方②:問題数の多い過去問でとにかく反復練習
データサイエンス数学ストラテジストは語句の意味を問われるような設問は少なく、下記のサンプル問題のように実際に数式を活用して応用的に問題を解いていくことが求められます。加えて問題数も非常に多く、数式を素早く思い出し計算していく力も必要になります。
サンプル問題(上級)
過去問を活用して、「この問題にはこの数式を充てれば解答が導ける」というパターン認識ができるようになるレベルまで、問題集を反復していくことが重要です。
選び方③:上位資格・類似資格の取得を見据えた教科書を選ぶ
中級を受験する方は上級を見据えて参考書を選んだり、統計・データサイエンス系の類似の資格である「統計検定2級」や「データサイエンティスト検定」などの受験にも応用の効く本を選ぶこともおすすめです。
ちなみに統計検定2級とは試験範囲との重複が多いため、試験範囲のなかの「確率・統計」や「微分・積分」は統計検定の参考書を流用して学習すると効率的です。
DS数学ストラテジストのおすすめ参考書
ここからは前述した「選び方」に即した観点で編集部がデータサイエンス数学ストラテジスト対策に使える!と自信を持っておすすめできる本を紹介していきます。
【中級も上級も必須】データサイエンス数学ストラテジスト公式問題集
合格者体験談を見る限り、ほぼ100%の受験者が活用しており、中級も上級も受験者には必須の参考書です。
公式ホームページでは出題範囲は詳しく載っていないため、実質的にはここで詳細に確認していくことが必要となります。問題と解説が80問掲載されており、全範囲をさらうには十分です。
ただし前提が省略されて説明されていたりと、各分野を深く理解する際には補足として専門教材を活用しましょう。
また、公式問題集には誤値が多いため、公式ホームページで正誤表(解答の訂正)が公開されています。疑問を感じたら、こちらを参照しながら解答を進めましょう。
【中級】中3数学をひとつひとつわかりやすく。改訂版
中級の出題範囲は高校1年レベル(数学I+ A)までのため、中学数学も多く出題されます。
文系出身者や大学受験から日が遠くなってしまった方などは、正直に中学数学からの学び直しが必要な方もいらっしゃるでしょう。
方程式や平方根の計算などが抜け落ちていた場合、「問題の解説を読んでも式の変換が理解できない」ことも起こり得ます。
本書はレビューの高さ(星5つ中の4.3 *2023年2月時点)もさることながら、1回の単元に必要な勉強時間は約15分でイラストを用いて要点をわかりやすく説明しています。
実際に中級合格者も学び直しに活用していることから、学習範囲の補填に本書の活用も有効といえそうです。
【確率・統計】完全独習 統計学入門
「これ以上何かを削ったら、統計学にならない」という、最小限の知識と簡単さで書かれた「超入門書」なので、統計学を初めて学ぶ方に非常におすすめです。
中学校で習う数学(ルートと1次不等式)から解説してもらえるなど計算式の解説が丁寧であることから、文系読者でも統計検定2〜3級の知識を独習することができます。
2部構成になっており、1部では「ヒストグラム」「標準偏差」など初歩からスタートしながらも、2級の出題範囲である「検定」「区間推定」という統計学の最重要項目に最短時間で到達することを目指しています。
第2部では、第1部の内容を発展させ、t分布を使った小標本の検定・区間推定などデータ分析で活用する統計知識を身に付けることができます。
【線形代数・微分積分】やさしく学べる基礎数学―線形代数・微分積分―
本書を活用するメリットは高校数学~大学数学まで一気通貫で段階的に学べることです。
コンセプトの「やさしく学べる」という言葉通り、序盤は四則演算の延長に過ぎないような計算難易度から始まります。
途中式が省略されずに丁寧に書かれていることや図やグラフが多く、直感的に理解しやすいこともあり、学び直すためのハードルが極限まで下がっているほんといえるでしょう。高校数学が苦手だった大学生にも分かるよう丁寧に解説されていることが特徴です。
年数が経った本にしては珍しくKindle版で購入できることもおすすめのポイントです。3冊買ったとしても、かさばらないことも本を持ちたくない方にとってはメリットでしょう。
また、「やさしく学べるシリーズ」のおすすめポイントは「微分積分」「線形代数」「微分方程式」など、まさにデータサイエンティストに必要な「数学」を網羅的に学ぶことができることです。
本書は線形代数と微分積分がまとめて一冊になっていますが、線形代数・微分積分を1冊で深く解説している本もあります。より集中して学びたい方はそちらも参考にしてみてください。