Pythonは豊富なライブラリやフレームワークを持ち、コードがシンプルであることから、データ分析・AI開発において、近年注目を集めているプログラミング言語です。
Python初学者の方におすすめしたいのがPythonでデータ分析をするときに活用するライブラリの基礎知識を学べる「Python3エンジニア認定データ分析試験」です。
しかしながら、Pythonの資格に関する教材は多く、「どの本で学習すべきかがわからない」「資格の試験範囲にとどまらず、+αのスキルを身に着けたい」という方も多いのではないでしょうか?
本記事では現役のデータサイエンティストの視点から、Python3エンジニア認定データ分析試験の参考書の選び方やおすすめ参考書を紹介していきます。
監修者
經田 原弘
東京大学大学院新領域創成科学研究科複雑理工学専攻修了。大学時代は3次元の医療データの平滑化処理を研究テーマとし、大学院時代はJAXAと協業し、月探査機かぐやの衛星データから、月面上の水の存否について調査していた。新卒では株式会社リクルートにてレコメンドシステムの開発等に従事し、現在は製造業系スタートアップにてデータサイエンティストとして勤務。応用情報技術者試験・E資格合格者。
Python3エンジニア認定データ分析試験とは?
試験概要
Python3エンジニア認定試験は全部で3段階あり、初級者向けの「Python3エンジニア認定基礎試験」と中級者向けの「Python3エンジニア認定データ分析試験」、上級者向けの「Python3エンジニア認定実践試験」の3段階で構成されています。
試験名 | 資格取得後にできること | 主な出題内容 |
---|---|---|
Python3エンジニア認定基礎試験 | ・Pythonの基本文法の理解ができる ・Pythonのデータ構造を理解して、基本的なコードを書けるようになる | ・データ構造(リスト型/集合型/辞書型/del文) ・制御構造ツール(if文/for文/break文/continue文など) |
Python3エンジニア認定データ分析試験 | ・ライブラリを活用してPythonで分析ができる | ・ライブラリによる分析実践(Numpy/Matplotlib/scikit-learnなど) ・数学の基礎知識(線形代数/確率/基礎解析など) |
Python3エンジニア認定実践試験 | ・高度なライブラリを活用して、Pythonでより高度なプログラム作成ができる ・パフォーマンスの最適化を考えられるようになる | ・Pythonの言語使用(例外処理/with文/ジェネレーター/デコレーターなど) ・Pythonのクラス(class構文/dataclass/オブジェクト関連関数など) ・データ型とアルゴリズム(二分法アルゴリズムの利用/イテレーターの組み合わせなど) |
中でも、Python3エンジニア認定データ分析試験はPythonでデータ分析を行うとき活用するライブラリを学ぶことができ、データサイエンティストへの「第一歩」となる試験です。
そのため、データサイエンティストを目指してる方やライブラリの基礎知識を網羅的に学習したい方に非常におすすめです。
編集部ではPython3エンジニア認定データ分析試験の取得メリットや合格者体験談がわかる記事や編集部おすすめの資格も紹介しております。興味のある方はぜひご覧ください。
Python3エンジニア認定データ分析試験対策の参考書の選び方
Python3エンジニア認定データ分析試験の出題範囲を学べる本は非常に多く出版されています。
自分に適した参考書を見つけるために、「選び方」を確認しておきましょう。まずは参考書を選ぶ際に必ずチェックしておきたい「3つのポイント」をご紹介します。
- 自分のレベルに合っている
- 豊富なサンプルデータ・例題で分析のイメージを掴める
- 代表的な4つのライブラリ(Numpy・pandas・Matplotlib・scikit-learn)を学べる
自分のレベルに合っている
Pythonのデータ分析の学習本は数多くあり、超入門レベルから専門技術書レベルまでさまざまな本が売られています。
初学者向けと謳いながらも、数学・統計などの関連知識を要したり、専門的な説明が多い本もあり、自身のレベルと参考書のレベルとマッチしているかをよく吟味する必要があります。
自身のデータ分析スキルを判断するヒントとして、編集部ではデータ分析スキルを3段階に分けた表を作成しました。
Pythonのデータ分析レベルとスキルセット
レベル | できることできること |
---|---|
初級レベル | ・MatplotlibやSeabornなどのライブラリを使った簡単なグラフの作成 ・NumpyやPandasを使った基本的な統計処理、仮説検定、回帰分析 ・Scikit-learnを使った基本的な機械学習アルゴリズムの実装 |
中級レベル | ・Pandasを使った時系列データの処理、ARIMA、VARモデルの活用 ・異常値の処理、外れ値の除去などデータクリーニング ・PlotlyやBokehを使った対話的なグラフの作成 |
上級レベル | ・DaskやApache Sparkを使った分散処理 ・ディープラーニングやAI開発への応用 ・GPUを使ったデータ分析の高速処理 |
たとえば、初学者でNumpyやpandasの活用で止まっている方は、データ分析の高速処理などの前に基本ライブラリの学習から始めたほうが効率の良い学習になります。
このように自身のデータ分析レベルを確認しながら、ひとつひとつを正しい順番で段階的に学んでいくと学習効率がよくなることが期待できます。まずは上記表を参考に現在のデータ分析スキルを把握して、適切なレベルの参考書を選びましょう。
豊富なサンプルデータ・例題で分析のイメージを掴める
2つ目のポイントは、豊富なサンプルデータや例題で分析の活用場面や分析手法のイメージを掴める参考書を選ぶことです。
Pythonのデータ分析を学習するとき、データ分析の手法を網羅的に学習するだけでは、どのようなデータ・場面で活用できるのかイメージが湧きにくく、あいまいな理解になりがちです。
そんな時は、サンプルデータや例題が豊富に提供されているような本を選びましょう。
データ分析は実際の分析例と併せて学習することで、どのようなデータのとき、どのようなコード・ライブラリを使って分析するのか、といった分析イメージがつきやすくなり、理解が深まります。
たとえば、ただ単にmatplotlibを使ってグラフ作成の方法を学ぶより、ウェブサイトのアクセスログのデータを例に地域ごとのアクセス数をmatplotlibを使ってグラフ作成する方が分析イメージがつきやすいでしょう。
さらに、自身で手を動かして学習することで、理解している点・理解できていない点を判断することができ、自身の理解度を正しく測ることができます。
代表的な4つのライブラリ(Numpy・pandas・Matplotlib・scikit-learn)を学べる
3つ目のポイントはNumpy・pandas・Matplotlib・scikit-learnのライブラリを学べる参考書を選ぶことです。
Python3エンジニア認定データ分析試験ではNumpy・pandas・Matplotlib・scikit-learnの4つのライブラリが出題の67.5%を占めるため、この4つのライブラリの学習は合格に必要不可欠です。
さらに、上記4つのライブラリはPythonのデータ分析において非常に重要な処理を行えるので、データ分析を行う上でも必要不可欠な知識です。
たとえば、上記ライブラリの活用で以下のようなことができるようになります。
ライブラリ | できること |
---|---|
Numpy | ・シミュレーション:物理学や統計学などの分野でシミュレーションを実行する ・数値計算:多次元配列の要素ごとの演算やベクトル・行列の内積を計算 ・データの前処理:データを配列の形式に変換する |
pandas | ・データの分析:データの統計量を計算したり、グループ化したデータの集計 ・データの読み込み:CSVファイルやExcelファイルからデータを読み込む ・データの加工:データの欠損値を補完する |
Matplotlib | ・折れ線グラフの描画:時系列データの折れ線グラフを描く ・散布図の描画:2次元データの散布図を描く |
scikit-learn | ・モデルの評価:クロスバリデーションや混同行列を使った評価 ・データの前処理:データの正規化や標準化を行う |
上記表のように、4つのライブラリを活用することで、データの前処理やデータ分析のグラフ化などデータ分析するために必要な処理が可能になります。
データ分析を学習する方にとって4つのライブラリを学習できる参考書を選ぶことは大切なポイントといえるでしょう。
Python3エンジニア認定データ分析試験を学ぶ参考書5選
ここからは編集部が厳選したPython3エンジニア認定データ分析試験の学習におすすめの良書を紹介していきます。
試験範囲に必要な前提知識をつける事前学習的な本から、試験範囲に加えて+αで、学んでおくと実務に使える本までひとつずつ紹介していきます。
【超初心者向け】Pythonスタートブック
Python初学者がいきなりデータ分析の学習を始めると専門用語も多く、つまずく場合もあるかもしれません。そのため、Pythonの基礎知識に不安のある方は本書でPythonの基礎固めをしましょう。
本書はPythonの特徴や活用方法の説明にはじまり、データ構造や条件分岐など、Pythonでプログラム作成するための必須知識まで順序立てて体系的に学ぶことができます。
体系的に学ぶことで、ひとつひとつの知識を関連付けて学べるので、学習内容が頭に残りやすくなります。そのため、データ分析の学習に進んだとき、手戻りせずに学習を進めることができます。
実際にAmazonレビューを見てみるとわかる通り、Python初学者でもプログラムのイメージが直感的に理解できるイラストが豊富にあるので、わかりやすいとPython初学者から非常に人気を集めています。
【試験対策に必須の1冊】Pythonによるあたらしいデータ分析の教科書
Python3エンジニア認定データ分析試験の出題範囲となっている本書は学習内容がそのまま試験で出題されるため、試験対策に必須の一冊です。
とくに、「Numpy」「pandas」「Matplotlib」「scikit-learn」の4つのライブラリを中心に学ぶことができるので、出題範囲のカバーはもちろん、Pythonでデータ分析を行なうための基礎知識をマスターできます。
さらに、データ分析で必要な数学知識やデータの収集・加工方法も学ぶことができるので、データ分析の応用知識を学習する際、手戻りなく学習を進めることができるようになります。
【おすすめ】Python 実践データ分析 100本ノック
本書は実務のデータをもとに、データ分析手法を約100パターンも学習できるため、Pythonのデータ分析スキルを実務ですぐに活かしたいという方に非常におすすめです。
データ分析手法と実際のデータを結びつけて学ぶことができますし、パターン別に演習できるので、理解が深まりやすい点が本書のメリットです。
Python3エンジニア認定データ分析試験で出題されるPandas・Numpy ・matplotlib・scikit-learn の4つのライブラリも学習できるので、ライブラリ学習の基礎固めとして初学者におすすめです。
さらに、上記のライブラリ以外にも実務で活用場面の多い以下のライブラリも学習することができます。
・輸送ルートなど最適化計算を行うライブラリ:pulp・ortoolpy
・アンケート結果を自動で分析できるライブラリ:MeCab・Janome
本書でデータ分析を一通り学習すると、データ分析手法を目的別に構造化できるようになるので、目的に合ったデータ分析を瞬時に行えるようになり、実務でデータ分析の即戦力として活躍できるでしょう。
Pythonデータサイエンスハンドブック
本資格で出題の67.5%を占めているNumpy・pandas・Matplotlib・scikit-learnの4つのライブラリについて基礎から応用まで学ぶことができるので、試験対策としておすすめです。
各章のモジュールはサンプルコード付きで解説されており、「 基礎事項→使用例(事例) 」 のように、ひとつひとつ実際の使用例が記載されているので、具体的なイメージを持って理解することができます。
さらに、本書はランダムフォレストや主成分分析(PDA)など機械学習の基礎知識も学ぶことができるので、今後ディープラーニングやAI開発を行いたい方にとってはよい土台作りとなるでしょう。
ただし、Pythonの基本文法や統計学の知識を必要とする解説も多いため、Pythonや統計学の基礎知識がある方に非常におすすめです。
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
データ分析するとき、データの前処理に必要不可欠なpandas・Numpyの基礎から応用までを学ぶことができるので、データ分析初学者に非常におすすめの一冊です。
タイトルにはpandas・Numpyのみの記載ですが、試験範囲であるmatplotlib・scikit-learnのライブラリについても学習できるので、ライブラリの出題部分をすべてマスターできます。
基礎から応用まで体系的に学習できるので、Python初学者の方でも、つまずくことなく学習を進めることができます。
さらに、Numpy・Pandasの2つのライブラリのサンプルコードが豊富に書かれており、Jupyter Notebookのサンプルもダウンロード可能なので、実際に手を動かしながら学習したい方にもおすすめです。
ただし、ライブラリの解説は初学者向けですが、Pythonの基本文法やコードの書き方などの解説はほぼないため、Pythonの基礎知識を有している方におすすめです。
まとめ
Python3エンジニア認定データ分析試験の対策本・参考書の選び方のポイントやおすすめ参考書を紹介してきました。自分に合った参考書は見つかったでしょうか。
Python3エンジニア認定データ分析試験はPythonでデータ分析を行うために欠かせないライブラリを学ぶことができ、データサイエンティストへの「第一歩」となる試験です。
今後データサイエンス学習を深めていきたい方はぜひ受験してみましょう。
編集部ではPythonに関連する記事をほかにも公開しています。Python資格の種類やPython資格の取得メリットを知りたい方はぜひこちらの記事もご覧ください。