Python 3 エンジニア認定データ分析試験に合格しましたので、備忘録を残しておきます。 2022年5月に合格後、投稿を失念しておりました。
Python 3 エンジニア認定データ分析試験とは
一般社団法人Pythonエンジニア育成推進協会が実施する、プログラミング言語Pythonの試験です。
公式サイトでは、次のように説明されています。
概要:Pythonを使ったデータ分析の基礎や方法を問う試験
試験情報は以下のとおりです。
項目 | 情報 |
---|---|
問題数 | 40問(すべて選択式) |
試験形式 | テストセンターでのCBT(Computer Based Testing)形式 |
試験時間 | 60分 |
受験料 | 一般11,000円(税込) 学生5,500円(税込) |
出題範囲 | 翔泳社「Pythonによるあたらしいデータ分析の教科書」 より範囲・割合を指定して出題 |
受験のきっかけ
G検定に合格後、社内推奨資格を眺めていたところ目を引いたのが、この試験でした。 試験を調べてみると、G検定で学習した内容との関連も多いことがわかりました。 関連する内容を忘れる前に、この試験を受験してみることとしました。
情報検索
学習の前に公式サイトや合格体験記を調べてみました。特徴的な点がいくつかありました。
- 試験は、指定書籍から範囲・割合が指定された上で出題される
- キャンペーンを活用すると、書籍プレゼントや不合格時に無料再受験できる
- ITパスポートや基本情報などの次のステップ等で受ける方も多い
上記から、実際の合格率などは不明なものの、それほど難易度は高くないのではと考えました。 また、条件を満たせば再受験も無料なので気軽に挑戦してみることにしました。
学習開始
今回は指定書籍からの出題となるため、指定書籍のみ購入しました。
Pythonによるあたらしいデータ分析の教科書
下記の出題範囲とのことで、先頭ページから順に4章までの学習を進めていく方針としました。
章 | 節 | 問題数 | 問題割合 | |
---|---|---|---|---|
1 | データエンジニアの役割 | 2 | 5.00% | |
2 | Pythonと環境 | |||
1 | 実行環境構築 | 1 | 2.50% | |
2 | Pythonの基礎 | 3 | 7.50% | |
3 | Jupyter Notebook | 1 | 2.50% | |
3 | 数学の基礎 | |||
1 | 数式を読むための基礎知識 | 1 | 2.50% | |
2 | 線形代数 | 2 | 5.00% | |
3 | 基礎解析 | 1 | 2.50% | |
4 | 確率と統計 | 2 | 5.00% | |
4 | ライブラリによる分析実践 | |||
1 | NumPy | 6 | 15.00% | |
2 | pandas | 7 | 17.50% | |
3 | Matplotlib | 6 | 15.00% | |
4 | scikit-learn | 8 | 20.00% | |
5 | 応用: データ収集と加工 | 0 | 0.00% |
この書籍では、すべてのプログラムに実行例が記載されており、読むだけでも学習はできそうでした。 私はPythonの経験がなく、業務でもプログラミングから縁遠いため、環境を構築して順に学習を進めることにしました。
学習環境
- iPad Pro 10.5
- Carnets - Jupyter (with scipy)
自宅以外の環境でも気軽に学習できるように、iPad上のみで学習を行いました。
注意事項
学習記録
- 03/08 書籍購入
- 03/25頃 1週目読了(4章までの各項目の動作確認)
- 03/26頃 模擬試験実施、写経しただけであまり理解していないと認識
- 05/04頃 2週目読了、模擬試験実施
- 複数回実施し、コンスタントに8-9割正解
- PRIME STUDY模擬試験
- DIVE INTO EXAM模擬試験
- トレノケート模擬試験
- 05/06 試験申し込み
- 05/08 試験受験
試験当日
試験の受験には無料再受験キャンペーンを適用できるテストセンターを利用しました。 会場で受け付けを済ませると、すぐに試験室への案内がありました。しかしここでアクシデントが。
試験を受験するには、試験PCに自身のIDとパスワードを入力する必要があるようです。 私はパスワード管理ツールで自動生成したパスワードを設定しており、全く覚えられる気がしません。 幸い試験室にはIDをパスワードのメモを持ち込み可能とのことで、受付の方からメモ用紙をいただき難を逃れました。
試験については紙やペンの持ち込み不可なので、複雑な計算がでたらどうしようとの不安がありました。 実際の問題では、暗算が可能なレベルであり不安は杞憂に終わりました。 しかしながら、模擬問題とも異なる視点からの設問もありそちらの方が悩んでしまいました。 悩む問題もあるものの、選択方式40問のため、回答と見直し合わせて40分程度で終了としました。
試験を終えて
試験を終了すると、その場で結果がわかります。900/1000点で無事合格でした。
この試験に受かればNumPy、pandas、Matplotlib 、scikit-learn等を自由に使いこなせるという訳ではありませんが、 データ分析に必要となるデータの前処理やグラフ化、簡単な分析と一通りの方法を体系的に学ぶことができました。
書籍の5章ではスクレイピングや自然言語処理等にも触れられているので、今後はこちらも手を動かしていくことで Pythonへの理解や興味を更に深めていければと感じます。