この著者は初心者として投稿しています。間違いや考慮が足りていない点が含まれている可能性が高いです。見つけたらコメント欄で優しく指摘してあげましょう。
概要
本ノートは、今後のキャリア形成を見据え、自身の学習と実務の土台を築くために作成するものである。
データサイエンスでは、データの前処理、可視化、統計的推測、機械学習モデルの構築など、さまざまな場面で論理的かつ筋道立てた理解が求められる。
しかし、実務において本質的に重要なのは、あるべき姿と現状とのギャップを言語化し、その背後にあるビジネス課題を明確にしたうえで、適切なKPIやKGIを設定することである。
データ分析や機械学習は、それ自体が目的なのではなく、こうした指標の改善を支えるための手段にすぎない。したがって、収集すべきデータの質や量、さらには採用すべき手法もまた、設定したKPIやKGIに応じて定まることになる。
そこで本ノートでは、データサイエンスの手法の名称や実装方法を覚えるだけではなく、目の前の問題を数学の言葉で定式化する力を養うことに重点を置く。問題設定、仮定、用いる手法の意味を丁寧に整理し、筋道立てて考える姿勢を身につけることで、「なぜこの方法を用いるのか」「この結果をどこまで信頼できるのか」を自分の言葉で説明できるようになることを目指す。
目次
- 確率論
- 数理統計学
- ベイズ統計
- 情報理論
- 統計的因果推論
- 機械学習
- 深層学習
- 強化学習
分野を問わず数学の証明が好きで、不定期に過去のノートも含めて更新しています。あとで自分が読み返してもきちんと理解できるノートを作ることを心がけています。定義や証明、命題などに誤りがございましたら、ご指摘いただけますと幸いです(2025年12月28日)。