IPythonデータサイエンスクックブック
誰におすすめか
- データサイエンスやPythonに興味があるけれど、何を手始めにやればいいかわからないという方
- 既にデータ解析を行っており、Jupyter notebookを使ってみたい方
- 対話型コンピューティングや可視化について実践したい方
などにおすすめです。
まず、データサイエンスの領域を広く浅く取り扱っているという点において、初心者が導入として様々な手法に触れることにも適しています。統計解析や機械学習、数値最適化や信号処理なども扱っています。
既にデータ分析を行っている人にとっても、Jupyter notebook自体が非常に魅力的なツールであり、これを用いたデータ分析方法を学べる良い書籍となっています。専門領域を持っている人にとっては各例の理解は容易であると思われるので、可視化の仕方など別の部分に注力しやすいものとなっています。
こんな方にはNGです
- データサイエンスの手法自体を詳しく学びたい
- 綺麗に可視化することになんて興味がない
- Pythonユーザーではない
この本で取り扱われている手法は非常に基本的なものばかりです。更に発展的な内容に進むための参考文献などは挙げられていますが、二度手間になってしまう可能性が大です。
データの数値にしか興味がないのであれば得られる物は少ないかもしれません。データ分析結果を誰かに見せる必要も全く無いのであれば、この本も無用かもしれないです。
Jupyter notebook自体はPython以外の言語に対応しています。その前身がIPython notebookであり、あまりに便利であったため、他の言語に拡張されていったという経緯があります。
本の題名の通り、Pythonを題材に使っており、扱っているテーマもPythonのライブラリによって実装されています。この点は注意が必要です。一般的にJuypyter notebookの使い方に関する本というわけではありません。
本の一部の例題
ブラウン運動のシミュレーション
あまり載せると怒られるの本の一部だけ例を載せます。
具体例を用いて、様々なシミュレーションやデータ解析の可視化を載せています。
どのようなものを扱っているかは、本書の目次を参照してみてください。
Pythonでデータ分析したい私にとっては非常に有用な一冊です。
IPythonデータサイエンスクックブック
価格は3800円と専門書ですからそれ相応の価格です。
個人的にはこれからPython使っていきたい人にはJupyter notebookは本当におすすめですから、その可能性を感じさせてくれる本書は有益だと感じました。

IPythonデータサイエンスクックブック ―対話型コンピューティングと可視化のためのレシピ集
- 作者: Cyrille Rossant,菊池彰
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/12/25
- メディア: 大型本
- この商品を含むブログ (1件) を見る
特にブログでコードを載せたい人にとってはJupyter notebookとgistのコラボレーションは強力です。
Juputer Notebookを使う(追記)
Juputer Notebookは対話的にプログラミングが可能で、図示をその場で行いその場で検証しながらプログラムをいじることができて非常に便利です。
データサイエンスをする上で、Jupyter Notebookを上手く活用する以下の書籍を購入しました(記事参照)。
今までブログでは数式をゴリゴリ書きながら、時折図をプログラムで表示して貼り付けるというスタイルで、記事を書いてきましたが、Jupyter Notebookを使うことで、ブログ上での記事作成も非常に楽になるだろうと思っています。
そういう意味で、ブログ上でプログラムを公開したい人などにも非常におすすめな本となっています。
線形回帰
以下の記事で解説を行っています。
Jupyter Notebookがあれば伝えたいことをプログラムで書いて、あとはペタリ。
機械学習の勉強
実例を見ながら勉強をしていくと、間違いなく理解度は深まるでしょう。
是非、数式を追いながらも、簡単なものでいいのでプログラムを動かしてみるということをしましょう。機械学習を学ぶ環境としては、anacodaを入れてしまえば一通り揃います。深層学習をやりたい場合は、別途TensorflowやChainerを導入しましょう。最もとっつきやすいのはTensorFlow+Kerasを使うことでしょう。日本語ドキュメントもあり、ネットワークの構成も直感的でわかりやすいです。
深層学習の勉強
深層学習の勉強をしたい人は、本を読んで数式を追いながら、以下のプログラムベースの勉強もしていきましょう(場合によっては以下の一冊で済むかもしれません。もともと理論が追いついていない分野です)。