全体を俯瞰する方法を考える。
JupyterNotebookで企業単体業績の見える化にトライしましたが、本来の目的は”世の中の政治・経済情勢と企業の業績と株価の関係性を見てみる。”なので全企業や業種単位で見てみてどうかを検討するのが筋ではないかと思いどうすれば良いかを考えた。
■データ
- 全企業の業績データを年度ごとにマージして、33業種コードをキーにして見てみることを考えた。
■ツール
- JupyterNotebookでやろうとしたが、統計学的な計算やグラフ化がやたら手間かかったので(これは個人的な感覚。本当はすごいラブラリーがあるかもしれない。)、いろいろネットで情報収集したところRStudioが良さそうなので早速使ってみたが、統計学用のソフトだけあって便利感じがするが、R言語のクセになじめず苦戦中。(なんかほかの言語とは考え方が少し違う気がするのは私だけ?)
■結果
- ダウンロードした全企業データをマージ
- 33業種コードの箱ひげ図(RStudioを使用)
慣れてくるとコンソールでも度数、累積等が簡単に見れる。
お世話になりました
Rの勉強もネット上の情報でやろうとしましたがうまくいかず、この本にお世話になっています。まだ、途中までしか読んでいませんがかなり頭の中が整理された感じで作業が進み始めました。内容がしっかりした本は”買う価値あり。”です。
まだまだお世話になると思います。