Why5

巷にあふれる情報(データ)をもとに"なぜ”、"なぜ”、"なぜ”、、、と掘り下げるブログです。現在は主にAIによる予測スキルの向上に励んでいます。

免責に関して:本サイトの情報により生じた如何なる損害についても、当方は責任を負いません。

2021-02-01から1ヶ月間の記事一覧

Rの関数をいくつか作った。

データを眺めるためにいくつか関数を作りました。 ■関数その1 経営指標(Revenue)のsummary情報とデータに含まれる社数、欠損値(NA)の社数とその比率、欠損値を持つ企業一覧。 (今回は2137社、リストの全社は2169社、欠損値は87社、欠損率は4.1%で具体的な…

全体を俯瞰する方法を考える。

JupyterNotebookで企業単体業績の見える化にトライしましたが、本来の目的は”世の中の政治・経済情勢と企業の業績と株価の関係性を見てみる。”なので全企業や業種単位で見てみてどうかを検討するのが筋ではないかと思いどうすれば良いかを考えた。 ■データ …

業績情報の見える化

企業の単体業績データの準備が出来たのでJupyterNotebookで見える化に挑戦。 こんな感じ。 直観的に傾向を把握できます。 グラフと企業のIR(決算短信、中期計画資料等)をながめると方向性が見える。 IR情報には事業単位での話や、新規取り組みの話が書いて…

ダウンロードした企業データを分析用に加工する。

ダウンロードしたデータを以下のように加工。 財務3表を一つのファイルに統合して、以下の項目を追加。 ■売上比 ■前年比 ■主要指標 統合したデータを今後分析に使用しやすいように以下の形で保存 ■5年分の業績を1ファイル ■5年分を年度ごとに分割 いっぺん…

企業業績のデータのダウンロード

東証のリストをもとに企業業績を定期定期にダウンロードすることに挑戦。 決算情報なので項目が共通、すべての項目に金額が記入されていると思いプログラムを書き、リストに従い連続実行させるとエラー多発。 よくよく見ると、”金額が入っていない項目がある…

まずはやってみる。 その1

2021年3月、4月の結果を踏まえて方向転換(2021/04/19) 企業業績をまとめて見ても、世の中の動きを広くは網羅しないようなのでGNPや鉱工業指数のような政府統計の過去分析(政府統計 vs 株価、政府統計 vs 時事トピックス)を行い傾向把握(統計値が大きく変…

ITツール群(環境)

現在使用中のもの:ー ■Raspberry pi: データ収集用サーバーとして利用。(Linix) ■Anaconda: 分析環境として使用。(Windows) ●Spyder: Pythonのプログラム作成 ● Jupyter Notebook: データ分析用 ●RStudio: データ分析用 ■GitLab: ソース管理に使用 なんと…

はじめに

世の中のいろいろな情報が手軽にデジタル・データとして手に入る時代になりました。 加えてうん十年前にはとても考えられなかったITツールが無償で使えるようになり 少しの好奇心と向上心があれば情報を収集・分析して”何が起こっているのか。”、 ”何が起こ…