やったこと
スキルアップのため、SIGNATE,Kaggleのコンペに参加し始めました。 今回は"第20回_Beginner限定コンペ】診断データを使った糖尿病発症予測"に挑戦。 無事'intermediate'に昇格。 最近はLightGBMに特化して練習中。 その理由は性能が良い(高速。新規に特徴量…
プログラムは前半と後半の2つに分かれていて、後半プログラムのAI導入を検討したい中小企業との協働プログラム案件が日刊工業新聞に載りました。 (リンク先の記事を全文読むためにはユーザー登録が必要です。悪しからず。) www.nikkan.co.jp 協業先はネジ…
経産省が主催しているAI Questに21年9月から参加しました。 ”AI Questは、参加者同士が学び合い、高め合いながらAI活用を通した企業の課題解決方法を身に付けるプログラムです。”をコンセプトに参加者の共助によってAIのスキルアップをしようと言う場です。…
景気動向指数が株価に影響しているかどうかを調査してみた。 ■比較対象 景気動向指数と日経平均EFTの株価の関連を調べる。 ■方法 景気動向指数は2か月遅れでだいたい毎月7日に発表される。 (例、7月に発表されるのは5月の指数) CI先行指数が景気の先行きを…
前回、優良企業を探せと題して分析を行いました。 しかし、よく考えると世の中の大半の人は株価が上がる優良企業を知りたいと考えるのが普通で、”日本には優良企業らしきものがあって株価も上がるようです。”チャンチャンでは何の役にも立たないことに気づい…
東証に上場している企業約3800社中、手元に過去5年の業績データがある2168社から”優良企業ってどれくらいあるのか?”と言う素朴な疑問を検証してみました。 優良企業の私個人の定義:ー 1.商品やサービスに独自の強みがあること。 2.業績が毎年着実に伸…
2020年GDPは2019年に比べ、実質値で約27兆円の減少うち個人消費は18兆円 why5.hatenablog.com e-statで形態別国内家計最終消費支出のデータをe-statのグラフ機能を使用して可視化。 表示がおかしなところがあるのはご愛敬。 データがどんな感じか確認するに…
リーマンショック(2008年)とコロナ禍(2020年)のGDPへの影響を見る。 データは実質原データを使用。 赤枠はリーマンショック 橙枠はコロナ禍 リーマンショックは2年間で約36兆円の減少で、コロナ禍は約27兆円の減少。 どちらも驚異的な数字ですが、リーマ…
■TPOIX・ETFの価格変動を分析しているとき目についた為替、石油価格、金利等のもろもろの指標と世界の主要株価指標との相関を取ってみた。 対象指標の一覧 データのダウンロードはPYTHONのpandas-datareaderライブラリーを使用してyahooから入手。 パラメー…
以下の手順でやったみた。 1.データをR用に修正 e-statからデータをダウンロード。 日付と列名を変更し、データを扱いやすいようにしてRに取り込む。 最新の連続データとして手に入るのは1994年以降で高度成長期、バブル期は含まず。 これらの時代も時間が…
TOPIX・ETFデータの2016年~2019年 ETFの価格と前日比±1.5%以上価格が変動した日の年度ごとのグラフ 2016年から2019年までTOPIX・ETFの大きな前日比価格変動(±1.5%以上)とその日のニューストピックスで景気動向が分かるかどうかを見ようとしたが無理なよ…
やったこと キーワードリストの作成と作業フローの確立 ■手順:ー 1,354の単語を含む文章を抽出し対象外と思われる1,061単語を選んでネガティブリストを作成。ネガティブリストにしたのは時事問題を漏らさずキャッチしたいから。次に1,354の単語とネガティブ…
やったこと 株価が大きく変動した時にどんなニュースが報道されていたかを調べることで、何が景気に影響を及ぼすと考えているかを考察する。 ■手順:ー 1.TOPIXや業種単位、コモディティなどの大きなカテゴリのETFのデータをダウンロード スクライピング禁…
いろいろやってみたが思ったほどの結果は出なかったのでまとめだけ。 ■まとめ(=わかったこと) *一部企業の業績を集計してもGDPに比べると網羅性が落ちる。 企業業績は単体企業を判断するもの。 *景気動向の結果を知るにはGDP・鉱工業指数を見ればよい。…
前回の分析からの続き *ニュース記事の収集と分類・分析 *データ集計・評価方法の修正 *引き続き年度単位で業種動向の分析 ■今回は2番目”*データ集計・評価方法の修正”を検討 やっぱり本業で得た利益が企業価値と言うことでコア営業利益をキーとする。 …
異常値の処理を実施して、それぞれの業種から企業の決算資料を見て何が起こったかを調査。 スミルノフ・グラブス検定で異常値を取り除いた結果:ー 対象者数:2057社→1860社 △197社 売上の増減金額:△14兆円 → △11兆円 +3兆円 営業利益の増減金額:△13兆円 …
業績の増減理由を見るために、企業短信を見始めたが景気が原因ではない要因が結構な数あることに気づいた。 (景気がどんな形で企業業績に影響しているかを見るのが目的なため、M&Aや会計年度の変更等による売り上げの大きな増減は今は関係ない。) 一社、…
2020年度が2019年度に比べてどうだったかを検討。 (注:銀行業を含まず) ■対象:2057社 ■売上 2020年:703兆円 2019年:714兆円 2019年に比べて:△14兆円 (-2%) ■営業利益率: 2020年:38兆円 2019年:51兆円 2019年に比べて:△13兆円 (-25.5 %) …
2020年度の銀行業を除く東証上場2,058社の売上合計は703兆円。 703兆円とはどんな規模感? 日本のGDPは554兆円(2018年)より大きい。 日本企業は世界中で日本のGDPより大きな金額を回していることになる。 話は少しそれますが日本のGDPは1995年以降、1年、2…
データを眺めるためにいくつか関数を作りました。 ■関数その1 経営指標(Revenue)のsummary情報とデータに含まれる社数、欠損値(NA)の社数とその比率、欠損値を持つ企業一覧。 (今回は2137社、リストの全社は2169社、欠損値は87社、欠損率は4.1%で具体的な…
JupyterNotebookで企業単体業績の見える化にトライしましたが、本来の目的は”世の中の政治・経済情勢と企業の業績と株価の関係性を見てみる。”なので全企業や業種単位で見てみてどうかを検討するのが筋ではないかと思いどうすれば良いかを考えた。 ■データ …
企業の単体業績データの準備が出来たのでJupyterNotebookで見える化に挑戦。 こんな感じ。 直観的に傾向を把握できます。 グラフと企業のIR(決算短信、中期計画資料等)をながめると方向性が見える。 IR情報には事業単位での話や、新規取り組みの話が書いて…
ダウンロードしたデータを以下のように加工。 財務3表を一つのファイルに統合して、以下の項目を追加。 ■売上比 ■前年比 ■主要指標 統合したデータを今後分析に使用しやすいように以下の形で保存 ■5年分の業績を1ファイル ■5年分を年度ごとに分割 いっぺん…
東証のリストをもとに企業業績を定期定期にダウンロードすることに挑戦。 決算情報なので項目が共通、すべての項目に金額が記入されていると思いプログラムを書き、リストに従い連続実行させるとエラー多発。 よくよく見ると、”金額が入っていない項目がある…