Why5

巷にあふれる情報(データ)をもとに"なぜ”、"なぜ”、"なぜ”、、、と掘り下げるブログです。現在は主にAIによる予測スキルの向上に励んでいます。

免責に関して:本サイトの情報により生じた如何なる損害についても、当方は責任を負いません。

Rの関数をいくつか作った。

データを眺めるためにいくつか関数を作りました。

■関数その1

経営指標(Revenue)のsummary情報とデータに含まれる社数、欠損値(NA)の社数とその比率、欠損値を持つ企業一覧。

(今回は2137社、リストの全社は2169社、欠損値は87社、欠損率は4.1%で具体的な会社名。主に金融系の企業、金融系は業務上売上概念がないため当然の結果。)

f:id:kaerupub:20210309155343p:plain

 

■関数その2:

業種(cat)をキーにして経営指標の売上(Revenue)の合計(sum)、累積とその比率を売上の大きい順に並べ替え。引数の変えると対象の経営指標と処理方法(sum,mean,etc.)を変更出来る。

最後の引数の1000は累積の桁数を少なくするための処理。今回は1000で割っている。

f:id:kaerupub:20210309155514p:plain

 

■プログラム言語としては”なんで??”と思うところもありますが、統計解析言語としてはRは良く出来ているような気がします。(”当たり前”と言えば”当たり前”か。まだ端を少しかじっただけなので偉そうなことは言えませんが。)

■やっとデータを眺めることが出来るかな。

 

お世話になりました。

stats.biopapyrus.jp