非エンジニア・Python初学者のために
~AI・機械学習が得意な非エンジニアが運営~
Python

Python csvデータをPandasで読み込む ⇒Matplotlibでグラフ化

本気で学ぶなら優秀なエンジニアから学びたい。

助手 ミルク
助手 ミルク
csvデータの読み込みですか!?少し地味なテーマな気もしますが…

何を言っているんですか!?機械学習を行う上でcsvデータの読み込みはとても大事なんですよ!!
トレンドぱぱ
トレンドぱぱ

助手 ミルク
助手 ミルク
そうなんですか!?どんな時に使うんです??

そもそもみんなExcelを使いますよね??なので,点列データでのやり取りは多くあります.インターネット環境からのインストールの主要形式だったり,FA系では計測機器からデータを取得・保存した場合など,多岐に渡ります.
トレンドぱぱ
トレンドぱぱ

助手 ミルク
助手 ミルク
なるほど。それは大事ですね。そもそもcsvってなんの略なんです??

超 寒い ヴィジュアル系バンド。
トレンドぱぱ
トレンドぱぱ

助手 ミルク
助手 ミルク
お前が超寒いわ。

どうでも良いかもいれませんが正しくは、Comma Separated Valuesの略語で、コンマ(,)で区切りを定義しているデータのことで、拡張子は”.csv”です。

今回この”csvデータ”をPythonで読み込んでグラフ化する方法について解説していきますが、Pandas等のライブラリを使用するため、環境が整っていない方は”ANACONDA”のインストールをお勧めします!!

➡”ANACONDA”でPythonの機械学習やデータ分析を効率化【インストール方法と使い方】

 私は普段お気に入りのIDE(開発統合環境)でVisualStudioCodeを使用してます。Python環境の整備がまだという方は☟☟☟の記事を参考にして下さい。

➡VSCodeの日本語設定【PythonにおすすめのIDEをインストール&設定】

読んで得する人は?Pythonでcsvを扱う人≒データサイエンス系エンジニア

 

 

前述したようにcsvデータを読み込むことは現場で多く発生します!!

 

 

データサイエンティストや研究系のエンジニアの方は、読み込んだデータに統計処理を施したり、データを使って機械学習や分析を行ったりします。

 

 

なので今回この記事を読んで得する方はこちら☟☟☟

 

 

  • Pythonでcsvデータを読み込んでなんかしたい人



  • 機械学習、AI系のエンジニア・データサイエンティストを志す方



  • Pythonの”Pandas”これ『パンダス』と読みます.ギリ知ってた方 

 

 

助手 ミルク
助手 ミルク
csvデータを読み込んで終わりということはないですもんね。

 

 

そうですね。少なくともグラフ化してデータを見て何かを判断しますね。データサイエンティストにとっては日常ですね(*’ω’*)
トレンドぱぱ
トレンドぱぱ

 

 

Pandasでcsvデータを読み込み サンプルコードあり

①基礎 同一フォルダ上のデータを読み込む

助手 ミルク
助手 ミルク
読み込むデータはどこに保存されていてもいいんですか??

プログラミングの方法でどうとでもなるんですが,まずは一番簡単な方法を説明しますのでcsvを読み込むプログラム読み込みたいcsvデータは同一フォルダ上に保存しておきましょう!!
トレンドぱぱ
トレンドぱぱ

下準備として、同一フォルダ上にcsv-read.py(プログラムデータ)sample.csv(読み込むcsvデータ)を保存します。

トレンドぱぱ
トレンドぱぱ
それでは早速csvを読み込むコードを書いていきます!!今回読み込むデータは1次元の配列データです!!

コードはこちら☟☟☟

 

 

デバック(F5キー)の結果はこちら☟☟☟

 

下にスクロールしていくと…

助手 ミルク
助手 ミルク
数値が羅列されて…読み込めてますね…ん!?最後の[6905 rows x 1 columns]ってなんですか???

[6905 rows x 1 columns]はデータのサイズを表しています!!6905行で1列のデータということです!!
トレンドぱぱ
トレンドぱぱ

助手 ミルク
助手 ミルク
なるほど!!それ以外は簡単!!もはや説明不要ですね(*’ω’*)pandas便利。

6905点のそこそこ重いデータなのに読み込み速度も問題ないし…pandas…パンダス…すばらしい…名前もおいしそうだし。
トレンドぱぱ
トレンドぱぱ

…多分だけどパンダはうまくねーぞ。雑食だからな。あと、動物保護団体にしかられろ。
助手 ミルク
助手 ミルク

②応用 ファイルパスを指定してデータを読み込む

 

 

助手 ミルク
助手 ミルク
プログラムと同じフォルダにないとデータが読み込めないって少し不便ですよね??


 

 

めちゃ不便です笑 なので、任意のファイルを開いて保存する方法を紹介します!!
トレンドぱぱ
トレンドぱぱ


 

 

それではコードを書いていきます!!☟☟☟

 

 

 

 

このコードをデバッグするとまず…

 

 

 

 

 

 

確認のダイアログが出ますので、『OK』をクリックします。そうすると…

 

 

 

 

 

 

読み込むファイルの選択画面が開かれますので、任意に指定し、読み込みます。

デバッグの結果…

 

 

 

 

 

同一フォルダ内で読み込んだ時と同様ですので、正しく読み込めています(*’ω’*)

 

 

 

助手 ミルク
助手 ミルク
すごい!!これなら大分便利ですね。わざわざデータを移動しなくて良い。

 

 

これで読み込みに大分汎用性が出ましたね!!フォルダパスのみ指定する形にしてループさせると複数ファイルを読み込むことも可能です.
助手 ミルク
助手 ミルク

 

 

助手 ミルク
助手 ミルク
でも、点列データだけ見ていても解りづらいですね。


 

その通り!!次は取得したデータをグラフ化していきましょう!!
トレンドぱぱ
トレンドぱぱ


 

 

③可視化 読み込んだデータをグラフ化する。

 

トレンドぱぱ
トレンドぱぱ
今回読み込んだデータは、ある計測機器の電圧アナログ信号を100Hzの周波数で取り込んだデータです.

 

つまり10ms周期で取り込んだデータですね!!周波数(Hz)は前勉強したからばっちりだわ!!
助手 ミルク
助手 ミルク

 

トレンドぱぱ
トレンドぱぱ
さすがミルク様!!周波数がよくわからいないという方はこちらを読んで見て下さい!!
➡周波数の求め方 回転数・音・振動・電力点・電波【中学生~大人向けに解説】

ということで今回は横軸-時間(Time)・縦軸-電圧(Voltage)の散布図を作成していきます!!

 

 

さきほどのコードに☟のグラフ化コードを追加して下さい!!

 

 

 

実行し、さっきと同じようにファイルを選択すると…

 

 

散布図が表示されます(*’ω’*)

 

助手 ミルク
助手 ミルク
やっぱりグラフ化されるとわかりやすくていいですね!!

 

そうですね!!分析とか数値化とかよりも前に生の波形を確認するのはとても大切です!!プログラミング初心者の方は、確認のためにExcelでも同じようにグラフ化してみると良いですよ(´・ω・`)
トレンドぱぱ
トレンドぱぱ

 

まとめ csvの読み込みはpandasで簡単にできちゃう

 

今回はPandasとMatplotlibを使ってcsvデータを読み込み、グラフ化しました。以下まとめです。

 

  • Pandasを使えばcsvが簡単に読み込める。

     

  • 任意のファイルパスを指定してデータを読み込むには少し工夫が必要

     

  • グラフ化はMatplotlibで。

     

Matplotlibを使ったグラフ化については次回以降に詳しく触れていきます!!

 

応用編として、機械学習に関する記事も書いてます!!良かったら読んでみて下さい(*’ω’*)

➡Scikit-learnで非線形回帰分析【Python 回帰分析③】

 

良くPythonの勉強はどうやって?と聞かれますが、『完全独学』です。最後に高卒者の私が一人で勉強してとても助けられた書籍を紹介します(*’ω’*)

 

Python機械学習プログラミング 達人データサイエンティストによる理論と実践/SebastianRaschka/VahidMirjalili/クイープ【合計3000円以上で送料無料】

価格:4,320
(2019/8/25 22:15時点)
感想(0件)

 

座右の銘は明日は明日の風が吹く。Kgrneerでした♪

 

スポンサーリンク



PVアクセスランキング にほんブログ村
Pythonランキング