pagetakaBlog

最近リフォームと鳥取県日南町の記事多め。写真、PC、ネット等の話題も

Python:PC3時間半動かし、3月からの東証株式相場表、PDFMinerで何とかなったかも…。

前説:東証株式相場表(日報、PDF)銘柄コード隣りの1文字に気づかず1か月以上

東証株式相場表(日報、PDF)をPDFMinerでなんとか解析できそうだと思ったのが9月5日でした。

できあがった日別CSVファイル、容量に大きな差があるのに気づき、当初のPythonスクリプトを昨日修正しました。

3月以来の東証株式相場表(日報、PDF)を改めてPDFMinerで解析しました。

夜中のトイレ通いのついでにPC立ち上げ、VSCodeのPythonスクリプトを動かしました。149日分ありました。約3時間半かかりました。

【経過秒数とできあがったCSV:11日朝】
【経過秒数とできあがったCSV:11日朝】

CSVファイルは、508KB~526KBと容量の差がまだあります。毎日ほぼ似たような容量になりそうと思った爺は少し当てが外れました…。まだ、東証株式相場表を解析するPythonスクリプトには不十分なところがあるのかと…ええ。

「LOAD DATA INFILE」を使い CSVをMySQLへ約4.6秒

できあがったCSVファイルをMySQLへ送り込んだのは「 LOAD DATA INFILE」を使ったPythonスクリプト。

ひとつにまとめればスピードもっと上がったのかもしれませんが、149ファイルで計約4.6秒で済んだのですから、まあ爺的にはこのようなものかと…。

環境は、Windows11(64)Home+i5-9600K+32GBメモリ+512GBSSD でした。