pagetakaBlog

最近リフォームと鳥取県日南町の記事多め。写真、PC、ネット等の話題も

東証株式相場表:PDFMinerで解析しMySQLへの流れ<<まとめ>>

11/5追記:PDF解析に使うPDFMinerの使い方、一部修正

Python:「PDFMiner」と「PDFMiner.six」で東証株式相場表を解析

前口上:ひとまとめにして「備忘録」のように

pagetaka.hatenablog.jp
公開後も特段クレーム来てないので、「うまく動いてる」と妄想している爺です。誰も関心持ってなくて、放置プレイの可能性が高い、のが事実かと内心では…ええ…シクシク。

爺の「備忘録」ということでご容赦のほど…。

PDFMinerの使い方にてこずりました。

恥ずかしながらのPythonスクリプト、リンク先に掲載してます。

  1. MySQL、phpMyAdmin:XAMPP起動、テーブル設定
  2. 東証株式相場表(日報、PDF)をDL:日報DLのみ、MySQL不要バージョン
  3. PDFMinerでCSV化し保管:恥ずかしながらのスクリプト
  4. CSVをMySQLにUP:「LOAD DATA INFILE」で高速UP ※スクリプトで「pyfiles」フォルダになってるけど、「pys」を新しくつかってますので悪しからず。

という四つの構成です。三番目に最もてこずりました。
東証株式相場表:PDFMinerで解析しMySQLへの流れ(1) - pagetakaBlog 」に爺が使っている構成を載せています。

翌市場日の午前8時半頃に直近日のPDFが公開されるみたいなんですよね

東京証券取引所日報 | 日本取引所グループ」 上に直近日データが公開されるのは、翌市場日開始の30分前くらいかと思います。

これを、DL、解析、UPしたうえで、即、使おうというのは、チョット苦しいですよね。まあ、金がないので無料でデータを入手する方法としてこういうことになったのですけど…ええ。貧乏人は仕方ありませぬ…。Pythonの使い方を勉強した、という具合に考えれば、悪くないのかもしれません。

しかし、株で一儲けしたいという「妄想」は、一向に前進の兆しがありません。何せ、MySQL上にデータ蓄積が進んでも、利用技術がまだありませぬ。統計・分析の知識、爺、皆無です。

証券会社が提供してくれる道具(売買、情報ほか)を使えば、ネット経由で十分な情報を得ることができます。爺の徒労ということか……。
これから、自分で蓄積したデータを利用する技術を勉強したいと妄想しておりまする。