- 11/5追記:PDF解析に使うPDFMinerの使い方、一部修正
- 前口上:ひとまとめにして「備忘録」のように
- PDFMinerの使い方にてこずりました。
- 翌市場日の午前8時半頃に直近日のPDFが公開されるみたいなんですよね
11/5追記:PDF解析に使うPDFMinerの使い方、一部修正
前口上:ひとまとめにして「備忘録」のように
pagetaka.hatenablog.jp
公開後も特段クレーム来てないので、「うまく動いてる」と妄想している爺です。誰も関心持ってなくて、放置プレイの可能性が高い、のが事実かと内心では…ええ…シクシク。
爺の「備忘録」ということでご容赦のほど…。
PDFMinerの使い方にてこずりました。
恥ずかしながらのPythonスクリプト、リンク先に掲載してます。
- MySQL、phpMyAdmin:XAMPP起動、テーブル設定
- 東証株式相場表(日報、PDF)をDL:日報DLのみ、MySQL不要バージョン
- PDFMinerでCSV化し保管:恥ずかしながらのスクリプト
- CSVをMySQLにUP:「LOAD DATA INFILE」で高速UP ※スクリプトで「pyfiles」フォルダになってるけど、「pys」を新しくつかってますので悪しからず。
という四つの構成です。三番目に最もてこずりました。
「 東証株式相場表:PDFMinerで解析しMySQLへの流れ(1) - pagetakaBlog 」に爺が使っている構成を載せています。
翌市場日の午前8時半頃に直近日のPDFが公開されるみたいなんですよね
「東京証券取引所日報 | 日本取引所グループ」 上に直近日データが公開されるのは、翌市場日開始の30分前くらいかと思います。
これを、DL、解析、UPしたうえで、即、使おうというのは、チョット苦しいですよね。まあ、金がないので無料でデータを入手する方法としてこういうことになったのですけど…ええ。貧乏人は仕方ありませぬ…。Pythonの使い方を勉強した、という具合に考えれば、悪くないのかもしれません。
しかし、株で一儲けしたいという「妄想」は、一向に前進の兆しがありません。何せ、MySQL上にデータ蓄積が進んでも、利用技術がまだありませぬ。統計・分析の知識、爺、皆無です。
証券会社が提供してくれる道具(売買、情報ほか)を使えば、ネット経由で十分な情報を得ることができます。爺の徒労ということか……。
これから、自分で蓄積したデータを利用する技術を勉強したいと妄想しておりまする。