pagetakaBlog

最近リフォームと鳥取県日南町の記事多め。写真、PC、ネット等の話題も

PC、ネット、情報端末

東証株式相場表:PDFMinerで解析しMySQLへの流れ(6)MySQL項目データ形式調整

MySQLへのデータ形式変えたら1割くらい容量減った 株価データには、数字のほか「-」というのがあって… 「LOAD DATA INFILE 」つかい約59万行のCSVデータを約6秒でMySQLへ放り込めた。 MySQLへのデータ形式変えたら1割くらい容量減った (1)東証株式…

東証株式相場表:PDFMinerで解析しMySQLへの流れ(5)まだエラーが二つ

東証株式相場表(日報、PDF)を解析するPythonスクリプトでエラー二つ ひとつめ:「.start()」は、メンバーではないとのご託宣 ふたつめ:「boxes_flow=None」はリファレンスにはあるけど…警告エラーが PDFMiner使ったPythonスクリプトは、ふたつの警告エラ…

東証株式相場表:PDFMinerで解析しMySQLへの流れ(4)XAMPP起動、テーブル設定

XAMPPをインストールし起動など MySQLをつかう場面 MySQL:データベース上にテーブルを作る XAMPP上でphpMyAdmin起動 phpMyAdmin使って、データベース「stock」作り、テーブル「market_data」設定 10/28追記:「まとめ」UP XAMPPをインストールし起動など 東…

東証株式相場表:PDFMinerで解析しMySQLへの流れ(3)日報PDFをDL

Python:DLのみ、MySQL不要バージョン Pythonスクリプト:株式相場表(日報、PDF)をDLする 10/28追記:「まとめ」UP Python:DLのみ、MySQL不要バージョン 初めて東証サイトから株式相場表(日報、PDF)をダウンロード(DL)する時用です。まだ、MySQLのテ…

東証株式相場表:PDFMinerで解析しMySQLへの流れ(2)

11/5追記:PDF解析に使うPDFMinerの使い方、一部修正 東証株式相場表(日報、PDF)解析の引っかかりどころ 株価データのうち「-」は該当数値がない…。 利用する項目を絞り込みました 11/5追記:PDF解析に使うPDFMinerの使い方、一部修正 Python:「PDFMiner」…

東証株式相場表:PDFMinerで解析しMySQLへの流れ(1)

東証株式相場表(日報、PDF)は手ごわかった 作業するPCの問題 IDEはVSCodeを使いました 東証株式相場表(日報、PDF)は手ごわかった 東京証券取引所日報 | 日本取引所グループに掲載されている「株式相場表」(PDF)を利用したいと考えました。Pythonで、(…

東証株式相場表:データがあるけど拾えてない7銘柄の対策…前進…か…。

前説:東証株式相場表(日報、PDF)約3800銘柄のうち、7銘柄データピックアップできていなかった。 正規表現とPython.replaceを工夫し、何とかなったかしら……(不安だけど)。 1:正規表現でヒットする範囲をゆるくしてみた 2:「,」数字3桁区切りコンマ…

東証株式相場表:約400ページの構成、改めて眺めています。

前説:Pythonで東証株式相場表(日報、PDF)からCSV作ってみたけど…。 PDFMinerをつかったPythonスクリプトで東証株式相場表(日報、PDF)からCSVが何とかできたか、と思ったものの、できあがったファイル容量が日ごとにいくらか異なり懸念がありました。 9…

Python:PC3時間半動かし、3月からの東証株式相場表、PDFMinerで何とかなったかも…。

前説:東証株式相場表(日報、PDF)銘柄コード隣りの1文字に気づかず1か月以上 東証株式相場表(日報、PDF)をPDFMinerでなんとか解析できそうだと思ったのが9月5日でした。 Python:VSCodeでPDFMinerを使って、東証株日報PDFから表抽出(3) - pagetakaBlo…

東証株式相場表:日報コード欄に1文字表示が、CSVの位置関係を…。

以前掲載したPythonスクリプト、修正。 東証株式相場表日報(PDF)をPDFMinerで解析できていると思ってたけど…。 気づいたのは出来上がったファイルの容量が大きく異なる日があったから 「D」以外もかなりある 修正:恥ずかしながらのPython script 東証株式…

Python:複数CSVをひとつにまとめれば、MySQL「LOAD DATA INFILE」に対応できる…。

前説:複数CSVで「LOAD DATA INFILE」をfor文で使えるようにしてみた。 記事タイトルのとおり、複数のファイルをひとつにまとめればOKではないのかしらん…。 複数CSVをひとつにし大きなCSVをひとつ用意するのを省き、「Dataframe」にして、MySQLへ書き込むと…

XAMPP:MySQLがすぐ止まる。3306バッティングしてない…。

MySQLスタートしてもすぐストップ 先例があり、参考にさせていただきました。 フォルダ操作で退避・復帰、 注目するのは、「data」フォルダ XAMPPを起動・停止させるタイミングは大切みたい MySQLスタートしてもすぐストップ XAMPPを稼働させ、apacheのスタ…

Python:CSVの文字コード変更を同一フォルダで実行(VSCode)

前説:CSVの文字コード、utf_8_sig、cp932 などで苦戦 同一フォルダ・同一ファイル名:恥ずかしながらのPythonスクリプト(文字コード変更し保管) 別フォルダ:恥ずかしながらのPythonスクリプト(現状Pathから別Path置換) 余談: shift_jis は cp932 で文…

Python:東証株式相場表(日報、PDF)を使い、株売買の道具にしたい…道は険しい、時間は限られている。

ちょっと一休みみたいな感じで、「東証株式相場表(日報、PDF)」作業の課題を備忘録的に書きだしました。 東証株式相場表(日報、PDF)を解析し、これまでにできたこと。 東証株式相場表(日報、PDF)を解析し、まだできてないこと。 東証株式相場表(日報…

Python:CSVをMySQLへ高速読込み「LOAD DATA INFILE」(VSCode)その2

この項10/27追記:フォルダ名適宜ご変更のほど ファイル名を変数にする悪あがき、マニュアルでは文字列定数…みたいだけど 前説:CSV単ファイルを処理できました。 「LOAD DATA INFILE」でフォルダ内CSVを一気にMySQLテーブルへ 恥ずかしながらのPythonスクリ…

Python:CSVをMySQLへ高速読込み「LOAD DATA INFILE」(VSCode)

CSV(BOM無し)をMySQLへ読み込む LOAD DATA INFILE をPythonスクリプトで書くとこうなった…合ってるかな? LOAD DATA INFILE をPython…CSVのcolumnとDB.TABLE.columnの関係づけは… CSV(BOM無し)をMySQLへ読み込む 環境:Win11(64)home、VSCode、Python3…

XAMPP:終了時エラーが起こる。プロパティ変更でうまくいきました。

XAMPPの「quite」(終了)ボタンを押すとエラー PC起動後、手動でXAMPPを起動しています。用事が済んで、「quite」(終了)ボタンのあとは、お決まりのように、「アクセスが拒否されました」との旨の表示が出ていました。 【XAMPP:終了時エラー。プロパティ→…

Python:東証株式相場表(PDF)をダウンロードする。

ネット上のスクリプトをお借りし、東証株式相場表(複数・PDF)DLできました。 前説:自動で東証株式相場表(PDF)をDLしたい。 「デジタル推進課」さんのブログにドンピシャのスクリプトがありました。 恥ずかしながらのPythonスクリプト 課題:CRON動かす…

VSCode:Pythonで別PCのMySQL接続、mysql.connectorで実現。

mysql.connetorで別PCのMySQLに接続できたみたいです。 前説:どこにRDBのデータ置くんだと考えたら、自PC内ではあまり都合よくないよな~と思った。 設定1:Win10PCにXAMPP入れ、その中のMySQLをつかってみることにしました。 設定2:Win11PCのVSCodeで使…

東証上場銘柄:「市場・商品区分」は整理コードがないみたい…。

【内国株式だけを残した「東証上場銘柄」(部分)】 「東証上場銘柄」には10種類の「市場区分」情報。 「内国株式」だけを「東証上場銘柄」から選択する。 関連記事 「東証上場銘柄」には10種類の「市場区分」情報。 「東証上場銘柄」(Excel、XLS)を閲覧し…

Python:Excel読込みんだらPandas.DataFrameでどうなってる…のか…。

東証上場銘柄表から、RDBのいくつかのテーブルが作れそうです。 前説:東証上場銘柄一覧(Excel:XLS)をPandasで読み込んだらDataFrameができました。 DataFrameは、「辞書型」らしい…。 課題:コード・銘柄名一覧表など各種一覧表をつくりたいです。 【東証…

Python:Pandasでweb上のエクセル(XLS)取得し、ターミナル出力(VSCode)

東証上場銘柄一覧(xls)を読み込んで、VSCodeターミナルに表示…ができたみたいです。 前説:ネット上のExcelファイルをDLし保存せずそのままPythonで処理したかった。 pandas.io.excel.read_excel(url,etc) でDataframeに取り込めるらしいというのが、まず…

Python:VSCodeでPDFMinerを使って、東証株日報PDFから表抽出(3)

東証株日報からのデータ抽出、少し前進。耄碌爺にこれ以上できるか全く不明ですが、ひとまず、世間様へ恥さらしながら…。 追記・10月12日:できあがったCSVと東証株式相場表(日報、PDF)に齟齬 10/28追記:「まとめ」UP 追記・10月10日:スクリプトの修正が…

Python:VSCodeでPDFMinerを使って、東証株日報PDFから表抽出(2)

今回できたこと:東証株日報PDFからCSVへの書き出し、部分的にできた。 PDFMiner解析の結果、異なるところにテキスト・データが…。 課題:複雑なページもある東証株日報PDF 今回できたこと:東証株日報PDFからCSVへの書き出し、部分的にできた。 東証株日報…

Python:VSCodeでPDFMinerを使って、東証株日報PDFから表抽出(1)

東証株日報PDFのテキスト抽出で少し前進がありました。 10/28追記:「まとめ」UP 前説:Java+tabula-pyでほぼ挫折していました。その後、PDFMinerでなんとかなるのではと思ってはみたものの…。 現状:lprms = LAParams(boxes_flow=None) を使って縦罫線無視…

Python:VSCodeでJavaを介在させ、東証株日報PDFから表抽出(3)

10/28追記:「まとめ」UP 前説:Java + tabula はほぼ挫折 現状:PDFMinerでテキストファイルにしてみたけど 今後:PDFMinerの字間・行間調整でちゃんとテキスト出力できるか試してみるつもりですが 10/28追記:「まとめ」UP 東証株式相場表をDLし、PDFMiner…

マウス補修に接着剤。

【動きが重たくなったマウスに接着剤使って補修】長らく使ったマウス、動きが重たくなっていました。マウスの底面、マウスパッドも洗って汚れを落としましたけど動きは変わりません。それで、購入当初「フェルト」「クッション」のようなものがついていたで…

Python:VSCodeでJavaを介在させ、東証株日報PDFから表抽出(2)

10/28追記:「まとめ」UP 前説:東証株式日報(PDF版)をPythonで処理する準備。 現状:tabulaインストールはできたようだがエラーがいろいろ出ている。 今後:ひとまず「保留」「挫折」ということで他の道具を探してみます。 17日追記:東証株式相場表でも…

Python:VSCodeでJavaを介在させ、東証株日報PDFから表抽出(1)

前説:株式売買の参考にしていた東証株式日報がExcelからPDFに変更されていた。 VSCodeでJavaを使う準備は手順が長そう。 JavaSDKをDLしてインストール。 VSCodeでJavaSDKをつかうため、Extension Pack for Javaをインストール。 VSCodeのsetting.jsonを編集…

スマホ:NFCをONにしてなかった。マイナカード読み取り…。

コロナワクチン接種証明をスマホで準備しようということで作業しました。すでに2回入力していて、3回目の作業です。 準備するものは、NFC読み取りの自分のスマホ、マイナカード、パスポート(海外用)。接種券も確認用にあった方が良いかもしれません。NFC…