pagetakaBlog

最近リフォームと鳥取県日南町の記事多め。写真、PC、ネット等の話題も

2022-08-25から1日間の記事一覧

Python:VSCodeでPDFMinerを使って、東証株日報PDFから表抽出(1)

東証株日報PDFのテキスト抽出で少し前進がありました。 10/28追記:「まとめ」UP 前説:Java+tabula-pyでほぼ挫折していました。その後、PDFMinerでなんとかなるのではと思ってはみたものの…。 現状:lprms = LAParams(boxes_flow=None) を使って縦罫線無視…