pagetakaBlog

最近リフォームと鳥取県日南町の記事多め。写真、PC、ネット等の話題も

Python:Selenium、Chromeできない(Webスクレイピング)

<前説>

この記事をお読みになるということは、requestsで読み込めないWebページの内容を、Seleniumで何とかしよう、というご要望かと思います。

70歳が近づく爺の妄想(暴走)の顛末です。で、ちょっとしたことでした。

あ、そうそう、Seleniumのインストール、Chromeドライバーのインストールしたけど、うまく動かない、エラーが出る、というようなことになり、なんとかして解決したい、PATH? それをどう設定する、というような段階を前提として書きます。

<Chromedriverはexeファイルまでちゃんと書く>

アチコチの案内を見てると、PATHを自分の設定に合わせて設定する、というようなことが目につきます。ところがこれ、ドライブからフォルダ名までの「PATH」でなく、Chromedriver.exeを含む、いうならフルパスというかプログラムファイル込みまでの全部、というようなことかと、自分の失敗から思いました。

from selenium import webdriver
webdriver_path=('C:\xxx\Chromedriver.exe')  #ご自分の環境に書き換えてくださいね
driver = webdriver.Chrome(webdriver_path)

ネットやってますと、フォルダ名まで書けば、index.htmlなど特定ファイルは自動的に選択し表示してくれる、というような慣れがありますもので、タコつぼに入った状態で時間が過ぎました。

なお、上のサンプルは、とりあえずChromeを開くところまでで、どこぞのURLを読みに行って表示する、というのは含んでおりませんので、悪しからず。

PythonによるWebスクレイピング 第2版

PythonによるWebスクレイピング 第2版

  • 作者:Ryan Mitchell
  • 発売日: 2019/03/26
  • メディア: 単行本(ソフトカバー)