前回、PowerShellからWebDriverを経由してWebブラウザを操作する方法として「Selenium」モジュールを使う例を取り上げた。実はこのモジュールを利用するという選択にはいくつかの“判断”があった。今回はその辺りの経緯を説明しておこう。
→連載「PowerShell Core入門 - 基本コマンドの使い方」の過去回はこちらを参照。
PowerShellからMicrosoft Edgeを操作する調査を開始
PowerShellからMicrosoft Edgeを操作する方法を調べ始めると、Seleniumの存在を知っていても知らなくても、そう遠くない段階で次の2つの選択肢に行き着くと思う。
- SeleniumのC#ライブラリをPowerShellから使う
- PowerShell Seleniumモジュールを使用する
「SeleniumのC#ライブラリをPowerShellから使う」方法はパワフルだ。Seleniumのパワーをフルに利用できるし、最新のSeleniumの恩恵に預かることができる。反面、コードは複雑になりがちだ。半分C#みたいなスクリプトになるので、PowerShellのお手軽感はかなり減る。人によっては、こちらの方法は“ノーサンキュー”となるだろう。
PowerShellで手軽にコトを済ませたいと考えるユーザーの多くは「PowerShell Seleniumモジュールを使用する」方法を選択するだろう。こちらなら、用意されている専用のコマンドレットを使うことでWebブラウザを操作することができる。このお手軽感は捨てがたい。
PowerShell Seleniumモジュールを使う
PowerShell SeleniumモジュールはGitHub.comでホスティングされており、次のページからドキュメントなどを含めた各種データにアクセスすることができる。
今のところ、このモジュールを使うのが最も簡単な方法なのだが……実は、ここにはいくつかの問題がある。オープンソースのサードパーティ製ソフトウエアを使う際には結構遭遇する問題でもあるので、そうした場合に、どうやって利用までの判断を下していくかをステップ・バイ・ステップで追ってみよう。