業務効率化に使えるスプレッドシートの関数「IMPORTXML関数」について、以前このような記事を書きました。

【業務効率化】商品情報を一括で取得!IMPORTXML関数の使い方

IMPORTXML関数は難しいプログラミングの知識がなくてもサイト情報を一括で取得できる便利なものです。
しかし、記事末尾に記載の通り結果の抽出に時間がかかるため、対象のURLが50件を超える場合などにはあまり適していません。
そこで、今回はこのIMPORTXML関数を使っていて重たい・遅いとお悩みの方へ、より効率的で便利なツールをご紹介します。

それがこちら!

Octoparse
https://www.octoparse.jp/

IMPORTXML関数と同様にプログラミングコードが不要なWebスクレイピングツールです。
料金形態は無料版~エンタープライズ版まで複数あります。
無料版では作れるタスクが10個までという制限がありますが、用途が10個以内に収まるなら無料版で十分に使えます。
こちらのツールはパソコンにインストールすることで使えます。(Windows・macOSどちらも使えます。)

このツールの威力ですが、例えばサイト内の1000個のURLに対してIMPORTXML関数では1日かかっても情報取得が終わるかどうかわからないところ、Octoparseでは30分ほどで必要な情報をすべて取得できました。
最初の設定だけしておけば、あとは30分間放置するだけなのでその間も他の業務を進められます。

使用手順

今回は一番簡単な使用例として「ECサイトの複数URLの商品タイトルを取得する」ということを目的とした手順を紹介します。

1)最初にOctoparse用のアカウントを登録します。

2)登録が完了したら、タスクを作成します。
ツール左メニューから「新規作成>カスタマイズタスク」を選択します。

3)情報を取得したいURLを貼り付けます。

4)貼り付けたURLの1番最初のページが表示されるので、取得したい要素をクリックし、「選択した要素のテキストを抽出する」を選択します。

5)ページ下部に取得したデータが表示されます。右側には取得のプロセスが表示されます。問題なければ右上の保存と実行ボタンを押します。

6)抽出方法を選択します。無料版ではローカル抽出のみ使用できます。
また、加速モードは無料版では3回まで使用できますが、4回目以降は通常モードのみとなります。
※加速モードは通常モードの約3~5倍程度の速さで処理できるイメージです。

7)データ処理が完了したらデータをエクスポート(出力)します。

出力方法は以下から選べます。

 

総括

今回は一番簡単な例を紹介しましたが、他にもルールの決め方次第で如何様にも情報の取得が可能です。
やり方次第では、広告配信用のフィード作成さえもこれだけで出来てしまうと思います。

商材の多いサイトなど大量の情報を管理しなければいけない場合は、こういったツールを活用して業務効率化を図りましょう。
今回は一番メジャーなツールとしてOctoparseを紹介しましたが、他にも似たようなツールはあるので、是非ご自身にあったツールを見つけて業務効率の改善に繋げていただければと思います。
それでは。

The following two tabs change content below.

Kyotaro Yamaoka

横浜国立大学工学部卒。重工業系エンジニアを経て、2015年にWebマーケティング業界に参入。 前職では広告代理店のリーダーとして各種Web広告の運用を中心に多様なクライアントのプロモーションを支援。「デジタルマーケティング業界の何でも屋」「一人一人が獅子になる」という考え方に共感し 、2021年に援軍へ入社。 データ分析に強みを持つ理系ディレクター。