spreadsheetの使い方

Xpathの使い方が分からない!けどChromeの検証使ってみたら・・

更新日:

スプレッドシート上でベンチマークしたいサイトの情報をデータ取得出来たら、非常に便利ですよね。

それがスプレッドシートならImportXML関数を使えば可能なんです。

 

しかし!

 

ImportXML関数は第2関数である「Xpath」の使い方を理解しないと、”サイト情報の取得”はおろか、関数自体もうまく使えません・・(´;ω;`)ブワッ

 

そこで今回は

Xpathの使い方が分からない!
ならChromeの検証から取得してみよう!

についてご紹介させていただきます。

Xpathの使い方が複雑過ぎて泣ける

https://pixabay.com/users/Fotari70DX/

Xpathを理解するだけで3日以上かかっている僕。(どんだけ)

 

さて、ウエブ上からデータを抽出する技術を「スクレイピング」と言います。

 

そのスクレイピング技術を使うのにマスターしたいのが「Xpath」という言語。

 

今回は ”importXML関数を使ってスクレイピング" を目的とした、Xpathの使い方について忘れないようにまとめていきます。

 

Xpathの使い方がなぜ難しいのか

https://pixabay.com/users/qimono/

「Xpath」はXML文書の特定の部分を指定する言語のこと。

 

なぜこのXpathの使い方が難しいのかというと、指定する定義が定まっていないから。

 

いや、定まっているのですが※マークアップ言語について、きちんと理解がないと使えないんすよ。

 

マークアップ言語(マークアップげんご、英: markup language)は、視覚表現や文章構造などを記述するための形式言語である

引用元:https://ja.wikipedia.org/wiki/マークアップ言語

 

というのもサイト毎にデータの構造が違えば、抽出したいデータの要素が違ってくるわけで。

 

そのため、あるサイトのデータを抽出するのに使えたXpathが他のサイトのデータを抽出するには使えないなんてことも。

 

そもそもエンジニアでもなんでもない人(あたす)にとっては、ハードルが高いというかガチで意味が分かりませんでした。ルートとかノードとかっておいしいの?

 

アヒルン
だから「エックスパス」なんだな・・

Xpathを使いたい!Chromeの検証画面から

https://pixabay.com/users/377053/

だけどImportXML関数を知ってしまったからには、せめて自分のサイトデータくらい抽出したいやんけw!

 

そんなわけでリサーチしてみた結果、Xpathを取得する方法を見つけました。

 

それはChromeの「検証」画面からXpathをコピーすることです。

 

自分で要素について調べなくても、コピペでできちゃうんです。これはメシウマ━━━━━━ヽ(^Д^)ノ━━━━━━!!!!!!

この方法でコピペしたXpathは、基本的にはそのサイトのデータ抽出でしか使えません。

 

ではXpathをChromeで取得して、ImportXMLに挿入していく手順をご紹介します。

次のページへ >



  • この記事を書いた人
  • 最新記事
oyakun

oyakun

30代半ば♂妻・子3人の5人で日々激戦中。Google app script&VBA初心者が自分の備忘録を兼ねて「スプレッドシート、Excel、WordPress、plugin」の設定等、主にブログやアフィリエイト周辺のtipsを背伸びしながらご紹介しています。

Copyright© OYAKUDACHI.XYZ , 2018 All Rights Reserved.