Yahoo!Pipesの「Fetch page」が非推奨になり、6月末から使用不可になります。
代わりに「XPath Fetch Page」というモジュールが追加されます。このモジュールを使いこなすには、XPathの知識が必要になります。
XPathとは?
Wikipediaによると、
XML Path Language (XPath; XMLパス言語) は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文である。
つまり、XPathを用いることで、HTMLやXMLドキュメントのあらゆる場所や位置関係を簡単な構文で指定することができます。XPathは、JavaやJavaScriptでもよく使われています。
XPathを理解するには、HTMLやXMLの階層構造を頭に入れておく必要があります。たとえば、以下のようなHTMLドキュメントがあるとします。
<div class=”foo”><p>これを取得したい</p></div>
この場合は、親がdiv要素かつクラス名がfooであるp要素を取得したいので、
//div[@class=”foo”]/p と表記します。
XPath Fetch pageの関連リンク
- Pipes – Source Modules (英語)
- Yahoo! Pipes Blog (英語)
英語のマニュアルしかまだないようなので、次回は「XPath fetch pageの使い方」に関する記事を書く予定です。
ネットの反応
2ちゃんねる
- 790 :名無しさん@お腹いっぱい。:2012/04/24(火) 14:46:31.79
- fetch pageなくなってね?
- 791 :名無しさん@お腹いっぱい。:2012/04/24(火) 15:30:18.60
- それはDeprecatedに入って、新しくXPath Fetch Pageができてる
- 792 :名無しさん@お腹いっぱい。:2012/04/24(火) 15:46:06.96
- 何が変わったん?
- 793 :名無しさん@お腹いっぱい。:2012/04/24(火) 16:14:58.33
- xpathわかってればこっちのほうがずっと使いやすいと思う
Emit items as string使うとFetch Pageぽくなる
HTMLの構造がはっきりしてるならas string使わずに抜き出す方が便利かもしれないけど
たとえば<p>1<span>2</span>3</p>みたいな構造のときに1が消えるのは注意だな - 795 :名無しさん@お腹いっぱい。:2012/04/25(水) 07:47:30.97
- Fetch Pageは6月末で使えなくなるんだって
それまでにXPATH Fetch Pageに書き換えろと
メインでたくさん使ってると大変だな - 796 :名無しさん@お腹いっぱい。:2012/04/25(水) 09:02:08.55
- >>795
工エエェェ(´д`)ェェエエ工
マジかそれ
なんか泣きそうだ - 800 :名無しさん@お腹いっぱい。:2012/04/26(木) 15:42:43.65
- というかxpath自体が何なのかよく理解できない。
- 802 :名無しさん@お腹いっぱい。:2012/04/28(土) 05:13:49.95
- yql使うためにxpathは覚えたいと思っていたから、ちょうどいい機会だと思うことにした
- 804 :名無しさん@お腹いっぱい。:2012/04/29(日) 05:14:27.94
- 大体修正終わった。
ただfetch pageだとリダイレクトされてるページも取り込めたけど、
xpathだと追えないみたいで困ってる。 - 805 :名無しさん@お腹いっぱい。:2012/04/29(日) 08:45:32.49
- xPathに限らず、リダイレクトに遭遇したときはマジで困る
- 809 :名無しさん@お腹いっぱい。:2012/05/07(月) 00:34:38.03
- いかん全然理解できない
多分一度わかれば今までよりずっと簡単なんだろうけど
- 818 :名無しさん@お腹いっぱい。:2012/05/18(金) 14:30:23.88
- いかんエックスパスわからん(‘A`)
- 820 :名無しさん@お腹いっぱい。:2012/05/21(月) 14:02:33.67
- dapperが不調なのでRSSクリエイターに移行したら、こちらも先週から不調。
XPath勉強しないとダメなのか…。 - 832 :名無しさん@お腹いっぱい。:2012/05/27(日) 09:58:05.78
- //a/@href で href属性のURLが取得できなかったり、
//hoge/*[3] で hoge下の 3番目の子要素が取れないとか。
XPathの機能が完全に実装されてない感じ。
それとスレタイ検索で探したけど XPath専用スレが無いのは意外。
- 838 :名無しさん@お腹いっぱい。:2012/05/29(火) 22:29:53.70
- わかってくるとこれ便利だな
楽しいし