スクレイピングは他のWebサイトの情報を取得して編集し直して再利用するものです。有名なのはYahoo!のサイトにあるMoneyLookのアカウントアグリゲーションでしょうか。
スクレイピングには取得したサイトの情報を正規化して必要な情報(特に動的な部分)を取り出すため、XMLの抽出を行います。
PHP5ではSimpleXMLという便利なクラスが用意されていて楽にスクレイピングできるらしいので下記などを参考にしてやってみました。
特に問題なく動きました。
未整形HTMLをXMLに変換テーマ:インターネットサービス - ジャンル:コンピュータ
- 2008/03/22(土) 23:39:48|
- 日記
-
| トラックバック:0
-
| コメント:0