Calendar

<< 11月 >>
 1
2345678
9101112131415
16171819202122
23242526272829
30  
2009年11月19日の記事一覧
  • 複数のRSSを統合し最新情報を取得する
  • 2009.11.19
  • 複数のサイトのRSSを受信し、その中の記事を日付の新しい順に何件か表示する場合、最初にRSSを一つにまとめるか、個別にRSSを受信し、その後統合、ソートとするかだと思いますが、今回はPHPで複数RSSを表示するプログラムを後者の方法で行なってみました。


    PHP用のRSS パーサにはMagpieRSSというものを使用しました。


    以下、プログラムソースです。
    ※カッコが全角になっているので、そのままコピペして使用しないでください。


    <?
    require_once(‘./includes/magpierss/rss_fetch.inc’);  //MagpieRSSロード
    define(‘MAGPIE_OUTPUT_ENCODING’, ‘UTF-8’);

    //読み込むRSSを配列に格納
    $rssUrl=array(“http://www.abc1.com/feed“,
      “http://www.abc2.com/feed.rdf“,
      “http://www.abc3.com/index.rdf“,
      “http://www.abc4.com/rss.xml
     );

    //表示する記事の件数
    $num=5;

    $HTMLbody =””;

    foreach ($rssUrl as $no => $rss_url) {
     if ($rss_url != ”) {
      //URLからRSSを取得
      $rss   = @fetch_rss($rss_url);
      if ($rss != NULL) {
       for ($i=0; $i<count($rss->items); $i++) {
        //サイトのタイトルをitemsに格納
        $rss->items[$i][“site_title”] = $rss->channel[“title”];
       }
       //itemsだけ別配列に格納
       $rssItemsArray[] = $rss->items;
      }
     }
    }

    $concatArray = array();
    if (is_array($rssItemsArray)) {
     for($i=0;$i<count($rssItemsArray);$i++){
      //配列を統合する
      $concatArray = array_merge($concatArray,$rssItemsArray[$i]);
     }

     foreach ($concatArray as $no => $values) {
      $date=$values[“date_timestamp”];
      $title=$values[“title”];
      $link=$values[“link”];
      $site_title=$values[“site_title”];
      //記事ごとに必要な項目を抽出
      $rssArray[]=array($date, $title, $link, $site_title);
     }

     //配列をユーザー定義関数でソート
     if ($rssArray) { usort($rssArray, ‘cmp’); }
     if (count($rssArray) > $num) {
      $count=$num;
     } else {
      $count=count($rssArray);
     }

     //必要な件数分だけHTML整形
     for ($i=0; $i<$count; $i++) {
      $date=date(“Y-m-d H:i”,$rssArray[$i][0]);
      $link=$rssArray[$i][2];
      $title=$rssArray[$i][1];
      $site_title=$rssArray[$i][3];
      $HTMLbody .=$site_title.”【”.$date.”】<a href=””.$link.”” target=”_blank”>”.$title.”</a><br />n”;
     }
     
    }

     //=======================================================
     // 多次元配列ソート用比較関数
     // この場合は配列の1番目の項目を降順にソート
     //=======================================================
     function cmp($a, $b) {
      if ($a[0] == $b[0]) return 0;
      return ($a[0] > $b[0]) ? -1 : 1;
     }
    ?>
    <?php echo ‘<?xml version=”1.0″ encoding=”UTF-8″ ?>’.”n” ?>
    <!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Transitional//EN”
      “http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>
    <html xmlns=”http://www.w3.org/1999/xhtml”>
    <head>
    <meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
    <title>test</title>
    </head>
    <body>
    <?= $HTMLbody ?>
    </body>
    </html>


    複数のRSSを処理すると、かなり遅いです。
    試しに、perlでRSSを統合するプログラムも制作しましたが、こちらもそれなりのお時間がかかりました・・・ 😯


    改善策をご存知の方は、是非コメントください。


    ホームページ制作・WEBシステム開発

【この記事のタグ】
コメント&トラックバック(1)

▲ PAGE TOP