Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Почтовая рассылка

Подписчиков: -1
Последний выпуск: 19.06.2015

PHP класс для импорта новостей

(c) 2004 Mikhail Krivyy
22 февраля 2004 года

 Скачать в архиве (~5Kb)

Описание

В данной статье описан PHP класс для импорта новостей. Реализована поддержка стандартов rss091 и ultramode.txt.

Класс позволяет импортировать, обрабатывать и кешировать новости с внешних серверов, таких как:

Для кеширования можно использовать временные файлы или MySql таблицу.

Обработчики входных файлов вынесены в отдельные классы, благодоря чему можно легко увеличивать количество поддерживаемых стандартов.

Последнюю версию вы всегда можете найти на www.codenet.ru.

Если этот класс вам покажется громоздким, то можете использовать более простой, но менее универсальные вариант: http://codenet.ru/webmast/php/mcaching.php

Вопросы, предложения и исправления через форму обратной связи.

Скачать в архиве (~5Kb)

Шаблоны

Вы можете задавать внешний вид новостей с помощью шаблонов (см. пример). В шаблоне можно использовать следущие служебные слова:

Для ultramode:

  • %URL%- ссылка на новость
  • PHP класс для импорта новостей- заголовок
  • %PUBDATE%- дата публикации
  • %AUTHOR%- автор
  • %TOPIC%- тема
  • %COMMENTS%- количество комментариев
  • %IMAGE%- иконка новости

Для rss091:

  • %URL%- ссылка на новость
  • PHP класс для импорта новостей- заголовок
  • %DESCRIPTION%- описание новости
  • %PUBDATE%- дата публикации

Исходный текст класса

Код:
<?
/* Вспомогательный класс для разбора входного файла   */
/*                                                    */
/* Парсер rss091                                      */
/*                                                    */
/* Используется следующим образом:                    */
/*                                                    */
/* $parser=new RSS091Parser(dateformat);              */
/* $result=$parser->Parse(data,template,newscount);   */
/*                                                    */
/* , где:                                             */
/*                                                    */
/* - dateformat - формат даты (как у функции date())  */
/* - data - данные для обработки                      */
/* - выходной шаблон                                  */
/* - количество обрабатываемых новостей               */

class RSS091Parser {

    var $DATA;
    var $template;
    var $xml_parser;
    var $newscount;
    var $dateformat;

    function RSS091Parser($idateformat) {
        $this->dateformat=$idateformat;
        $this->DATA=Array();        
        $this->DATA["count"]=0;
        }

    /* RSS 0.91 XML Handlers */
    function startElement($parser, $name, $attrs) {
        $this->DATA["curtag"]=$name;
        $this->DATA[$name]="";
        }

    function endElement($parser, $name) {
        if ($name=="ITEM" && $this->DATA["count"]<$this->newscount) {
            $t=$this->template;
            if (!empty($this->dateformat)) {
                $ttime=strtotime($this->DATA["PUBDATE"]);
                $this->DATA["PUBDATE"]=date($this->dateformat,$ttime);
                }

            $t=str_replace("%URL%",$this->DATA["LINK"],$t);
            $t=str_replace("PHP класс для импорта новостей",$this->DATA["TITLE"],$t);
            $t=str_replace("%DESCRIPTION%",$this->DATA["DESCRIPTION"],$t);
            $t=str_replace("%PUBDATE%",$this->DATA["PUBDATE"],$t);
            $this->DATA["data"].=$t;
            $this->DATA["count"]++;
            }
        $this->DATA["curtag"]="";
        }

    function characterData($parser, $data) {
        $this->DATA[$this->DATA["curtag"]].=$data;
        }

    function Parse($data,$itemplate,$newscount) {
        $this->template=$itemplate;
        $this->newscount=$newscount;

        $this->xml_parser=xml_parser_create();
        xml_set_object($this->xml_parser, &$this);
        xml_set_element_handler($this->xml_parser, "startElement", "endElement");
        xml_set_character_data_handler($this->xml_parser, "characterData");
        xml_parse($this->xml_parser, $data) or die("Error parsing XML");
        xml_parser_free($this->xml_parser);

        return($this->DATA["data"]);
        }
    };

/* Вспомогательный класс для разбора входного файла   */
/*                                                    */
/* Парсер ULTRAMODE                                   */
/*                                                    */
/* Используется следующим образом:                    */
/*                                                    */
/* $parser=new ULTRAMODEParser(dateformat);           */
/* $result=$parser->Parse(data,template,newscount);   */
/*                                                    */
/* , где:                                             */
/*                                                    */
/* - dateformat - формат даты (как у функции date())  */
/* - data - данные для обработки                      */
/* - выходной шаблон                                  */
/* - количество обрабатываемых новостей               */

class ULTRAMODEParser {
    var $dateformat;

    function ULTRAMODEParser($idateformat="") {
        $this->dateformat=$idateformat;
        }

    function Parse($data,$itemplate,$newscount) {
        if (strpos($data,"\n\r")) $data=explode("\n\r",$data);
        elseif (strpos($data,"\r\n")) $data=explode("\r\n",$data);
        elseif (strpos($data,"\n")) $data=explode("\n",$data);
        elseif (strpos($data,"\r")) $data=explode("\r",$data);
        $c=count($data);
        $s=0;while (substr($data[$s],0,2)!="%%" && $s<$c) $s++;
        $s++;$news=0;$result="";
        for ($i=$s;$i<$c;$i+=8) {
            if ($news>=$newscount) break;
            $t=$itemplate;
           
            $pubdate=trim($data[$i+2]);
            if (!empty($this->dateformat)) {
                $ttime=strtotime($pubdate);
                $pubdate=date($this->dateformat,$ttime);
                }

            $t=str_replace("%URL%",trim($data[$i+1]),$t);
            $t=str_replace("PHP класс для импорта новостей",trim($data[$i+0]),$t);
            $t=str_replace("%PUBDATE%",$pubdate,$t);
            $t=str_replace("%AUTHOR%",trim($data[$i+3]),$t);
            $t=str_replace("%TOPIC%",trim($data[$i+4]),$t);
            $t=str_replace("%COMMENTS%",trim($data[$i+5]),$t);
            $t=str_replace("%IMAGE%",trim($data[$i+6]),$t);
            $news++;
            $result.=$t;
            }
        return($result);
        }
    };


/* Основной класс */

class News {

    var $type;                // Tип импортируемого файла (rss091, ultramode)
    var $updatetime;        // Дата обновления кеша
    var $template;            // Шаблон одной новости
    var $save;                // Куда сохранять (mysql,file)
    var $newscount;         // Количество новостей
    var $MYCONN;            // MySql connection
    var $dateformat;        // Lормат датv. +сли пусто, то остается по старому.

    // Если save==mysql
    var $mysql_server;        // MySql сервер
    var $mysql_login;        // MySql логин
    var $mysql_password;    // MySql пароль
    var $mysql_database;    // MySql имя базv даннvх

    // Если save==file
    var $file_path;            // Путь для сохранения временного файла
    var $file_prefix;        // Префикс временного файла

    /* Конструктор                                                         */
    /*                                                                     */
    /* iupdatetime - частота обновления, в секундах (по умолчанию 1 час)   */
    /* itype - тип файла экспорта новостей (rss091 или ultramode)          */
    /* inewscount - колчество обрабатываемых новостей (по умолчанию 10)    */
    /*                                                                     */
    /* Пример:                                                             */
    /*                                                                     */
    /*    $news=new News(28800,"ultramode",5);                             */
    /*                                                                     */

    function News($iupdatetime=3600,$itype="rss091",$inewscount=10) {
        $this->MYCONN=FALSE;
        $this->save="file";
        $this->mysql_server="locahost";
        $this->mysql_login="root";
        $this->mysql_password="";
        $this->mysql_database="news";
        $this->file_prefix="news_";
        $this->file_path="/tmp/";
        $this->type=$itype;
        $this->newscount=$inewscount;
        $this->updatetime=$iupdatetime;
        $this->template="<a href=\"%URL%\">PHP класс для импорта новостей</a>\n<br>%DESCRIPTION%\n<br>\n";
        }

    /* Установка параметров MySql. Если этот метод не вызывается, то       */
    /* кеширование производится в файл, иначе в MySql таблицу:             */
    /*                                                                     */
    /* CREATE TABLE `newsimport` (                                         */
    /*   `id` int(11) NOT NULL default '0',                                */
    /*   `d_update` int(11) NOT NULL default '0',                          */
    /*   `data` text NOT NULL                                              */
    /* ) TYPE=MyISAM;                                                      */
    /*                                                                     */
    /* server - сервер (хост), например localhost                          */
    /* login - логин для подключения к MySql                               */
    /* password - пароль для подключения к MySql                           */
    /* database - база данных                                              */
    /*                                                                     */
    /* Пример:                                                             */
    /*                                                                     */
    /*    $news->setmysql("localhost","root","","mydatabase");             */
    /*                                                                     */

    function setmysql($server,$login,$password,$database) {
        $this->save="mysql";
        $this->mysql_server=$server;
        $this->mysql_login=$login;
        $this->mysql_password=$password;
        $this->mysql_database=$database;
        }

    /* Установка параметров кеш файлов. Если этот метод вызывается, то     */
    /* кеширование производится в файл.                                    */
    /*                                                                     */
    /* Пример производит кегирование в /usr/home/andrey/tmp/codenet_*      */
    /*                                                                     */
    /*     $news->setfile("/usr/home/andrey/tmp/","codenet_");             */
    /*                                                                     */
    /*                                                                     */

    function setfile($path,$prefix) {
        $this->save="file";
        $this->file_prefix=$prefix;
        $this->file_path=$path;
        }

    /*                                                                     */
    /* Чтение шаблона из файла                                             */
    /*                                                                     */
    /* filename - имя файла с шаблоном                                     */
    /* idateformat - формат даты (как у функции date())                    */
    /*                                                                     */

    function readtemplate($filename,$idateformat="") {
        if (!is_file($filename)) die("File '".$filename."' not found\n");
        $this->dateformat=$idateformat;
        $this->template=implode("",file($filename));
        }

    /*                                                                     */
    /* Установка шаблона из переменной                                     */
    /*                                                                     */
    /* template - имя файла с шаблоном                                     */
    /* idateformat - формат даты (как у функции date())                    */
    /*                                                                     */

    function settemplate($template,$idateformat="") {
        $this->dateformat=$idateformat;
        $this->template=$template;
        }

    /*                                                                     */
    /* Получение, обработка и кеширование новостей - основной метод        */
    /*                                                                     */
    /* url - адрес, откуда берутся новости                                 */
    /*                                                                     */

    function read($url) {
        /* исползуем crc32 от адреса, в качестве уникального */
        /* идентификатора источника новостей */
        $id=crc32($url);
       
        /* установим время последнего обновления новости в 0 */
        $lastupdatetime=0;

        switch ($this->save) {
            /* для кеширования в MySql */
            case "mysql":
                /* соединение с базой данных */
                if (!$this->MYCONN) {
                    $this->MYCONN=mysql_connect($this->mysql_server,
                                                $this->mysql_login,
                                                $this->mysql_password)
                        or die(mysql_error());
                    mysql_select_db($this->mysql_database,$this->MYCONN)
                        or die(mysql_error());
                    }

                /* Получим дату последнего обновления новостей */
                $r=mysql_query("SELECT d_update
                                FROM newsimport
                                WHERE id='"
.$id."';",$this->MYCONN)
                    or die(mysql_error());

                if (mysql_num_rows($r)==1) {
                    $lastupdatetime=mysql_result($r,0,0);
                    }
                /* Если записи с такми ID не существует, то новости с этого */
                /* сервера импортируется впервые, и необходимо создать для */
                /* него запись, а $lastupdatetime оставить равной нулю */
                elseif (mysql_num_rows($r)==0) {
                    mysql_query("INSERT INTO newsimport
                                 SET id='"
.$id."', d_update=UNIX_TIMESTAMP();");
                    }
                mysql_free_result($r);
                break;

            /* для кеширования в файл */
            case "file":
            default:
                /* получим имя полное файла */
                $fname=$this->file_path.$this->file_prefix.$id;
                /* получим дату последнего обновления */
                $d=@file($fname.".time");
                if (is_array($d)) $lastupdatetime=intval($d[0]);
                /* Если такого файла не существует, то новости с этого */
                /* сервера импортируется впервые, и необходимо создать для */
                /* него запись, а $lastupdatetime оставить равной нулю */
                else {
                    $fw=fopen($fname.".time","wt");
                    if (!$fw) die("Невозможно сохранить дату обновления
                                   в кеш файле - \""
.$fname.".time\"");
                    fputs($fw,time());
                    fclose($fw);
                    }
            }
       
        $fromcache=0;
        /* Если пора обновлять кеш... */
        if (time()-$this->updatetime>$lastupdatetime) {
            /* то получим данные с сервера новостей */
            $d=@file($url);
             if (is_array($d)) {
                $d=implode("",$d);
                /* Обраобаем данные, в зависимости от типа, с помощью */
                /* специальных объектов (см. выше) */
                switch ($this->type) {
                    case "ultramode":
                        $parser=new ULTRAMODEParser($this->dateformat);
                        $result=$parser->Parse($d,
                                               $this->template,
                                               $this->newscount);
                        break;
                    case "rss091":
                    default:
                        $parser=new RSS091Parser($this->dateformat);
                        $result=$parser->Parse($d,
                                               $this->template,
                                               $this->newscount);
                    }
                /* Сохоаним данные в MySql или файле */
                /* Изменим дату последнего обновления на текущую */
                switch ($this->save) {
                    case "mysql":
                        mysql_query("UPDATE newsimport
                                     SET d_update=UNIX_TIMESTAMP(),
                                         data='"
.$result."'
                                     WHERE id='"
.$id."';")
                            or die(mysql_error());
                        break;
                    case "file":
                    default:
                        $fname=$this->file_path.$this->file_prefix.$id;

                        $fw=@fopen($fname.".time","wt");
                        if (!$fw) die("Невозможно сохранить дату обновления
                                       в кеш файле - \""
.$fname.".time\"");
                        fputs($fw,time());
                        fclose($fw);

                        $fw=@fopen($fname.".text","wt");
                        if (!$fw) die("Невозможно сохранить текст новостей в
                                       кеш файле - \""
.$fname.".text\"");
                        fputs($fw,$result);
                        fclose($fw);
                    }
                }
            else $fromcache=1;
            }
        else $fromcache=1;

        /* Если не надо получать новости с сервера новосей, или он не */
        /* работает, то возьмем из их кеша */
        if ($fromcache==1) {
            switch ($this->save) {
                /* Для MySql */
                case "mysql":
                    $r=mysql_query("SELECT data
                                    FROM newsimport
                                    WHERE id='"
.$id."';")
                        or die(mysql_error());
                    $result=mysql_result($r,0,0);
                    mysql_free_result($r);
                    break;
                /* Для файлов */
                case "file":
                default:
                    $result=implode("",file($this->file_path.
                                            $this->file_prefix.
                                            $id.
                                            ".text"));
                }
            }
        return($result);
        }
    };
?>

Примеры использования

Код:
<?
include "newsimport.php";

/* Импортируем новости с http://www.codenet.ru/export/read.xml                   */
/* Синхронизация с сервером: раз в два часа                                  */
/* Количество новостей: 4                                                    */
/* Кеш: в файле /tmp/news_*                                                  */
/* Формат: rss091                                                            */
/* Шаблон новостей: из файла codenet.htm                                     */
/* Формат даты: день/мес                                                     */

$news=new News(7200,"rss091",5);
$news->readtemplate("codenet.htm","d/m");
print $news->read("http://www.codenet.ru/export/read.xml");
?>
<hr>
<?
/* Импортируем новости с http://news.yandex.ru/index.rss                     */
/* Синхронизация с сервером: раз в 10 минут                                  */
/* Количество новостей: 10                                                   */
/* Кеш: в mysql                                                              */
/* Формат: rss091                                                            */
/* Шаблон новостей: задается в переменной                                    */
/* Формат даты: часы:минуты день/мес                                         */

$news=new News(600,"rss091",10);
$news->setmysql("localhost","login","password","tablename");
$news->settemplate("<B>%PUBDATE%</B>: <a href=\"%URL%\">PHP класс для импорта новостей:</a>
                    %DESCRIPTION%"
,"H:m d/m");
print $news->read("http://news.yandex.ru/index.rss");
?>
<hr>
<?
/* Импортируем новости с http://forum.novgorod.ru/ultramode.txt              */
/* Синхронизация с сервером: раз в минуту                                    */
/* Количество новостей: 10                                                   */
/* Кеш: в mysql                                                              */
/* Формат: ultramode                                                         */
/* Шаблон новостей: задается в переменной                                    */
/* Формат даты: часы:минуты                                                  */

$news=new News(60,"ultramode",10);
$news->settemplate("<B>%PUBDATE%</B>:
                    <a href=\"%URL%\">PHP класс для импорта новостей:</a>(%AUTHOR%)<br>"
,"H:m");
print $news->read("http://forum.novgorod.ru/ultramode.txt");
?>

Оставить комментарий

Комментарий:
можно использовать BB-коды
Максимальная длина комментария - 4000 символов.
 

Комментарии

1.
49K
15 апреля 2009 года
iloi
0 / / 15.04.2009
Мне нравитсяМне не нравится
15 апреля 2009, 18:50:49
как решить проблему с кодировкой???

активно не хочет быть в windows-1251

рсс беру у вас http://www.codenet.ru/export/read.xml
кеш делаю из файла
2.
44K
05 декабря 2008 года
Kite9ua
1 / / 05.12.2008
Мне нравитсяМне не нравится
5 декабря 2008, 14:59:24
Хелп :)
Я не кодер и не продвинутый девелопер, но очь нужен импортер контента.

Сделал 2 файла, что тут показаны - назвал их так же как они называются в архиве (архивные устарели как я понял).
В newsimport.php
изменил параметры тут на свои:
$this->mysql_server="locahost";
$this->mysql_login="root";
$this->mysql_password="";
$this->mysql_database="news";
путь к базе прописал так http://...сервер/ (пытался писать просто сервер-баз данных, но не пошло - с http в принципе тоже не пошло)

В example.php
$news=new News(600,"rss091",10);
$news->setmysql("localhost","login","password","tablename");
$news->settemplate("<B>%PUBDATE%</B>: <a href=\"%URL\">PHP класс для импорта новостей:</a>
%DESCRIPTION%","H:m d/m");
print $news->read("http://news.yandex.ru/index.rss");
?>
Тут указал свои данные ("localhost","login","password","tablename")- сервер базы данных писал и с http и без.

При запуске codenet.htm (тут ничего не трогал) и newsimport.php ничего не происходит. В codenet.htm только теги вылазят на экран: PHP класс для импорта новостей %PUBDATE% %DESCRIPTION%

А при запуске example.php - вылазит следующее:
Warning: file(/tmp/news_2306053390.text) [function.file]: failed to open stream: No such file or directory in /sata1/home/users/мой_логин/www/мой_домен/1/newsimport.php on line 385

Warning: implode() [function.implode]: Invalid arguments passed in /sata1/home/users/мой_логин/www/мой_домен/1/newsimport.php on line 385

Warning: mysql_connect() [function.mysql-connect]: Host 's8.freehost.com.ua' is not allowed to connect to this MySQL server in /sata1/home/users/мой_логин/www/мой_домен/1/newsimport.php on line 267
Host 's8.freehost.com.ua' is not allowed to connect to this MySQL server

Может где чего за комментировать надо или где убрать комментарий у кода?
Подскажите плиз!!! :)
3.
41K
10 июля 2008 года
itiman
0 / / 10.07.2008
Мне нравитсяМне не нравится
10 июля 2008, 22:02:18
Да и закрывающий процент %URL в файле example.php
4.
Аноним
Мне нравитсяМне не нравится
25 февраля 2005, 12:29:15
в конструкторе, строчка формирования новости: $this->template="<a href=\"%URL\">PHP класс для импорта новостей</a>\n<br>%DESCRIPTION%\n<br>\n";

"%URL\ - потеряли закрывающий процент.
Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог