Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Последние темы форума

Показать новые сообщения »

Почтовая рассылка

Подписчиков: 11662
Последний выпуск: 19.06.2015

Установка поисковой системы CNSearch на сервер виртуального хостинга (MasterHost, ValueHost и т.п.)

Данная статья содержит инструкцию по установке поискового движка CNSearch на Ваш сайт. CNSearch может производить полнотекстовый поиск по html, doc, rtf, pdf, txt и mp3 файлам, подсвечивать поисковые фразы в результатах поиска, собирать и отображать статистику по поисковым запросам и даже автоматически генерировать Google Sitemap.

Выбор дистрибутива

В первую очередь необходимо определить, какая операционная система установлена на сервере. Хостинг-провайдеры чаще всего используют операционную систему FreeBSD; реже Linux, Windows, Solaris и другие.

Для определения операционной системы нужно создать простой PHP-скрипт:

<?php
phpinfo();
?>

Результат работы скрипта выглядит следующим образом:

Название и версия операционной системы обведены красным цветом: операционная система - FreeBSD, версия - 4.10-RELEASE.

Далее следует скачать дистрибутив CNSearch для FreeBSD 4.X с официального сайта: http://www.cn-software.com/ru/cnsearch/download/

Кроме дистрибутива для FreeBSD понадобится также дистрибутив для Windows, так как индексация будет производиться не на сервере, а на рабочей станции (домашнем или рабочем компьютере). Данный сценарий не является типичным; однако, в случае отсутствия доступа к серверу по SSH это единственный выход.

Распаковка дистрибутивов

Распакуйте оба дистрибутива. С Windows-версией (файл cnsearch-1.5-windows.zip) не должно возникнуть проблем, так как она запакована достаточно распространенным архиватором - ZIP.

С FreeBSD-версией (файл cnsearch-1.5-freebsd4.tgz) могут возникнуть некоторые сложности, так как она запакована стандартными архиваторами операционных систем Unix/Linux - tar + gzip. Для распаковывания можно использовать Windows-версии этих архиваторов.

Более простой способ распаковывания архива cnsearch-1.5-freebsd4.tgz - использование архиватора WinRAR. Проследите, чтобы при скачивании дистрибутива браузер не заменил расширение *.tgz на *.tar. Если это произошло, переименуйте обратно - это существенно важный момент для WinRAR.

Индексация

Индексатор для Windows содержится в каталоге:

cnsearch_pro-1.5-windows\windows\indexer\

В каталоге находятся следующие файлы:

  • idefrag.exe - дефрагментатор поискового индекса;
  • indexer.exe - индексатор;
  • search.conf - конфигурационный файл;
  • libdoc.dll - плагин для индексации файлов Microsoft Word (DOC);
  • libmp3.dll - плагин для индексации MP3 файлов;
  • librtf.dll - плагин для индексации файлов RichText (RTF);
  • libtxt.dll - плагин для индексации текстовых файлов (TXT);
  • libxls.dll - плагин для индексации файлов Microsoft Excel (XLS).

В первую очередь необходимо отредактировать конфигурационный файл: в нем следует указать адреса сайтов, по которым будет производиться поиск. После редактирования файл должен выглядеть примерно следующим образом:

[Job localhost]
[Index]
URL             http://www.warlog.ru/
MaxFiles        10000
MinWord         30

Самый важный параметр конфигурационного файла - адрес сайта, по которому будет производится поиск. В нашем примере это www.warlog.ru.

После завершения процесса редактирования конфигурационного файла можно приступать к процессу индексации. Во время процесса индексации будут скачиваться страницы Вашего сайта, из которых будет прозводиться выборка слов и ссылок, составляющих данный сайт. При первой индексации рекомендуется внимательно контролировать процесс, так как индексатор может зациклиться из-за неверно составленных ссылок.

Так как индексатор - консольное приложение, то запускать его следует из консоли либо посредством консольного файлового менеджера (например FAR).

Запуск консоли производится из меню Пуск -> Выполнить -> cmd. Выбор текущего каталога производится командой cd:


Рисунок 2 - выбор каталога в консоли Windows

Запуск индексатора производится командой:

indexer.exe localhost

В процессе индексации отображается список страниц сайта, которые будут добавлены в поисковый индекс:


Рисунок 3 - процесс индексации

Процесс индексации может длиться от 5 секунд до нескольких дней, в зависимости от скорости соединения и количества страниц сайта. После завершения процесса индексации будут созданы следующие файлы:

docs.cns
files.cns
fulltxt.cns
index.cns

Совокупность данных файлов и составляет поисковый индекс. Файлы содержат списки страниц и слов в специальном формате, предназначенном для быстрого поиска.

Настройка модуля поиска

Требуемый модуль поиска содержится в каталоге:

cnsearch_pro-1.5-FreeBSD\FreeBSD\frontend\

В данном каталоге находятся два файла:

  • search.cgi - модуль поиска;
  • cnsearch.conf - конфигурационный файл модуля поиска.

Оба файла необходимо скопировать посредством FTP в каталог cgi-bin на Вашем сервере:


Рисунок 4 - копирование файлов в каталог cgi-bin

После завершения процесса копирования нужно задать права для файла search.cgi таким образом, чтобы сделать его запускаемым. Как правило, это осуществляется посредством команды "chmod 755 search.cgi". В Far Manager это можно сделать с помощью комбинации клавиш Ctrl-A:


Рисунок 5 - установка прав для файла search.cgi

Далее необходимо скопировать все файлы поискового индекса (*.cns) в каталог cgi-bin:


Рисунок 6 - копирование файлов поискового индекса на сервер.

Тестирование

После завершения процесса копирования файлов поискового индекса на сервер система готова к использованию. Чтобы удостовериться в этом, нужно перейти по адресу http://www.вашсервер.ru/cgi-bin/search.cgi.


Рисунок 7 - поисковая форма CNSearch

Для проверки работы системы введите простой поисковый запрос в соответствующее поле:


Рисунок 8 - результаты работы поисковой системы CNSearch.

Примечание:

В данной инструкции не рассматриваются следующие вопросы:

  • как ускорить поиск и для чего нужна дефрагментация поискового индекса;
  • как подключить поддержку морфологии;
  • для чего нужны стоп-слова и как их использовать;
  • как посмотреть статистику по поисковым запросам;
  • как автоматически сгенерировать Google sitemap;
  • какие дополнительные настройки необходимы для оптимизации поиска.

Данные вопросы детально описаны в руководстве пользователя, которое прилагается к дистрибутиву системы. Кроме того, с руководством можно ознакомиться на официальном сайте компании - http://www.cn-software.com/ru/cnsearch/manual/

Ссылки по теме:

Оставить комментарий

Комментарий:
можно использовать BB-коды
Максимальная длина комментария - 4000 символов.
 
Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог