Установка поисковой системы CNSearch на сервер виртуального хостинга (MasterHost, ValueHost и т.п.)
Данная статья содержит инструкцию по установке поискового движка CNSearch на Ваш сайт. CNSearch может производить полнотекстовый поиск по html, doc, rtf, pdf, txt и mp3 файлам, подсвечивать поисковые фразы в результатах поиска, собирать и отображать статистику по поисковым запросам и даже автоматически генерировать Google Sitemap.
Выбор дистрибутива
В первую очередь необходимо определить, какая операционная система установлена на сервере. Хостинг-провайдеры чаще всего используют операционную систему FreeBSD; реже Linux, Windows, Solaris и другие.
Для определения операционной системы нужно создать простой PHP-скрипт:
<?php phpinfo(); ?>
Результат работы скрипта выглядит следующим образом:
Название и версия операционной системы обведены красным цветом: операционная система - FreeBSD, версия - 4.10-RELEASE.
Далее следует скачать дистрибутив CNSearch для FreeBSD 4.X с официального сайта: http://www.cn-software.com/ru/cnsearch/download/
Кроме дистрибутива для FreeBSD понадобится также дистрибутив для Windows, так как индексация будет производиться не на сервере, а на рабочей станции (домашнем или рабочем компьютере). Данный сценарий не является типичным; однако, в случае отсутствия доступа к серверу по SSH это единственный выход.
Распаковка дистрибутивов
Распакуйте оба дистрибутива. С Windows-версией (файл cnsearch-1.5-windows.zip) не должно возникнуть проблем, так как она запакована достаточно распространенным архиватором - ZIP.
С FreeBSD-версией (файл cnsearch-1.5-freebsd4.tgz) могут возникнуть некоторые сложности, так как она запакована стандартными архиваторами операционных систем Unix/Linux - tar + gzip. Для распаковывания можно использовать Windows-версии этих архиваторов.
Более простой способ распаковывания архива cnsearch-1.5-freebsd4.tgz - использование архиватора WinRAR. Проследите, чтобы при скачивании дистрибутива браузер не заменил расширение *.tgz на *.tar. Если это произошло, переименуйте обратно - это существенно важный момент для WinRAR.
Индексация
Индексатор для Windows содержится в каталоге:
cnsearch_pro-1.5-windows\windows\indexer\
В каталоге находятся следующие файлы:
- idefrag.exe - дефрагментатор поискового индекса;
- indexer.exe - индексатор;
- search.conf - конфигурационный файл;
- libdoc.dll - плагин для индексации файлов Microsoft Word (DOC);
- libmp3.dll - плагин для индексации MP3 файлов;
- librtf.dll - плагин для индексации файлов RichText (RTF);
- libtxt.dll - плагин для индексации текстовых файлов (TXT);
- libxls.dll - плагин для индексации файлов Microsoft Excel (XLS).
В первую очередь необходимо отредактировать конфигурационный файл: в нем следует указать адреса сайтов, по которым будет производиться поиск. После редактирования файл должен выглядеть примерно следующим образом:
[Job localhost] [Index] URL http://www.warlog.ru/ MaxFiles 10000 MinWord 30
Самый важный параметр конфигурационного файла - адрес сайта, по которому будет производится поиск. В нашем примере это www.warlog.ru.
После завершения процесса редактирования конфигурационного файла можно приступать к процессу индексации. Во время процесса индексации будут скачиваться страницы Вашего сайта, из которых будет прозводиться выборка слов и ссылок, составляющих данный сайт. При первой индексации рекомендуется внимательно контролировать процесс, так как индексатор может зациклиться из-за неверно составленных ссылок.
Так как индексатор - консольное приложение, то запускать его следует из консоли либо посредством консольного файлового менеджера (например FAR).
Запуск консоли производится из меню Пуск -> Выполнить -> cmd. Выбор текущего каталога производится командой cd:
Рисунок 2 - выбор каталога в консоли Windows
Запуск индексатора производится командой:
indexer.exe localhost
В процессе индексации отображается список страниц сайта, которые будут добавлены в поисковый индекс:
Рисунок 3 - процесс индексации
Процесс индексации может длиться от 5 секунд до нескольких дней, в зависимости от скорости соединения и количества страниц сайта. После завершения процесса индексации будут созданы следующие файлы:
docs.cns files.cns fulltxt.cns index.cns
Совокупность данных файлов и составляет поисковый индекс. Файлы содержат списки страниц и слов в специальном формате, предназначенном для быстрого поиска.
Настройка модуля поиска
Требуемый модуль поиска содержится в каталоге:
cnsearch_pro-1.5-FreeBSD\FreeBSD\frontend\
В данном каталоге находятся два файла:
- search.cgi - модуль поиска;
- cnsearch.conf - конфигурационный файл модуля поиска.
Оба файла необходимо скопировать посредством FTP в каталог cgi-bin на Вашем сервере:
Рисунок 4 - копирование файлов в каталог cgi-bin
После завершения процесса копирования нужно задать права для файла search.cgi таким образом, чтобы сделать его запускаемым. Как правило, это осуществляется посредством команды "chmod 755 search.cgi". В Far Manager это можно сделать с помощью комбинации клавиш Ctrl-A:
Рисунок 5 - установка прав для файла search.cgi
Далее необходимо скопировать все файлы поискового индекса (*.cns) в каталог cgi-bin:
Рисунок 6 - копирование файлов поискового индекса на сервер.
Тестирование
После завершения процесса копирования файлов поискового индекса на сервер система готова к использованию. Чтобы удостовериться в этом, нужно перейти по адресу http://www.вашсервер.ru/cgi-bin/search.cgi.
Рисунок 7 - поисковая форма CNSearch
Для проверки работы системы введите простой поисковый запрос в соответствующее поле:
Рисунок 8 - результаты работы поисковой системы CNSearch.
Примечание:
В данной инструкции не рассматриваются следующие вопросы:
- как ускорить поиск и для чего нужна дефрагментация поискового индекса;
- как подключить поддержку морфологии;
- для чего нужны стоп-слова и как их использовать;
- как посмотреть статистику по поисковым запросам;
- как автоматически сгенерировать Google sitemap;
- какие дополнительные настройки необходимы для оптимизации поиска.
Данные вопросы детально описаны в руководстве пользователя, которое прилагается к дистрибутиву системы. Кроме того, с руководством можно ознакомиться на официальном сайте компании - http://www.cn-software.com/ru/cnsearch/manual/