В состав Microsoft SQL Server 2005 входят лицензионные средства разбиения по словам для следующих языков:
Данные средства разбиения по словам имеются, но по умолчанию не устанавливаются и подлежат регистрации вручную.
Осторожно! Неправильное изменение реестра может вызвать серьезные проблемы. Перед внесением изменений в реестр рекомендуется создать резервную копию всех важных данных.
Также необходимо иметь следующие данные:
Пути реестра, перечисленные в приведенных далее инструкциях, действительны только для первого экземпляра SQL Server 2005, имеющего идентификатор экземпляра MSSQL.1. В случае с несколькими экземплярами SQL Server необходимо изменить пути реестра, подставляя идентификатор каждого экземпляра вместо MSSQL.1. Чтобы узнать идентификатор экземпляра, выполните следующие действия.
В правой области будут отображены имена экземпляров с указанием соответствующих идентификаторов экземпляра.
Получив идентификатор экземпляра, необходимо извлечь соответствующий путь к папке «FTData» для него. Затем с помощью этого пути можно добавлять значения конфигурации, указывающие для данного языка файлы лексики, неучитываемых слов и тезауруса. Для определения пути к папке «FTData» для экземпляра выполните следующие действия.
В правой области будет отображено значение FullTextDefaultPath, содержащее путь к папке «FTData» для данного экземпляра. Например, для первого экземпляра путь может быть «C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\FTData».
1. установить и подключить фильтр для RTF (можно воспользоваться модулем regrtffilter.exe)
2. скопировать ruslr.dll(этот файл по умолчанию находиться в C:\Program Files\Microsoft SQL Server\MSSQL.1\MSSQL\Binn) в C:\WINNT\system32
3. зарегистрировать ruslr.dll (Пуск->Выполнить->regsvr32 ruslr.dll)
Процедура установки средств разбиения по словам сторонних разработчиков, лицензированных корпорацией Майкрософт, состоит из трех этапов.
Чтобы добавить COM-идентификаторы ClassID для этих компонентов, выполните следующие действия.
Этап 2. Добавьте в узел «<корневой_путь_экземпляра>\MSSearch\Language» раздел для языка.
Для добавления в этот узел раздела для русского языка выполните следующие действия.
Этап 3. Добавление конфигурационных значений, определяющих местонахождение файлов лексики, неучитываемых слов и тезауруса для данного языка
Чтобы добавить конфигурационные значения для этих компонентов в случае датского языка, выполните следующие действия.
В Microsoft SQL Server Management Studio соединиться с сервером и выполнить в разделе New Query следующие операции:
После чего перезапустить Службы(Services) SQL Server и SQL Server FullText Search. (Правой кнопкой мыши щёлкнуть по значку Мой компьютер (My computer), в появившемся списке выбрать Управление… (Manage…). После этого мы попадаем в приложение Управление компьютером (Computer Management), в нём в левом окошке перейти Службы и приложения->Службы (Services and Applications) и после этого в правом окошке найти службы SQL Server и SQL Server FullText поочерёдно щёлкнуть на них правой кнопкой мыши и произвести Стоп, затем Пуск (Stop-> Start))
Чтобы предотвратить чрезмерное увеличение полнотекстового индекса, в Microsoft SQL Server реализован механизм, отбрасывающий часто встречающиеся слова, которые не повышают эффективность поиска. Такие слова называются неучитываемыми словами или стоп-словами. Неучитываемые слова хранятся в отдельных файлах для каждого языка (для русского в файле noiseRUS.txt, где он расположен было описано выше). Например, файл неучитываемых слов, соответствующий английскому языку, содержит такие слова, как «a», «and», «is» и «the». Они не включаются в полнотекстовый индекс, потому что эмпирически установлено, что при поиске они бесполезны. Тем не менее при составлении полнотекстового индекса учитываются позиции неучитываемых слов. Т.о. поиск по единственному неучитываемому слову не возможен.
Источники:
http://technet.microsoft.com/ru-ru/library/ms345188.aspx
http://www.sql.ru/forum/actualthread.aspx?bid=1&tid=243362&pg=1
http://www.sql.ru/forum/actualthread.aspx?bid=1&tid=297864
http://msdn2.microsoft.com/ru-ru/library/ms142551.aspx
Календарь мероприятий
Уважаемые коллеги и друзья! Мы с радостью сообщаем, что очередная партнерская конференция ЭОС «Весенний документооборот – 2022» состоится. Впервые в истории наших конференций встреча друзей-партнеров ЭОС пройдет на территории Сибири, в городе Красноярске.
С 23 по 27 мая мы будем обсуждать актуальные темы, подводить итоги работы партнерского сообщества. А также надеемся успеть увидеть местные достопримечательности и неформально пообщаться.
7 000 компаний