create stoplist...

 
0
 
Oracle
ava
Anet | 01.03.2006, 07:01
Здравствуйте,

я занимаюсь соданием системы поиска по русскому тексту в oracle. в русском языке есть предлоги, стостоящие больше чем из 1 слова (в качестве, в знак, в обход, во имя, в глубь, и т.д. ). как показать ораклу, чтоб он воспринимал их как слово в стоп листе? т.е. сейчас он их не видит потому что есть пробелы и получается, что это не одно слово, а несколько.
заключаю их в "в знак" тоже не помогает...

Comments (3)
ava
LSD | 01.03.2006, 11:42 #
Цитата (Anet @ 1.3.2006, 07:01 findReferencedText)
я занимаюсь соданием системы поиска по русскому тексту в oracle

А с помощью чего ты осуществляешь поиск?
ava
igon | 04.03.2006, 00:09 #
Речь, видимо, идет об Oracle Text.
Так как индексы текста строятся на основе отдельных слов (группы символов, окруженных пробелом), в них нет места двойным и более словам. По отдельности добавить в stoplist компоненты сложного предлога - тоже не выход: они могут иметь самостоятельное значение.
Вариант: во всех текстах в сложных предлогах заменить пробел на, скажем, $$$ (или ъъъ) и уже такие конструкции (в$$$качестве) добавить в stoplist.
Разумеется, перед показами оригинального текста нужно делать обратное преобразование.
ИМХО, конечно smile
ava
Anet | 23.03.2006, 06:27 #
iqon, а это ведь вариант! тогда при вводе данных в строке поиска надо будет все пробелы заменять на определенный символ $$$ , например, чтоб найти стоп-комбинации...
Please register or login to write.
Firm of day
Вы также можете добавить свою фирму в каталог IT-фирм, и публиковать статьи, новости, вакансии и другую информацию от имени фирмы.
Подробнее
Contributors
ava  LSD   igon   Anet
advanced
Submit