В современных системах выборки данных основной задачей является обеспечение надёжного хранения данных, а также высокой скорости выполнения поисковых запросов пользователей. Стоит отметить, что на информационно-поисковые системы возлагается не только задача поиска на точное соответствие запрашиваемой пользователем информации, а скорее задача по поиску релевантной информации, где степень релевантности можно определить как степень её смысловой близости к поисковому запросу, а это в свою очередь ведёт к тому что поисковые запросы в такого рода системах должны быть основаны на естественном языке, т.е на том же языке, в котором сформулирована исходная информация.
Время поиска в структурах, представленных в виде списков, по текстовым данным составляет O (log (n)), при этом списки ключевых терминов должны быть отсортированы, так как именно при удовлетворении такого условия возможен бинарный поиск за логарифмическое время. Отсортированные списки имеют ещё один недостаток: их сложно модифицировать (удалять/вставлять ключевые термины) и количество операций затрачивается на это не меньше, чем O (n).
Стоит отметить, что существуют структуры данных, которые не обладают выше изложенными недостатками – это древовидные структуры данных. В данной работе будут проанализированы методы поиска полнотекстовой информации, представленной в виде древовидной структуре.
Ключевые слова: поиск по древовидным структурам данных, суффиксные деревья, префиксные деревья, тернарные деревья.
Библиографическая ссылка
Сапего Ю.С. 1 МЕТОДЫ ПОИСКА ПО ДРЕВОВИДНЫМ СТРУКТУРАМ ДАННЫХ // Автоматизация и управление в технических системах. – 2014. – № 2;
URL: auts.esrae.ru/10-189 (дата обращения:
22.12.2024).