Ручное индексирование — работа весьма трудоемкая и требует большого внимания со стороны ее исполнителей. Так, перевод человеком содержания рефератов средней длины с естественного языка на информационный занимает 25—30 минут. Кроме того, ручное индексирование не позволяет полностью использовать все потенциальные возможности информационно-поискового языка. Это особенно проявляется, когда процедура индексирования проводится в виде массового процесса.
Ручное индексирование — процесс неоднозначный: разные исполнители могут заиндексировать один и тот же документ с помощью одного и того же тезауруса по-разному. В связи с этим для дальнейшего улучшения характеристик поиска весьма актуальной становится проблема автоматизации процессов перевода содержания документов и запросов с естественного языка на информационный. При решении этой проблемы прежде всего преследуются следующие цели:
· значительное ускорение процессов индексирования;
· повышение постоянства (однозначности) индексирования;
· уменьшение экономических затрат на обеспечение функционирования системы.