АВТОМАТИЗАЦИЯ ИНДЕКСИРОВАНИЯ

Ручное индексирование — работа весьма трудоемкая и требует большого внимания со стороны ее исполните­лей. Так, перевод человеком содержания рефератов сред­ней длины с естественного языка на информационный занимает 25—30 минут. Кроме того, ручное индексирова­ние не позволяет полностью использовать все потенци­альные возможности информационно-поискового языка. Это особенно проявляется, когда процедура индексирова­ния проводится в виде массового процесса.

Ручное индексирование — процесс неоднозначный: разные исполнители могут заиндексировать один и тот же документ с помощью одного и того же тезауруса по-разному. В связи с этим для дальнейшего улучшения характеристик поиска весьма актуальной становится проблема автоматизации процес­сов перевода содержания документов и запросов с есте­ственного языка на информационный. При решении этой проблемы прежде всего пресле­дуются следующие цели:

· значительное ускорение процес­сов индексирования;

· повышение постоянства (однознач­ности) индексирования;

· уменьшение экономических за­трат на обеспечение функционирования системы.

Ссылка на основную публикацию
Adblock detector
x