ИРБИС64+

Система ИРБИС64+

ИРБИС64+ представляет собой систему автоматизации, предназначенную для создания и ведения электронной библиотеки - в отличие от ИРБИС64, который предназначен для ведения электронного каталога.

Пользователи под «электронной библиотекой» понимают самые разные вещи. Некоторые называют электронной библиотекой электронный каталог, где к библиографическим описаниям привязаны ссылки на полные тексты, которые не участвуют в поиске и выступают в роли ресурса для просмотра, - такую «электронную библиотеку» можно создавать с помощью обычного ИРБИС64. Другие пользователи называют электронной библиотекой то, что можно создавать с помощью другого продукта (в настоящее время уже не развивающегося) – ИРБИС64 ПБД, - т.е. полнотекстовые базы данных, в которых можно осуществлять поиск по словам полного текста.

ИРБИС64+ - нечто более широкое. Прежде всего, важно отметить, что основное назначение электронной библиотеки с точки зрения читателя – это поиск нужной ИНФОРМАЦИИ, в то время как назначение электронного каталога – поиск нужной КНИГИ (издания).

Если говорить на языке пользователей ИРБИС, ИРБИС64+  это система, которая полностью включает возможности ИРБИС64 и ИРБИС64 ПБД и плюс сверх того – имеет дополнительный функционал, связанный со спецификой собственно электронной библиотеки – разумеется, в нашем понимании.

В общем, новый функционал ИРБИС64+, обусловленный требованиями именно электронной библиотеки, состоит из следующих элементов:

  • полнотекстовый поиск с использованием критерия релевантности на основе автоматического разбиения текстов на страницы и их пословной индексации;
  • представление результатов поиска в порядке убывания релевантности документов, а в рамках одного документа – в порядке убывания релевантности найденных страниц;
  • постраничный просмотр полных текстов с обеспечением маркировки найденных слов запроса и навигации по релевантным страницам, оглавлению и личным закладкам;
  • развитая система прав доступа конечных пользователей к полным текстам;
  • система учета обращений пользователей к полным текстам.

Информационной основой ИРБИС64+  являются базы данных, представляющие собой совокупность связанных библиографических данных и полных текстов изданий.

Библиографические данные, разумеется, ведутся на основе коммуникативного формата RUSMARC. А в качестве полных текстов используются распознанные PDF-файлы, которые подвергаются автоматическому разбиению на страницы и индексированию по словам.

Имеет смысл остановиться на Web-интерфейсе, адресованном конечному пользователю, поскольку именно в этом модуле реализован почти весь новый функционал ИРБИС64+.

1

Рис.1

По умолчанию пользователю предлагается простейший поисковый интерфейс, содержащий одно окно, в которое следует вводить запрос на естественном языке (Рис.1). При этом наряду с ключевыми словами, определяющими содержание запроса, можно вводить элементы библиографических данных: слова из заглавия, фамилии авторов, название издательств и коллективов, годы издания и т.п. На основании введенного запроса выполняется полнотекстовый поиск: собственно по страницам полного текста, а также – по библиографическому описанию, рассматриваемому как текст. Релевантность документов определяется на основе оригинального критерия, который учитывает количество и контекстную близость слов запроса, найденных в тексте. При сравнении слов используется механизм морфологии русского языка.

В случае необходимости провести точный библиографический поиск или ограничить полнотекстовый поиск библиографическими данными предлагается дополнительный интерфейс, который позволяет указать любые элементы описания: автор, заглавие, вид издания и т.д. (Рис.2).

2

Рис. 2

Результат поиска представляется в виде списка описаний найденных документов в порядке убывания их релевантности. При этом  - в случае если выполнялся полнотекстовый поиск – в каждое описание документа в виде ссылки включается фрагмент первой релевантной страницы полного текста. В зависимости от прав доступа также даются ссылки на постраничный просмотр и скачивание полного текста. Здесь же выводится рейтинг документа, сформированный на основе оценок конечных пользователей, и, кроме того, – общее количество обращений к полному тексту и ссылки на другие издания, которые составляют круг интересов (т.н. «круг чтения») читателей данного издания (Рис. 3)

3

Рис. 3

В случае представительного результата поиска формируются фасеты. Под фасетами понимается распределение найденных документов по значениям определенных элементов библиографического описания, в частности, автор, год издания, тематика, т.е. выделяются авторы, года издания, тематика, которые максимально представлены в результатах поиска (Рис.4 ).

4

Рис. 4

Также в конце каждой порции найденных документов пользователю предлагается:

  • просмотреть отмеченные (т.е. отобранные в «корзину») документы;
  • распечатать результаты поиска; при этом есть возможность указать исходные документы (все, отмеченные, кроме отмеченных), порядок сортировки (по заголовку, по году издания, по дате поступления) и формат представления документов;
  • сохранить текущий запрос в качестве личного постоянного запроса; при этом есть возможность поименовать запрос на естественном языке.

При обращении к просмотру полного текста каждая страница издания представляется в виде только графического слоя, т.е. в виде «картинки», что, с одной стороны, защищает текст от копирования, с другой стороны, исключает наличие на стороне клиента каких-либо плагинов для работы с PDF-текстами (Рис.5).

5

Рис. 5

В этом случае, работая с полным текстом, пользователь имеет возможность:

  • листать текст последовательно вперед и назад;
  • переходить от одной релевантной страницы к другой (т.е. осуществлять листание по найденным страницам полного текста);
  • делать и, разумеется, удалять личные закладки в тексте, и соответственно листать по ранее сделанным закладкам; при формировании закладки есть возможность вводить заметки (т.е. делать произвольные примечания к закладке);
  • менять масштаб изображения страницы;
  • скачивать (т.е. копировать) конкретные страницы – при наличии соответствующих прав;
  • выполнять поиск внутри текущего полного текста;
  • выставлять личную оценку тексту.

В случае наличия права скачивания пользователь получает возможность работать с полным PDF-текстом. Если в браузере клиента установлен плагин Acrobat Reader'а, то скачанный полный PDF-текст открывается непосредственно в браузере и при этом отображается список найденных слов запроса с возможностью позиционировать страницы, на которых они найдены.

В зависимости от прав доступа, связанных с конкретным пользователем и конкретным документом, пользователю может быть:

  • запрещено обращение к полному тексту;
  • разрешен постраничный просмотр полного текста;
  • дополнительно к постраничному просмотру разрешено скачивание полного текста.

Разрешение на просмотр и скачивание полного текста может иметь количественные ограничения, которые задаются или в процентах от общего объема документа или в виде непосредственного количества страниц.

При определении прав доступа к полным текстам могут учитываться следующие данные:

  • временной интервал разрешенного доступа (с точностью до дня);
  • идентификационные признаки пользователя (такие, как номер читательского билета, категория читателя, факультет, семестр, специальность студента и т.п.), которые могут задаваться в виде маски;
  • IP-адрес клиента (в виде маски);
  • доменное имя клиента.

Собственно значение права доступа вырабатывается в момент обращения конкретного читателя к конкретному полному тексту на основе специального алгоритма, реализованного в виде того, что в ИРБИСе называется формат. Этот формат, как и все прочие, находится в распоряжении пользователей системы, а это значит, что, изменяя этот формат, пользователь может уточнять или как угодно менять алгоритм формирования права доступа к полным текстам.

Вход в электронную библиотеку осуществляется на основе авторизации читателя (т.е. читатель указывает свои логин и пароль). При этом читателю предлагаются элементы личного кабинета, а именно, он имеет возможность:

  • просматривать историю своих обращений к полным текстам, а также список литературы, связанный с традиционной (бумажной) книговыдачей (что и когда брал, что находится сейчас на руках) (Рис. 6);
  • просматривать список личных закладок (вместе с заметками) и с помощью них обращаться к соответствующим страницам ранее прочитанных текстов (Рис. 7);
  • просматривать список личных постоянных запросов, запускать их повторно на поиск или удалять;
  • просматривать корзину своих заказов на «бумажную» книговыдачу;

6

Рис. 6

7

Рис. 7

Конечному пользователю может быть предоставлена возможность загрузить собственный полный текст и его краткое описание в электронную библиотеку. Этот функционал может использоваться в вузовских библиотеках при формировании БД выпускных квалификационных работ студентов, т.е. студентам можно предоставить возможность самостоятельно включать свои дипломные работы - полный текст и его описание - в соответствующую БД электронной библиотеки. В дальнейшем планируется также реализовать возможность оценки включаемого таким образом полного текста на оригинальность (т.е. пропускать этот текст через систему антиплагиата).

В состав системы ИРБИС64+  входят следующие модули:

  • Сервер баз данных;
  • АРМ Администратор (серверный и клиентский)
  • АРМ Каталогизатор
  • АРМ Книговыдача
  • АРМ Комплектатор
  • АРМ Книгообеспеченность
  • Web-шлюз для доступа конечного пользователя.