Нейросети и Интернет :: Продукты

Главная

   Новости

   Публикации

   Продукты

   О нас

   Задайте ваш вопрос

Продукты

   Python Policy

   rPAS

   Zope

   Zope

   IIGFS

Ссылки

   Личные сервисы

   Поисковые сервисы

   Скачать!

   Баги

   Демо IIGFS

   Разработка rPAS

 

<< Python Policy | ^Продукты^ | Zope>>

Информационно-справочная система rPAS

  печать |   | mcray

rPAS - информационно-справочная система, ориентированная на создание интеллектуального хранилища данных - средства, позволяющего минимизировать затраты на поиск и подбор данных, нужных для работы. rPAS использует различные алгоритмы самообучения для выработки стратегии размещения информации, адаптируя ее к изменяющимся потребностям пользователей

В отличие от традиционных поисковых систем, идея rPAS состоит не в том, чтобы искать что-либо, а в том, чтобы нужная информация автоматически оказывалась под рукой в тот момент, когда в ней возникает необходимость. Для решения данной задачи поиск, хранениt и инструментарий работы с данными интегрированы в единый пакет программ, объединенных общим интерфейсом.

Ссылки по теме:

Цель создания информационно-справочных систем - обеспечение работы с большими массивами документов, с приемлемой (оптимальной) скоростью поиска необходимой информации.

Интеллектуальное хранилище, помимо традиционного поиска, обеспечивает автоматическое размещение документа в рубрикаторе и его перемещение в процессе хранения между рубриками, отражая изменяющиеся потребности пользователей системы, а также связывает его с другими документами. Кроме того, хранилище проводит анализ своего содержимого, позволяя помочь в контроле актуальности информации, и проводя прогнозирование характера информации, которая может быть востребована в дальнейшем (т.н. "упреждающее индексирование").

Жизненный цикл любого документа начинается с размещения в информационно-справочной системе. При размещении документа проводится анализ его проводится анализ его содержимого, в результате которого выделяются отличительные признаки и составляется векторное описание (например, признак - вес признака), позволяющее определить смысловое сходство документов в терминах расстояний между векторами. Множество документов может быть разбито на группы, соответствующие группам векторов, расположенных вблизи друг друга. Это позволяет составить и поддерживать автоматический рубрикатор документов.

После передачи документа на хранение, начинается следующий этап жизненного цикла - работа с документом, включающая в себя его запрос пользователями из хранилища, размещение ссылок на него в индивидуальном рубрикаторе и связывание с другими документами. Это обычная деятельность пользователей любой информационно-справочной системы, которую можно охарактеризовать как упорядочение данных для оптимизации обслуживания потребности в них.

Анализ запросов документов из рубрикатора позволяет определить факт сходства между некоторыми рубриками и документами в смысле предположения о сходстве документов используемых совместно (запрошенных одними и теми же пользователями, связанными между собой и т.п.). На основе этих данных корректируются правила составления векторных описаний и словари признаков, что приводит к постепенной адаптации структуры рубрикатора к некоторым усредненным потребностям пользователей.

Система производит постоянный мониторинг активности пользователей, что позволяет составить и поддерживать актуальной модель интересов пользователей системы. В соответствии с этой моделью, можно предсказать потребности в размещенном документе и связать документ так же, как это сделал бы пользователь системы. Для дополнительной настройки такого самостоятельного поведения системы возможно указать необходимость выполнения определенных действий (например пересылку документа) в ответ на такие события как изменение размещения документа или его связывание.

В системе могут быть инициированы различные аналитические процедуры, позволяющие на основе составляемых в процессе разбора документов словарей и рубрикатора выявлять неполноту данных в хранилище и прогнозировать возможность возникновение потребности в информации определенного рода в ближайшем будущем. Результаты могут доводится до сведения заинтересованных пользователей или использоваться самой системой для получения дополнительной информации из внешних источников.

Для создания такой информационно-справочной системы потребовалась разработка специального объектно-ориентированного сервера приложений rPAS. rPAS имеет клиент-северную архитектуру, в которой сервер обеспечивает хранение и обработку документов, а клиентские приложения предоставляют интерфейс операторам или служат коннекторами к другими внешним источникам или потребителям данных.

Документы хранятся в виде объектов, каждый из которых может предоставлять один или более интерфейсов. Интерфейс является унифицированным, независимым от типа, способом работы с объектом, известном клиентским приложениям. Это позволяет исключить перепрограммирование клиентских приложений до тех пор, пока для работы с объектами новых типов достаточно уже существующих интерфейсов, поэтому в rPAS возможно создание клиентских приложений для конечного пользователя с достаточно сложным интерфейсом без особых опасений о совместимости с будущими версиями объектной модели. Клиент-серверное взаимодействие может осуществляться посредством различных протоколов, основным из которых является семейство протоколов CORBA.

В настоящее время закончена разработка первой версии rPAS, включающей в себя сервер, простую объектную модель, ориентированную на хранение и редактирование документов, браузер хранимых объектов, коннектор к почтовой службе и некоторым другим источникам данных. Независимо от целей его создания, в текущем состоянии rPAS может применяться как простая, объектно-ориентированная клиент-серверная среда.

Это позволило начать работы по реализации алгоритмов, обеспечивающих использование rPAS в качестве информационно-справочной системы. Работы находятся в различной степени завершенности и направлены на решение простой тестовой задачи: создание настраиваемого классификатора входного потока документов, полученных, например, просмотром новостных лент или электронной почты. Хотя работы над основными алгоритмами находятся в начальной стадии, существующий каркас и их упрощенные версии позволил провести тестовую эксплуатацию rPAS для разбора входного потока почты и новостей, что показало принципиальную правильность выбора архитектуры.


Вложенные материалы

Руководство по установке и настройке

2004-06-29 02:26:02

Данный документ описывает установку и настройку клиент-серверной среды rPAS и дает минимальный объем информации, необходимой для его поддержки. Современная версия rPAS поставляется только в виде rpm для Sisyphus (репозиторий пакетов, на котором основан Master и другие дистрибутивы Alt Linux) и никакие другие варианты поставки не предусматриваются. RPM содержит предварительно настроенные файлы конфигурации, что позволяет получить практически работающее решение установкой rpm, поэтому данный документ не затрагивает детали размещения файлов и узкоспециальные опции конфигурации.

Руководство пользователя клиента

2004-06-29 02:42:39

Экспериментальный клиент rPAS разработан в целях поддержки разработки и предназначен для первоначальной проверки различных концепций построения пользовательского интерфейса для rPAS. Данный документ описывает интерфейс клиента и особенности работы с ним.

Настройка персональной почтовой службы

2004-06-29 02:48:36

Настройка персональной почтовой службы подразумевает использование сервера rPAS для хранения архива сообщений и их обработку с использованием стандартных возможностей rPAS по работе с документами (поиск, автоматическая классификация и т.п.). Для поддержки персональной почтовой службы используются несколько специализированных средств, в том числе Агент Доставки Сообщений, Инструмент Отправки Писем, Инструмент Ответов На Письма, Вид Для Просмотра Писем. Остальные задачи решаются настройкой стандартных средств rPAS.

Настройка персональной новостной службы

2004-06-29 02:51:09

Основная идея персональной почтовой службы - дать возможность классификации сообщений от некоторого источника новостей по группам, в зависимости от их содержания, и пересылки сообщений из некоторых групп заинтересованным пользователям. Эта задача решается с использованием прототипа поисково-индексной подсистемы (RVC) и специально разработанного RSS-сканнера, позволяющего просматривать новостные ленты, скачивать новые поступления и публиковать их на сервере rPAS.

Особенности объектной модели

2004-06-29 02:54:37

Основой используемой в rPAS объектной модели является ROFS и построенный на ее основе продукт RServer, включающий в себя MinimalStorage - минимальную полезную подборку классов. Подробно MinimalStorage и ROFS описаны в технической документации, здесь же изложены только основные концепции, отличающие ROFS от других моделей хранения, подражающих файловым системам, таким как OFS, используемой в Zope.

Использование компонентной модели как основы самообучающейся среды

2004-06-29 02:58:34

Основой системы rPAS является понятие "интерфейса" объекта, дающее возможность построения бизнес-систем из готовых, взаимозаменяемых модулей. Одной из целей разработки rPAS является подготовка среды для разработки нейросетевых систем, ориентированных на помощь оператору в поддержке больших архивов документов, помощь, состоящую в избавлении оператора от рутинной работы в рамках такой поддержки.

Данный документ является попыткой осмысления возможной взаимосвязи между компонентной моделью и традиционными нейросетевыми алгоритмами.

Реализация поисковых механизмов

2004-06-29 03:01:16

Отличительной чертой любого современной документ-ориентированной системы является наличие встроенной подсистемы поиска и индексации. rPAS предоставляет модульную поиско-индексирующую систему, ориентированную на использование в качестве инструмента динамического мониторинга архива документов. Такой инструмент позволяет зафиксировать событие существенного изменения содержимого архива (например появление интересных документов) и инициировать его обработку. Поисково-индексирующая система состоит из индексатора, классификатора, подсистемы анонсирования и обработчика запросов

Разные заметки по поводу rPAS

2004-06-29 03:04:31

В процессе разработки rPAS возникают вопросы и предложения, для которых не всегда находится время написать развернутый комментарий. В тоже время, ответы на них достаточно важны. Эти краткие заметки - способ испрвить ситуацию: краткие ответы и комментарии, на основе котрых в последствии, возмжно, будут составленны более полные документы

Используемфые компоненты

2004-06-29 02:16:32

Другие материалы

2004-06-29 02:18:30

Вход для пользователей

логин:

пароль:

ZOPE Powered by IIG FS Info Industries Group mosgird