Вероятность нахождения при помощи поисковых средств Интернета полезной для бизнеса информации оценивается экспертами в 1,5-2 %. В то же время информация, накопленная внутри компании, соответствует поставленным целям на 70 % и более. Тем не менее, ее часто игнорируют или просто не могут правильно использовать.

 

Евгений Коржов, директор компании ТЕКОН»

Как правило, ко всем средствам поиска бизнес-информации (обычно текстовой) предъявляют несколько «стандартных» требований:

  • скорость поиска
  • широта поиска (возможность искать «везде»)
  • гибкость (поддержка максимального количества форматов документов)
  • полнота поиска (гарантия, что документ будет найден).

Для руководства организации есть еще один важный момент — информацию можно показывать только тем, у кого есть права на ее просмотр.

Проблемы, затрудняющие корпоративный поиск
Чаще всего среди таких проблем упоминают физический объем информационного пространства, в котором осуществляется поиск, неструктурированность информации, различие источников информации и динамичность ее изменения, сложность формулировки поискового запроса пользователем и др. Отметим еще несколько, менее очевидных.

Недооценка. Локальные средства поиска могут на какое-то время создать иллюзию доступности и достаточности информации. Однако при достижении порогового значения объема информации — индивидуального для каждой организации — эта иллюзия быстро разрушается.

Трудности организации «повсеместного поиска». Информационные ресурсы организации состоят из документов и файлов, созданных в самых разных приложениях и хранимых в хранилищах данных, СУБД, почтовых серверах и др.

Проблемы безопасности. Кроме традиционного обеспечения безопасности информации от внешних покушений, требуется жесткое разграничение доступа к ней внутренних пользователей. Помимо того, в ряде компаний доступ в Интернет ограничен, а привлекать внешние ресурсы бывает необходимо.

Неразвитость соответствующего рынка поисковых продуктов. Если ПО для автоматизации других категорий широко представляется на выставках, и пользователи достаточно хорошо ознакомлены с характеристиками продуктов
и решений, их достоинствами (о них с удовольствием расскажут разработчики и продавцы) и недостатками (о них при желании можно узнать у коллег или даже конкурентов), то о средствах корпоративного поиска этого сказать нельзя. Поскольку их чаще всего внедряют силовые структуры и крупные корпорации (для бизнес-разведки), то ожидать особой открытости не приходится.

Высокая стоимость и длительные сроки внедрения. Проекты внедрения в организации обычно «индивидуальны», длятся по несколько месяцев, требуя от заказчика постоянного контроля и ресурсов, а к моменту ввода в строй успевают «морально устареть». Затраты на такие проекты нередко составляют несколько сотен тысяч долларов. Как правило, требуется дополнительное обучение сотрудников.

Решение проблем
UOSES (Ukrainian Optimized Secure Enterprise Search) — это многоплатформенный программно-аппаратный комплекс, предназначенный для защищенного поиска информации в условиях корпоративного использования, в частности, решения задач бизнес-анализа и бизнес-разведки. Он разработан компанией ТЕКОН в сотрудничестве с «ТрайдентСофтвер» и является развитием ROSES (Russian Optimized Secure Enterprise Search) — решения, созданного российскими партнерами ТЕКОН компаниями «ФОРС — Центр разработки» и «ЭР СИ О». В отличие от существующих поисковых машин, UOSES осуществляет быстрый защищенный поиск нужной информации с учетом смысловых связей, во всех внутрикорпоративных и внешних источниках (файловые документы, электронная почта, базы данных, корпоративный портал, Интернет-контент). Обеспечивается быстрый и точный поиск (с учетом морфологии языка) по любым источникам данных, соответствие требованиям безопасности организации, простое масштабирование, рекордно короткий срок внедрения.

Быстрый и точный поиск. Обычно это несовместимые характеристики, однако в UOSES достигнут их баланс. Скорость поиска обеспечивается развитыми технологиями Oracle. Точность и полноту поиска обеспечивает специальный модуль морфологии, учитывающий особенности украинского языка.

Поиск по любым источникам данных. На сегодняшний день полностью поддерживаются базы данных SQL, веб-сайты, серверы электронной почты. Обеспечена поддержка более 200 форматов документов (в том числе обычный текст, html, pdf, rtf, xml, doc, xls, ppt, vsd, zip и др.).

Безопасность — ключевой фактор. UOSES интегрируется с корпоративными службами каталогов, позволяет персонально настраивать правила, определяющие полномочия пользователей, дает возможность ограничить или полностью исключить доступ в Интернет за счет индексирования и кэширования содержания внешних ресурсов. Результаты поиска выдаются согласно правам пользователя на документы. Все пользователи могут искать только в публичных документах, после авторизации пользователь может находить также другие документы, на которые у него есть права. Есть возможность оперативного учета изменения статуса доступа пользователя и организации единого подключения пользователя (single-signon, SSO).

Масштабирование и расширение. Существует два традиционных способа, используемых при корпоративном поиске:

  • Корпоративный поисковик. Собирается содержимое из различных источников информации (это обычно выполняет программный «робот» — crawler), и для него создается текстовый индекс. Как только индекс для какого-то источника создан, тот становится доступным для поиска.
  • Корпоративный портал. Направляется запрос внешнему поисковому средству (search provider), которое принимает запрос как входящую информацию и выдает ответ (обычно с ограниченным числом результатов поиска). Эти результаты могут быть либо объединены с общими результатами поиска, либо показаны отдельно.

Oracle SES поддерживает оба способа, что позволяет UOSES строить распределенные масштабируемые системы: при появлении новой группы источников данных (например, еще одной компании в корпорации) достаточно развернуть дополнительный поисковый сервер.

Срок внедрения — три дня. UOSES поставляется как готовое решение, в его состав входит полный комплект лицензий на программные продукты компаний Oracle и UCO и полностью сконфигурированный и оттестированный стандартный сервер с двумя двухъядерными процессорами, обеспечивающий поддержку индексной базы данных объемом до 10 Тбайт.

По сути, вся процедура внедрения комплекса состоит из нескольких шагов:

  • подключение в корпоративную сеть,
  • присвоение внутреннего адреса,
  • синхронизация со службой каталогов (Мicrosoft Active Directory, Oracle Internet Directory, IBM Tivoli Directory Server, Open LDAP, Novell eDirectory, Sun Java System Directory Server).

Кроме того, потребуется настроить индексируемые источники: файловые архивы, системы документооборота, серверы электронной почты, веб-сайты, корпоративные порталы, таблицы БД (эти настройки придется делать регулярно — по мере расширения и уточнения запросов пользователей).


Не требуется обучение: любой сотрудник, пользующийся поисковыми средствами Интернета, сможет сразу работать с UOSES.

Рецепт: UOSES = Oracle SES + UCO
Программную основу комплекса UOSES составляют два продукта.

Oracle Secure Enterprise Search. Новейшая технология Oracle SES обеспечивает доступ пользователей к корпоративной и внешней информации строго в соответствии с правами, установленными администратором по безопасности. Все источники информации защищены, а результаты поиска фильтруются таким образом, что пользователю видны только ссылки на разрешенные ему ресурсы.  

Oracle SES состоит из следующих компонентов (см. рисунок):

  • поиска и сбора (Crawling) — обеспечивает средства для встраивания в различные поисковые агенты и обработки добытых данных;
  • индексации (Indexing) — обеспечивает индексирование собранных документов вместе с их метаданными и атрибутами безопасности, используя текстовые механизмы СУБД;
  • запросов (Query) — обеспечивает ответы на запросы конечного пользователя с использованием текстового индекса (также включает средства расширения поиска и поддержки интеграции с другими серверами SES);
  • администрирования (Administration) — обеспечивает поддержку управления остальными компонентами;
  • безопасности (Security) — обеспечивает средства «стыковки» с различными механизмами идентификации и авторизации;
  • предоставления (Presentation) — обеспечивает предоставление результатов поиска для компонентов запросов и администрирования.

SES может стать важным звеном в обеспечении интеграции и доступа ко всем корпоративным приложениям и источникам данных. Пользователь может обращаться к поисковым средствам как с Интранет-сайта, так и непосредственно из приложения. Обеспечивается вывод на один экран информации из разных модулей, причем без необходимости предварительного захода на каждый из них в отдельности.

К источникам информации, стандартно поддерживаемым SES, относятся:

  • средства управления контентом (EMC Documentum Content Server, FileNet Content Engine, FileNet Image Services, Hummingbird Document Management Server, IBM DB2 Content Manager, Microsoft SharePoint, Open Text Livelink, Oracle Content Database, Oracle Content Server);
  • средства коллективной работы (EMC Documentum eRoom, Lotus Notes, Microsoft Exchange, Oracle Calendar, Oracle Mail);
  • бизнес-приложения (Business Objects, Cognos, Micro-Strategy, Oracle E-Business Suite 11i и 12, Siebel 7.8 и 8).

Возможно создание коннекторов и к другим приложениям. Также обеспечивается взаимодействие с любыми источниками информации, использующими структуру хранения NTFS (Windows NT File System) для Windows и UNIX, и с любыми базами данных, поддерживающими JDBC.

Ukrainian Content Optimizer. Поскольку «штатные» поисковые средства Oracle недостаточно эффективны при работе с текстами на восточноевропейских языках, то для обеспечения учета особенностей словоизменения и синонимов украинского языка, особенностей его лексики и грамматики используется Ukrainian Content Optimizer (подробнее о возможностях этого продукта рассказывалось в «ComputerWorld / Украина» № 10 ‘2008).

Открытая инфраструктура
Как уже говорилось, UOSES — это готовое решение, и для многих организаций будет достаточно имеющихся в нем функциональных возможностей. В случае необходимости его можно доработать под свои растущие требования — самостоятельно или с помощью специалистов ТЕКОН.

Для этого базовые функциональные возможности комплекса дополняет открытый программный интерфейс (API), позволяющий разработать механизмы индексирования (plug-ins) для доступа к требуемым источникам данных, информационным системам и ресурсам конкретного предприятия, расширения возможностей поиска, уточнения правил аутентификации / авторизации и презентации информации.

По вопросам приобретения продукта Вы можете обратиться по адресу: ООО ТЕКОН 01010, Киев-10 ул. Ивана Мазепы, 14, офис 43 тел. (044) 280-01-80 факс (044) 254-29-39.

 

Статья директора компании «Текон» Евгения Коржова «UOSES: «правовой» доступ к информации в корпорации» в журнале «Директор Информационной службы» №3/2008 г.