22 July, 2009, Москва — Авикомп Сервисез | 846
Интернет
Версия для печати | Отправить @mail | Метки
Суть технологии заключается в распознавании в текстах на естественном языке объектов и их связей. Базовый набор распознаваемых типов объектов и связей определен поставщиком: это, прежде всего, имена людей, названия организаций, географические названия, популярные бренды, позитивные и негативные высказывания и еще более 30 типов объектов.
Помимо этого, пользователь сможет создавать новые типы объектов на основе собственных словарей, тем самым описывая интересующую пользователя предметную область. Другим преимуществом API, как заявляют в Авикомп Сервисез, является глобальная идентификация извлекаемых из текстов объектов: например, «Норильский никель», упомянутый в различных документах, хранится в базе знаний в единственном экземпляре. Это означает, что все извлеченные из разных текстов семантические связи (сотрудники, инвестирование, слияния и поглощения и т.п.) ассоциированы с этим единственным объектом.
Анонсированный API позволит внешним разработчикам создавать разнообразные инструменты для аналитики — например, системы для ранжирования объектов внимания и автоматической классификации, диаграммы видимости объекта в прессе, семантическая навигация по коллекции текстов. Авикомп Сервисез приводит на своем сайте примеры внедрений технологии — создание семантических отраслевых порталов, интеграция аналитических сервисов в корпоративные системы, конкурентная разведка и др.
Через API пользователям предоставляется доступ к хранилищу, содержащему на данный момент более 500 000 документов на русском и английском языках. Следующий релиз API позволит пользователям создавать и разрабатывать сервисы на своих тематических хранилищах документов.
Руководство Авикомп Сервисез отмечает, что корпоративные решения, основанные на лингвистическом анализе документов, пользуются в России все большим спросом. Открытие бесплатного API к технологическому ядру этих решений будет способствовать распространению технологии и росту спроса на решения в области корпоративного «семантического веба» — Web 3.0.
Хотите разместить свой пресс-релиз на этом сайте? Узнать детали