Пресс-Релизы RSS

Доклад, посвященный ранжированию источников новостей, на семинаре "Поисковые технологии 2010″

3 March, 2010, КиевИнформационный центр "ЭЛВИСТИ"  | 1134 Горячие просмотры
     

Версия для печати | Отправить @mail | Метки




26-28 февраля 2010 г. компания "Ашманов и Партнеры" собрала разработчиков поисковых систем на выездном семинаре "Поисковые технологии 2010″ в спортивно-развлекательном парке "Яхрома". Специалисты компаний ("Рамблер", "Яндекс", "Нигма", "Ашманов и Партнеры", Meta.ua, "Галактика", ElVisti и др.) обсудили проблемы релевантности и индексации, ситуацию с поисковым спамом и будущее поисковых систем.


Семинар был посвящен проблемам разработки и развития поисковых проектов и технологий и рассчитан на менеджеров и разработчиков поисковых систем и поисковых сервисов, прикладных лингвистов, специалистов по поиску, студентов и научных сотрудников профильных вузов и кафедр. Пресса и SEO- специалисты специально не приглашались.

На семинаре с совместным докладом от компаний "Галактика" и ElVisti по теме "Рейтинг онлайн-СМИ на основе дублирования новостей" выступил А. Антонов.

Ранжирование результатов выдачи поисковых систем, в частности новостных ресурсов, является одной из главных задач, стоящих перед современными поисковыми технологиями. В докладе были приведены методы создания рейтинга онлайн-СМИ для агрегирующего новостного ресурса www.webground.su.

Ранжирование источников основано на информации о группах найденных новостей-дубликатов и признаком времени публикации, приписанном новостям. На первом этапе алгоритм поиска дублирующихся сообщений разбивает множество новостных сообщений на непересекающиеся подмножества. После чего в каждом подмножестве сообщения ранжируются по времени публикации в убывающем порядке. Каждое из выделенных подмножеств представляется в виде направленного графа, вершинами которого являются сообщения, а ребрами - отношения в упорядочении внутри подмножества.

С целью сокращения вычислительной сложности алгоритма принято ограничение, при котором ребра могут соединять только соседние элементы упорядочения. Каждое из ребер направлено от более раннего к более позднему сообщению. К построенным графам применен алгоритм PageRank, с помощью которого каждой из вершин-сообщений на графе присваивается соответствующий вес. Использована версия алгоритма PageRank с ненормированными весами ребер. Для составления итогового рейтинга источника учитывается накопленная месячная статистика веса PageRank сообщений источника и среднее время запаздывания при публикации новостей.

Анализ результатов формирования рейтинга (пример: http://webground.su/sources.php?param=SourceList&Sort=2&Filter=0).

Презентация в формате PDF:
http://dwl.visti.net/art/yahroma/yahroma.pdf

Инф. ИЦ "ЭЛВИСТИ"




     


Хотите опубликовать пресс-релиз на этом сайте? Узнать детали


Читайте также: Последние релизы:
  • Пресс-релизы на Питербургере
  • Пресс-релизы на Гривна.инфо


Фильтровать пресс-релизы


Левитас Александр


autor

«Партизанский маркетинг 2017»: открыт конкурс на организацию трансляции


«Мы собрали на одной сцене лучших экспертов по малобюджетному маркетингу и бизнесменов, уже внедривших инструменты партизанского маркетинга в своих компаниях, чтобы они поделились с участниками конференции самыми эффективными инструментами и самыми яркими „фишками“, которые можно будет сразу применить в своем бизнесе и очень скоро получить результат»

О платформе

Раздел «Пресс-Релизы» на B2Blogger.com — пресс-релизная платформа (релизоприёмник) для размещения корпоративных новостей и пресс-релизов с целью распространения их в интернете и придачи им максимальной видимости в Сети.

Платформа позволяет размещать пресс-релизы по принципу search engine visibility, когда материалы распространяются по новостным агрегаторам и доступны через поиск в течение получаса после размещения.

Размещение корпоративных пресс-релизов по принципу media visibility гарантирует распространение материала по каналам информационных агентств и перепечатку текста публикации ведущими онлайн СМИ.

B2Blogger.com не несет ответственности за содержание материалов, опубликованных партнерами пресс-релизной платформы.