Пять способов определить релевантность страницы поисковым запросам. Асессоры Яндекса и Google: особенности шкалы оценок, инструкции, где искать вакансии Особенности оценки Нерелевантный

Прочитав отзывы о Толоке, я тоже решила попробовать там поработать. Тем более основная работа в офисе за компьютером располагает к этому занятию)

16 ноября я зарегистрировалась. Моим первым заданием было - Гео/не гео . Видимо, я плохо его сделала, так как больше это задание мне не приходит. Точнее, я его не вижу в списке заданий)

Немного разобравшись что и как, мои дела пошли в гору)


В первый же день Я.Щит присвоил мне навык 60 по типу задания Идентификация данных для взрослых на картинках / Определение скриншотов документов с контентом для взрослых.


В пятницу я получила навык 80 по типу задания Оценка сайтов бок-о-бок . Эти задания и правда я выполняю хорошо.

Какие задания мне нравятся:

  • VDP-Video. Делается очень быстро. Мне больше всего нравится это задание
  • Категоризация фотографий недвижимости
  • Бок-о-бок
  • Идентификация данных для взрослых на картинках / Определение скриншотов документов с контентом для взрослых от Я.Щит- рейтинг неуклонно растёт на 1-2 пункта
  • Бинарная релевантность веб-страниц
  • Релевантность (5 градаций)

Есть одно задание за 0,04 $, которое мне не нравится и я его не берусь делать - Фактчекинговые запросы. Много мороки с ним.


2 задания у меня находятся на проверке - как видно по скриншоту - до 30 ноября. То есть целых 10 дней.


Итоги за 5 дней:

Без особого труда я заработала 2,16 доллара, то есть 139 рублей. Потратив на это примерно 1-1,5 часа в день.

Сервис имеет удобный интерфейс, задания до скуки просты. Проблем с загрузкой не было ни разу.

Минусы - это вынужденный просмотр (хоть и мельком) порно, извращений. И заданий маловато. Но уж если появляются - я сначала "беру", а потом уже читаю инструкцию и выполняю.

Деньги ещё не выводила - буду копить минимум до 500 рублей. Привяжу PayPal, который у меня как раз без дела...

Рекомендую попробовать данный вид заработка. Лично я не отношусь к нему слишком серьёзно. Не напрягаюсь насчет рейтинга и навыков, как многие (судя по форуму), просто выполняю задания быстро и согласно инструкции.




30.11.2015 За вторую неделю работы на Толоке - точнее 5 дней, так как в выходные я не заглядывала на сайт, мой баланс пополнился на 2,34 доллара . Начисления за всё время - 4,50 (298 рублей) .

Появились новые задания:


абсолютный - 6,6 относительный - 42%.

Навык по заданиям оценка сайтов бок-о-бок вырос с 80 до 85. Сегодня уже сделала это задание на сумму 0,36$, но проверка до 10 декабря. Только тогда они зачислят деньги.

07.12.2015 Третья неделя была богата на задания, даже в воскресенье. Заработала 2,92 $ . То есть с каждой неделей мой заработок по-понемногу растёт. Появляются новые задания. На рейтинг и навыки я теперь обращаю внимание, так как от них зависит наличие заданий.

Получила новый навык 100 по заданию Категоризация фотографий недвижимости - предельно простое задание.

15.12.2015 Недавно впервые вывела деньги 9$ на палку (так друг называет PAYPAL). 9го декабря заказала вывод, а 11го деньги уже поступили на счёт. Всего за 2 дня . Всего же за месяц я заработала немного - 12,10$ за 686 выполненных заданий. (852 рубля)


24.12.2015 Рейтинг держится на высоком уровне 23,6/87 . Никаких "падений" навыков у меня не было (как у других). Новые задания были "спустя рукава"(определить длину рукава) и про пиво. Даже в выходные есть задания. Как-то раз вообще штук 10 заданий было на главной странице - "фактчекинговые запросы. верификация". Такое видела впервые! Самое дорогое - за 0,04$ Фактчекинговые запросы .

По поводу форума - несмотря на наличие там нытиков, требующих заданий и жалующихся на их отсутствие, всё же советую почитывать его. Там можно узнать полезную информацию по заданиям, найти ответы на разные вопросы по сервису и самим задать свой вопрос заказчикам.

18.01.2016 Прошло 2 месяца после моей регистрации. Я по-прежнему каждый день, кроме выходных. (разве что иногда) выполняю несложные задания и коплю денежки. Сделала 3 перевода на счет PAYPAL. С него на карту ещё не переводила.

На днях я вновь получила доступ к заданию Классификация фото гео/не гео. На этот раз я постаралась не ошибиться. Мне удалось хорошо пройти тренировку, получив навык 91.)



22.01.2016 Последние новости - вчера прошла Видеокурс по оценке релевантности веб-страниц. Задание интересное, но не очень простое - надо оценить страницу, выбрав одну из 5 вариантов оценки. После обучения мне стали доступны задания разной стоимости от 0,04 и до 0,12! Это самые высокооплачиваемые задания из всех! К тому же делается достаточно быстро. Но - навык по нему меняется сразу после выполнения. У меня сначала был 50, потом повысился до 81, затем опустился до 67. Лучше делать правильно, иначе задания станут недоступны.

Мой заработок существенно вырос от 1,5$ до 3$ в день. И это не предел! Хотя раньше за неделю 2 $ зарабатывала. За месяц 2-3 тысячи рублей - это очень хороший результат при нынешнем курсе рубля.

Надо ли говорить, как это воодушевило меня)



19.05.2016 Давно не обновляла отзыв. Хочу добавить по поводу новых заданий: они появляются, что приятно. Например сегодня я заработала 0,60$ на "Поиске фото и видео". Оно интересное и быстрое

Добрый день, друзья! Сегодня очередной пост о самых важных понятиях поискового продвижения для блоггеров и начинающих сеошников. Что такое релевантность страниц сайта — тема этой статьи, из которой вы узнаете определение релевантности, основные ее составляющие и как она оценивается поисковыми системами. Позволю заметить, что это достаточно важный вопрос, на котором строится весь процесс ранжирования сайта при подготовке документов в результат выдачи. От правильного понимания этого термина зависит успешное сео продвижение Вашего сайта в поисковиках. Поэтому предлагаю заглянуть в наш словарик и получить необходимые сведения по центральному элементу ранжирования.

Определение релевантности

Что значит релевантность? Это такой процесс, при котором проверяется схожесть полученного результата от желаемого. Этот термин используется в современных поисковых системах и под ним понимается соответствие полученной информации поисковому запросу, который задал пользователь. Согласно определению, когда посетитель Яндекса или Гугла набирает свой вопрос, поисковая система пытается оценить различные документы из своего индекса и выбрать самые подходящие для ответа. Таким образом, система вычисляет меру соответствия — степень совпадения документа и поискового запроса. Соответственно, если они совпадают, то значение меры самое большое (максимальное), а если же нет — равно нулю.

По степени релевантности документов в результатах выдачи судят об эффективности работы любой поисковой системы. Если пользователь получит на свой запрос абсолютно неподходящий для него ответ, то есть большая вероятность того, что он больше не станет пользоваться таким ресурсом. Поэтому именно подбор самых релевантных документов для свой выдачи — основная задача поисковика. Это влияет и на популярность поисковой системы, и на ее прибыль.

Насколько релевантен тот или иной документ в сети Интернет, определяется специальным поисковым алгоритмом. У Яндекса он один, у Гугла он другой, но общая схема его работы у них одинаковая. Также и у других поисковиках определние релевантности свое, но имеющее общие корни.

Поисковый алгоритм

Это специальные математические выражения и формулы, по которым поисковые системы выбирают различные сайты в свои результаты поиска. Каждый из этих веб-ресурсов содержит один самый подходящий документ, в котором находится ответ на поисковый запрос пользователя. Принцип работы алгоритма очень прост: сначала выбираются все страницы сайтов, содержащие искомый запрос, а потом идет планомерное отсеивание — отсекаются площадки без четкой информации для пользователя или неразрешенные в связи с использованием запрещенных методов оптимизации (черное seo — клоакинг, дорвеи и т.д.). Выбранные страницы анализируются по контенту документов и принимается решение о том, насколько они соответствуют поисковому запросу. И в зависимости от степени соответствия каждому документу присваивается свой номер в поисковой выдаче. Чем он меньше, тем быстрее его увидит пользователь поисковика.

Что такое релевантность страниц сайта

Обычно у каждого веб-ресурса есть несколько страниц, которые содержат ответ на запрос пользователя поисковой системы. Задача перед поисковым алгоритмом ставится следующая — выбрать наиболее релевантный документ (страницу сайта или пост блога). Этот вопрос решается следующим образом. На релевантность каждой страницы влияет большое число факторов. Поэтому для оценки соответствия документа веб-ресурса запросу пользователя поисковой системы вычисляется суммарный показатель. Соответственно, страница с максимальным суммарным показателем будет самой подходящей и именно ее поисковая система покажет пользователю. Например, на следующей картинке можно увидеть выборку из поисковой системы Яндекс самых релевантных страниц моего блога по запросу «что такое видимость сайта». Самый первый документ имеет максимальный суммарный показатель.

От чего же зависит релевантность страницы? Каждая страница любого сайта — это целый самостоятельный элемент сети Интернет. Он содержит свой контент. В основном он уникален, со своим текстом, картинками и т.д. Этот элемент взаимодействует с другими страницами — от него идут различные ссылки на другие страницы своего сайта или на чужие веб-ресурсы. И по возможности он тоже получает различные внешние ссылки. Поэтому можно сказать, что на релевантность страницы по конкретному поисковому запросу влияют как внутренние параметры, так и внешние. Плюс ко всему еще важен и авторитет этой страницы. Давайте рассмотрим подробнее каждую составляющую.

Внутренняя

Внутренняя или по другому, текстовая релевантность — это степень соответствия внутренних критериев страницы веб-ресурса требованиям поисковых систем. Если при поисковом запросе слова на странице соответствуют его форме и являются наиболее употребляемыми, то этот документ будет считаться самым релевантным. Другими словами можно так сказать — чем ближе до идеального (у каждой системы свое число) соотношение количества вхождений запроса к общему числу всех слов в тексте, тем выше окажется документ в результатах выдачи. Перечислим основные параметры, с помощью которых она оценивается.

  • Частота поискового запроса в тексте . Имеется в виду объем и количество повторений ключевого запроса на странице сайта. Чем ближе к идеальному варианту (повторюсь, что у каждой поисковой системы это своя цифра), тем лучше в плане оценки релевантности документа.
  • Месторасположение слов в заголовках . Если поисковый запрос находится в заголовке страницы, то повышается вероятность лучшей оценки этого документа, по сравнению с остальными страницами веб-ресурса. То есть тег title должен содержать в своем предложении ключевой запрос, что значительно усилит релевантность страницы.
  • Близость к началу страницы . Поисковый робот при сканировании новой страницы идет по коду с самого ее начала. Поэтому чем раньше он встретит поисковый запрос на ней, тем это лучше для оценки релевантности. Поэтому ключевые слова необходимо прописывать как можно раньше в статье сайта или посте блога.
  • Наличие ключевых слов в специальных местах документа . В первую очередь это говорится о наличии поисковых запросов в заголовке статьи (обычно в теге h1) и в подзаголовках (в теге h2 — не так важно, как в h1, но наличие приветствуется). Плюс оформление поисковых запросов в тексте в специальные теги (strong и т.д.). И конечно же наличие ключевых слов в мета-тегах Description (описание страницы) и Keywords.
  • Наличие синонимов ключевых слов . Очень важный элемент. Наличие синонимов в контенте страницы говорит поисковым системам о том, что данный документ действительно относится к тематике поискового запроса, а значит он будет наиболее полезным для пользователя. Таким образом поисковики чистят результат выдачи — не берутся в расчет страницы, которые содержать ключевые слова как дополнение к другим темам и документы, которые являются площадками для большинства автоматизированных систем продвижения (RooKee, SeoPult и т.д.)

Внешняя (ссылочная)

В основе этой составляющей лежит принцип ссылочной популярности страницы сайта. Здесь в расчет принимается число ссылок с их текстами (анкорами). Чем больше ссылок тем лучше ссылочная релевантность. И если текст ссылки содержит ключевой запрос пользователя, тем значимей становится страница. Поэтому рекомендуется всегда использовать в тексте ссылок поисковый запрос. Причем не важно, внутренняя это ссылка или внешняя — слова анкоров имеют значение. Также оценивается околоанкорный текст ссылки, который содержит внешняя страница другого веб-ресурса. Если он не является тематическим по поисковому запросу, значимость текста ссылки будет меньше.

Авторитетность сайта

  • количество и качество внешних ссылок, ведущих на сайт. Важный показатель, который показывает степень значимости сайта и его страниц среди других веб-ресурсов. Чем качественней внешние ссылки (ключевые слова в анкоре и тематический околоссылочный текст) и чем авторитетней сайт-донор (веб-ресурс, который отдает внешнюю ссылку), тем больший вес может перейти на целевую страницу.
  • содержание сайта и соответствие контента поисковым запросам. Чем больше страниц, по которым продвигается сайт, отвечают запросам пользователей поисковых систем, тем выше авторитетность сайта. Поэтому для любого веб-ресурса, который раскручивается в поисковиках наиболее важны два момента — это правильное составление семантического ядра и наличие уникального оптимизированного контента. Даже при наличии огромного числа внешних ссылок невозможно на длительный срок продвинуть целевые страницы сайта в топ-10 без хорошего текста и грамотного набора ключевых слов. Со временем поисковая система пессимизирует эти документы со своей выдачи, уменьшив на порядок их релевантность по причине отсутствия нормального контента с учетом внутренней оптимизации.

Если блоггер продвигает свой веб-ресурс в поисковых системах, то ему могут быть полезны следующие советы и рекомендации по улучшению релевантности целевых страниц:

  • Обязательно перед продвижением целевых страниц правильно подберите семантическое ядро Вашего блога. Если Вы будете продвигать целевые страницы по некачественным поисковым запросам, Ваш блог получит намного меньше целевых посетителей и большее число отказов, что со временем уменьшит качество этих страниц. Проверяйте все параметры ключевых слов (частотности, качество слова, его конкурентность) — это залог получения качественного трафика из поисковых систем.
  • Новые страницы проверяйте в результатах выдачи по своему ключевому запросу. Например, Вы продвигаете одну страницу по определенному поисковому запросу. Но после индексации по этому ключевому слову в выдаче поисковой системы находится абсолютно другая страница. Значит Вам необходимо проверить все параметры, по которым рассматривается релевантность целевой страницы. Здесь может быть следующая проблема — документ плохо оптимизирован и/или на него поступает меньшее количество весомых внешних и внутренних ссылок — вес страницы очень мал по сравнению с той, которая висит в выдаче.
  • Повышайте авторитет своего блога. Со временем поднятия рейтинга Вашего сайта увеличится и релевантность целевых страниц, по которым продвигается блог. Это все будет идти автоматически с ростом популярности Вашего веб-ресурса. Подымается вИЦ и тИЦ Вашего сайта, растут позиции страниц Вашего сайта в Яндексе (аналогично в других поисковых системах).

На этом мой очередной ликбез закончен. Напоследок просьба к моим читателям — в комментариях этого поста, помимо всего прочего, хотелось бы узнать Ваше мнение по следующим вопросам:

  1. Как часто Вы проверяете на релевантность Ваши целевые страницы?
  2. Чего не хватает на Ваш взгляд в моих уроках рубрики продвижения сайта?
  3. На какую тему Вы бы хотели получить материал в одном из следующих уроков?

Спасибо, друзья! До встречи!

Формальные оценки релевантности можно получить только для релевантности первого рода, т.е. для релевантности в исходном ее понимании в теории информационного поиска.

Для введения критерия релевантности следует задать процедуру определения меры семантической близости поискового образа документа поисковому образу запроса и некоторое пороговое значение этой меры. Если мера превышает пороговое значение, то документ релевантен запросу.

ПОД и ПОЗ представляют собой множества ключевых слов или дескрипторов в зависимости от вида информационно-поискового языка. Для их сопоставления используют критерии смыслового соответствия, которые определяют на основе совпадения ключевых слов (дескрипторов) в ПОД и ПОЗ.

ПОД и ПОЗ можно представить в виде четких и нечетких множеств.

Для четких множеств вводят нормированную меру релевантности

Критерий смыслового соответствия можно представить в виде

где μβ (а, b) – функция вычисления меры релевантности (или просто мера релевантности); α – пороговое значение релевантности, такое, что

Изменяя пороговое значение а, можно организовать выдачу различных совокупностей документов, которую в теории информационного поиска называют эшелонированной выдачей. Каждый эшелон соответствует определенной мере семантической близости совокупности документов запросу.

Очевидно, что чем больше пороговое значение а, тем более жесткие условия налагаются на смысловую близость документа запросу. В нормированных мерах при α = 1 для выдачи документа требуется полное совпадение ПОД и ПОЗ.

Оценку релевантности можно характеризовать полнотой выдачи (или потерями), т.е. числом невыданных релевантных документов, и точностью (или шумом), т.е. числом или процентом "лишних" документов, которые выданы в результате поиска, но не являются релевантными.

Например, в оценки полноты R и точности Т вводятся следующим образом:

где a i число релевантных документов, формально выданных системой на i -й запрос; m i – число всех формально выданных на i-запрос системой документов; и, – число всех релевантных документов, соответствующих запросу.

= средние относительные оценки;

–суммарные относительные оценки, где N – число поисков.

Величины (1-7) и (I – R) называются соответственно шумом и потерями.

В работах А. И. Михайлова, А. И. Чёрного и Р. С. Гиляревского предлагается наглядная матрица для определения полноты и потерь, точности и шума (табл. 6.5).

Таблица 6.5

Матрица для определения критериев релевантности

Полноту поиска измеряют отношением числа выданных релевантных документов (а ) к общему числу релевантных документов массива (а + с):

Точность поиска Г – отношение числа выданных релевантных документов (а) к числу общему выданных документов (а + b):

Соответственно, потери L и шум S можно представить следующим образом:

В предлагается, проведя серию экспериментов п по определению полноты и точности поиска, определить среднюю полноту и среднюю точность:

Используются и иные способы усреднения (см., например, в ). Например, в связи с оценкой системы СМАРТ Сэлтон ввел нормированную полноту R N и нормированную точность P N:

где N – число документов в массиве; п – число всех релевантных документов в массиве; n i – число релевантных документов, выданных до i -го ранга включительно;

где i – номер ранга.

В предлагается также, пользуясь табл. 5.4, ввести (с определенной степенью приближения) показатели в терминах теории вероятностей:

Предлагались и другие способы оценки релевантности (см. обзор в ).

Например, со способами применения для оценки релевантности нечетких множеств можно познакомиться в работе Г. Ю. Максимовича, А. Г. Романенко, О. Ф. Самойлюк

К числу показателей функциональной эффективности названные авторы предлагают относить также оперативность поиска; специфичность поиска С – отношение числа невыданных нерелевантных документов (d ) к общему числу нерелевантных документов (d + b), где b – число выданных нерелевантных документов:

С учетом того, что на практике при оценке ИПС с большими массивами информации точные измерения числа релевантных и нерелевантных документов в общем массиве или в массивах выданных документов затруднено, предлагают использовать энтропийные показатели.

Энтропийные меры могут быть получены на основе исследования выборки из информационного массива, т.е. могут использоваться вероятностные меры неопределенности исходного массива р0, массива выданных р 1 и массива невыданных р 2 документов, вычисленные на их основе #0, Н B, Н нв и соответствующие меры W.

В частности, предлагается интегральный энтропийный показатель как мера упорядоченности поискового массива документов, являющаяся результатом процесса поиска по заданному запросу:

где Н 0 – допоисковая (априорная) энтропия; Н п послепоисковая (апостериорная) энтропия.

При этом для измерения априорной и апостериорной энтропии предлагается использовать меры концентрации релевантных документов в общем массиве, в массиве выданных документов и в массиве невыданных документов, в относительных единицах:

где а – число релевантных документов, выданных в результате поиска; г – число релевантных, не выданных в результате поиска; g – число нерелевантных документов, выданных в результате поиска; d – число нерелевантных документов, невыданных в результате поиска.

Энтропийная мера может быть представлена и в логарифмической форме.

Например, для оценки энтропии используются натуральная логарифмическая мера (т.е. неопределенность измеряется в неперах Нп):

– неопределенность исходного массива;

– неопределенность массива выданных документов:

– неопределенность массива невыданных документов:

При формировании подобных мер могут быть использованы и иные логарифмические шкалы: двоичные логарифмы (биты), восьмеричные логарифмы (байты), десятичные логарифмы.

Определение полноты системы связано с определением содержательной выдачи на каждый запрос.

Существует несколько способов (методов) определения этой выдачи:

  • сплошной просмотр всего экспериментального массива. Достоинством этого способа является надежность, недостатком – трудоемкость;
  • метод документа-источника ("метод Клевердона"). Состоит в том, что по некоторым документам массива, выбранным более или менее случайно, составляются запросы с таким расчетом, чтобы каждый документ-источник был релевантен составленному по нему запросу;
  • метод контрольных документов. По запросу, полученному по произвольно выбранному документу-источнику, проводится содержательный поиск путем сплошного просмотра массива, начиная, например, с документа-источника, до нахождения первого релевантного документа, который объявляется контрольным. Значение полноты для системы считается теперь как доля запросов, по которым система выдала контрольный документ в общем количестве запросов;
  • метод объединения формальных выдач. Применяется при сравнении нескольких поисковых систем ("оценка-шкала"), Он состоит в том, что по каждому запросу эксперт просматривает только те документы, которые выдавались хотя бы одной из этих поисковых систем. Содержательной выдачей считается совокупность обнаруженных релевантных документов, и относительно нее определяется полнота, которая отличается от истинной полноты каждой из рассматриваемых систем.

Вопрос о представительности массива документов и массива запросов, выбранных для определения формальных оценок, в общем виде не решен. Считается, что более или менее устойчивые оценки (колебания не превышают 5%) можно получить на массиве в 4000 документов, массив запросов при этом должен быть порядка нескольких сотен.

Таким образом, релевантность (формальная) характеризует свойства средств логико-семантического аппарата информационно-поисковой системы и зависит от возможности отображения ПОД и ПОЗ с помощью информационнопоискового языка, принятых в ИПС алгоритмов поиска и системы индексирования.

  • Максимович Г. Ю. Информационные системы / Г. Ю. Максимович, А. Г. Романенко, О. Ф. Самойлюк. М.: Изд-во Рос. экон. акад., 1999.
  • Максимович Г. Ю. Информационные системы / Г. Ю. Максимович, А. Г. Романенко, О. Ф. Самойлюк. М.: Изд-во Рос. экон. акад., 1999.

Релевантность (образовано от английского relevant – относящийся к делу) – в общем смысле это соответствие документа ожиданиям пользователя. Таким образом, релевантность поиска - это степень удовлетворения пользователя показанными в ответ на его запрос поисковыми результатами. В идеале, страница выдачи должна полностью удовлетворять информационную потребность пользователя в независимости ее полноты и точности.

Высчитывается релевантность с помощью алгоритмов поисковых систем. Каждая поисковая машина работает по своему алгоритму. В ранжирование строится за счет технологии Матрикснет.

Виды релевантности поиска

  • Формальная – именно на этом виде строится ранжирование поисковиков. Алгоритмическим путем сравнивается образ поискового запроса с образом документа в индексе поисковой машины. Это означает, что релевантность рассчитывается без непосредственного участия человека - по определенной формуле на основе данных, собранным поисковым роботом.
  • Содержательная – релевантность определяется неформальным путем. Данный вид также применяется поисковыми системами, но уже для оценки качества поиска. Специальные сотрудники оценивают поисковые результаты, исходя из их предположения о соответствии данного документа запросу. Этих специалистов называют асессорами.
  • Пертинентность – полное удовлетворение информационной потребности пользователя. Это именно то, к чему стремятся все поисковые системы.

В поисковой выдаче показываются наиболее релевантные с точки зрения поисковика страницы сайтов. Перед началом продвижения всегда необходимо определять наиболее подходящую для раскрутки страницу. Здесь можно руководствоваться такими факторами как возраст, ссылочный вес, уровень и уже имеющаяся релевантность страницы.

Чтобы определить наиболее релевантную страницу из уже существующих достаточно воспользоваться языком запросов или расширенным поиском.

Страница расширенного поиска для Яндекса http://yandex.ru/search/advanced

Страница расширенного поиска для Google https://www.google.com/advanced_search


Составляющие релевантности страницы

В подавляющем большинстве случаев SEO-оптимизаторы работают над сайтом в следующих направлениях:

  • Техническая составляющая релевантности страниц сайта – общие ошибки, затрудняющие корректную индексацию роботами поисковых систем:
    • доступность сайта;
    • скорость загрузки страниц;
    • выдача кодировки ресурса;
    • настройка кодов ответа сервера (редиректы, страницы с ошибками);
    • зеркала сайта;
    • файл robots.txt и мета-тег robots;
    • файл sitemap.xml;
    • фреймы;
    • скрытые от пользователя элементы;
    • структура URL;
    • дубликаты страниц;
    • битые ссылки;
    • дата последнего изменения страниц;
    • спам;
    • другие помехи для индексации.
  • Текстовая составляющая релевантности страниц сайта – соответствие контента запросу пользователя:
    • мета-теги;
    • заголовки текста;
    • вхождения ключевых фраз в текст;
    • атрибуты тега img.
  • Ссылочная составляющая релевантности – факторы, связанные со :
    • внешняя перелинковка;
    • анкоры ссылок;
    • характеристики доноров;
    • динамика роста ссылочной массы.
  • Поведенческая составляющая релевантности – факторы, связанные с поведение пользователей:
    • количество посетителей;
    • источники посетителей;
    • время пребывания;
    • показатель отказов;
    • глубина просмотра;
    • конверсия;
    • удобство навигации;
  • Иные факторы:
    • региональность;
    • аффилиаты.

Здравствуйте, уважаемые читатели блога сайт. Сегодня я хочу поговорить о таких банальных для многих вебмастеров и оптимизаторов понятиях, как ранжирование и релевантность (это те термины, которые будут присутствовать в большинстве публикаций на тему SEO). Хотя для начинающих вебмастеров они не сразу становятся понятными и очевидными.

Конечно же, ничего сложного в этих терминах нет и главную проблему они представляют именно для поисковых систем. Им кровь из носа нужно максимально точно выстраивать иерархию сайтов и найти идеальные способы определения соответствия документа (веб страницы) запросу пользователя.

Релевантность и ранжирование - что это такое

Эти самые асессоры выносят оценки определенному количеству сайтов по определенному количеству запросов. Таким образом осуществляется обучение алгоритма, который подробно изучает помеченные асессорами хорошие и плохие ресурсы, выделяет факторы, по которым можно их ранжировать и уже потом, опираясь на них, сам пытается отделить зерна от плевел в масштабах всего рунета.

При ранжировании в Яндексе учитывается более 400 факторов. Причем они могут учитываться как отдельно, так и в качестве мономов (произведение нескольких факторов). Следовательно, если один из них в мономе будет нулевой, то он может свести на нет и влияние других, не нулевых факторов. Т.о. мы должны понимать, что не возможно однобокое продвижение — сейчас работает только комплексная раскрутка сайта по всем возможным направлениям.

Что примечательно, в Яндексе используются отдельные формулы для разных регионов России, отдельные формулы для стран СНГ (Белоруссия, Казахстан и Украина) и Турции. Т.о. алгоритм работает в автоматическом режиме, однако иногда используются полуавтоматические и ручные действия, направленные на корректировку поисковой выдачи в сторону повышения ее релевантности.

Информации по типу используемой формулы в Google гораздо меньше. Не совсем ясно, что используется — ручной или самообучающийся автоматический алгоритм на вроде MatrixNet. По слухам, Гугл все же использует ручную формулу ранжирования, аргументируя это тем, что результаты выдачи автоматической иногда могут быть непредсказуемыми (чем, собственно, славится Яндекс).

По отрывочным сведениям можно сделать вывод, что поиск Google так же использует большое количество факторов ранжирования, но тем не менее несколько меньшее, чем лидер российского проката. Речь идет о паре сотен факторов. И как я уже писал в статье про , он имеет отдельные формулы релевантности для разных стран. Внутри же стран разбиения по регионам (как в Яндексе) отсутствует. По крайней мере это можно с точностью сказать применительно к рунету.

Основные факторы ранжирования в Яндексе и Гугле

Внутренние факторы

Их можно подразделить на три категории:

  1. Текстовое ранжирование — насколько текст документа соответствует запросу пользователя
  2. — насколько данный текст уникален (авторский ли он), насколько он грамотный с точки зрения русского языка и насколько он близок к естественному:
    1. Уникальный контент — скопирован ли текст с других сайтов (читайте тут про и способы его пресечения) или же написан вами или профессиональным
    2. Вторичность контента — недавно Яндекс предоставил в режиме альфа тестирования вебмастерам возможность застолбить за собой авторство на контент, путем добавления текста в соответствующую . Т.о. вас признают автором текста, а все дубли статьи, разошедшиеся по интернету, будут играть уже не во вред, а на пользу вашему сайту. Т.е. копирование вашей статьи будет говорить о добавлении вам авторитетности и, грубо говоря, может быть приравнено к проставленной на вас ссылке. О как.
    3. Естественность контента — с помощью математической лингвистики поисковик считает количество вхождений частей речи и сопоставляет его со средним значением по всей остальной базе текстов, которая у него имеется (по корпусу проиндексированных документов). Математика — величайшая из наук (и моя любимая), с помощью нее легко можно будет определить неестественность текста , при попытке искусственно повысить его релевантность лишними ключевыми словами
    4. Ненормативная и адалт — лучше этого избегать, ибо текст может попасть под соответствующий фильтр
  3. Свойства самого сайта — входят ли ключевые слова в название домена, возраст ресурса и домена, количество страниц:
    1. Возраст сайта (с момента попадания в поисковый индекс, а не с момента регистрации домена) и возраст документа, релевантность которого оценивается поисковиком. Это очень важный в Яндексе (если сайту меньше года, то он не сможет пробиться в Топ по более-менее конкурентным запросам, а полную силу ресурс набирает где-то через три года), да и в Google есть похожий временной фактор, который называется песочница, когда молодые сайты не могут хорошо ранжироваться.
    2. Формат документа, релевантность которого оценивается поисковой системой. Лучше всего и в Яндексе, и в Google ранжируются обычные Html документы, а форматы Pdf, Doc и другие, хоть и индексируются, но продвигать лучше именно страницы с ХТМЛ кодом.
    3. Использование ключевых слов в — поисковики это до определенного момента очень любили, но с некоторых пор за это можно попасть под фильтр Гугла, если он посчитает это нужным.
    4. Наличие всплывающих баннеров может привести к пессимизации ресурса (понижении в позициях результата поиска за счет вычитания значения релевантности)
    5. Плохие доменные зоны и плохие Ip адреса хостинга — поисковики зачастую гребут всех под одну гребенку и если вам не повезло зарегистрировать домен в заспамленной доменной зоне, или же не повезло купить дешевый или получить на Ip адресе, где висит еще масса ГС ресурсов, то все может быть очень и очень печально в плане плохих позиций вашего сайта. Также, если на вас зарегистрировано много ГС, а вы на те же данные потом регистрируете СДЛ, то его ранжирование может быть занижено из-за анализа поисковиком данных .

Внешние или ссылочные факторыранжирования

Их можно разделить на две категории:

  1. Статические факторы, не зависящие от того, по какому именно запросу поисковик должен определить релевантность данного документа. К ним можно отнести , и т.п.
  2. Динамические факторы или ссылочное ранжирование — насколько релевантны тексты ведущих на данный документ ссылок (надо добавлять в ) тому запросу, который вводит пользователь в поисковой строке.

Пользовательские или поведенческие факторы

Учитывается, как себя ведет пользователь на странице выдачи и как он себя ведет после того, как перешел на сайт:

  1. Кликабельность (CTR) вашего ресурса в результатах поиска — один из самых влиятельных поведенческих факторов и одновременно один из самых неоднозначных, ибо если вашего сайта нет в Топе, то и кликов никаких по нему не будет, а если у вас нету кликов, то как вы попадете в топ. Все это приводит к постепенной стабилизации ресурсов находящихся в Топе — их очень сложно будет оттуда выбить именно за счет высокой кликабельности (CTR).
  2. — фактор, который может опираться на анализ и учет источников трафика на ваш сайт (поисковый трафик, переходы с закладок и др). Значимость его не так высока, как у кликабельности.
  3. Поведение пользователей на странице — могут учитываться активные действия, проведенное на ней время, внутренние переходы и переходы на другие ресурсы.
  4. Поисковики могут делать отдельные выборки среди всех пользователей посещающих данную страницу. Например, может отдельно анализироваться поведение посетителей пришедших именно по тому запросу, по которому поисковик в данный момент ранжирует ваш сайт. Может отдельно учитываться поведение пользователей отдельного региона, где вы пытаетесь продвигаться.
  5. Для того, чтобы улучшить поведенческие факторы, нужно:
    1. Чтобы целевая страница полностью отвечала на поисковый запрос, по которому вы ее продвигаете
    2. Желательно, чтобы целевая страница побуждала пользователя к дальнейшим действиям, будь то заказ товара в магазине или же переход к прочтению другой статьи на информационном ресурсе
    3. Ваш сайт должен вызывать у пользователей доверие и расположение, для чего необходимо использовать уникальный и приятный дизайн, а также стремиться к тому, чтобы как можно больше отличаться в выгодную сторону от ГС и сателитов
    4. Ресурс должен быть удобным для пользователя, ибо юзабилити способно кардинально влиять на дальнейшее поведение посетителя на вашем проекте
    5. Нужно думать о , ибо они напрямую влияют на один из самых значимых поведенческих факторов ранжирования — кликабельность в результатах поиска
    6. Страницы вашего ресурса должны одинаково хорошо отображаться во всех , иначе вы потеряете какую-то часть поведенческих плюсов от тех посетителей, которые юзают тот браузер, о котором вы не подумали при верстке
    7. На вашем сайте не должно быть проблем с
    8. Ваш ресурс должен работать стабильно и бесперебойно, что в основном определяется качеством хостинга. описанными по ссылке способами.

Региональные факторы

Учитываются при определении релевантности — последнее время они очень заметны в Яндексе, когда в выдачах по какому-либо региону России отдается предпочтение ресурсам относящимся именно к этому региону. Что же будет влиять на ранжирование документа в данном конкретном регионе:

  1. Тут важен выбор правильной доменной зоны, соответствующей региону, в котором вы хотите успешно продвигаться (для России — зона «ru» и т.д.).
  2. Присвоить сайту соответствующий регион в Яндекс Вебмастере и
  3. Употреблять названия требуемого региона в текстах документов и анкорах входящих ссылок для лучшего последующего положения ресурса именно в выдаче по данному конкретному региону
  4. Стараться получать входящие ссылки с сайтов, принадлежащих к тому же самому региону, где вы хотите высоко ранжироваться
  5. Добавить на страницы своего проекта адреса, почтовые индексы и телефоны того региона, где вы хотите попасть Топ

Запросные факторы

Скорее всего для коммерческих и информационных запросов используются разные формулы расчета релевантности. Также разная формула может использоваться и для различных типов запросов (навигационные, транзакционные и т.п.) и даже количество слов в запросе может влиять на тип используемой формулы.

  1. Если сейчас и не используются на полную катушку, то вскоре обязательно будут использоваться так называемые социальные сигналы (особенно в свете достигнутых договоренностей между Яндексом и ). В рунете социальные сети (влияющие если не сейчас, то в скором времени) — это «В контакте» и Facebook.
  2. Станет ли такой можно почитать, пока не ясно, но я бы советовал устанавливать на каждую страницу сайта вкупе с .

Удачи вам! До скорых встреч на страницах блога сайт

Вам может быть интересно

СЕО терминология, сокращения и жаргон
Поисковая оптимизация текстов - оптимальная частота употребления ключевых слов и его идеальная длина
Как ключевые слова влияют на продвижение сайта в поисковых системах
Расшифровка и разъяснение Seo сокращений, терминов и жаргонизмов
Какие факторы поисковой оптимизации влияют на продвижение сайта и в какой степени
Анкор - что это такое и насколько они важны в продвижении сайта
Как работают поисковые системы - сниппеты, алгоритм обратного поиска, индексация страниц и особенности работы Яндекса
Учет морфология языка и другие проблемы решаемые поисковыми системами, а так же отличие ВЧ, СЧ и НЧ запросов
Контент для сайта - как наполнение уникальным и полезным контентом помогает в современном продвижении сайтов

Публикации по теме