и мы с вами свяжемся!
Русский язык очень богат, он насчитывает огромное количество слов, а уж тем более словоформ. До того как столкнёшься с поисковой оптимизацией (продвижение сайта самостоятельно) тебе и в голову не может прийти, что слова имеют свой вес. Так зачем же нам нужно представлять себе эти веса слов и чем они могут нам помочь или наоборот помешать? Дело в том, что используя вес слова, можно сделать вывод о важности их в контексте данного документа в общей коллекции (то есть оценить релевантность). В теорию данного вопроса углубляться не буду, поиск в помощь — начать можете отсюда.
Как всегда не будем ходить вокруг, да около — окунемся в конкретный пример.
«Золотой ключик» — золотой или ключик?
Да, для примера я взял вот такой, вполне не коммерческий запрос. Он вовсе не однозначен для ПС. Как же ПС определяет релевантные документы? Найдем в выдаче ссылку на полную сказку Толстого (например эту).
Читать сказку про Буратино мы будем сейчас чуть иначе чем обычно. Нас интересует сохраненная в кэше ПС страница данного сайта.
Кстати я написал статью — как написать статью для ТОП. Тайтл это один из факторов, работать нужно со всеми факторами.
Пролистав всю сказку (а она оказывается и не такая уж большая) мы видим подсвеченным наш запрос и слова из него в словоформах. Но если посмотреть внимательно и использовать поиск по странице, то заметим странную особенность. В принципе понятно что искомое словосочетание подсвечено, а вот с отдельными словами — что то не так.
Зная, что ключ и ключик для Яндекса это разные слова проверим это утверждение. Заменим свой запрос на «золотой ключ», слово ключ более употребимо — наверно даже чаще чем золотой. посмотрим что можно найти в кэше ПС. Тут уже ни ключ ни золотой по отдельности Яндекс не интересуют, важно только когда эти слова связаны. Попробуем понять, как это работает.
Можно ли оценить вес слова и что это даст?
Если Вы почитали немного теории на тему TF-IDF, то сложность данной задачи вам должна быть понятна. Все не так просто, если TF (частоту слова) мы можем определить, то IDF (обратная частота документа) нам не ясна и данных мы таких не найдем. Собственно проблемы то две:
Вывод один, узнать вес слова для ПС нельзя. Но выход то найти хочется, давайте поразмышляем.
PS. Для расчета TF есть программа WebSite Auditor и кстати она бесплатная.
Для удобства я использовал бесплатную программу Key Collector. Она платная, бесплатный оналог словаЕБ =) Достаточно вбить в поисковик и скачать. Частотности на Вордстате бывают трех типов:
базовая
в кавычках
с восклицательным знаком перед словом
К примеру (слово, «слово» и «!слово»). Что все это значит.
Базовая частотность показывает сколько раз данное слово или фраза употреблялись в поисковых запросах во всех его словоформах (и возможно не только они, но и другие слова).
Частотность «слова» означает количество запросов только данного слова во всех его словоформах (без доп. слов).
«!Частотность» вот в таком виде покажет сколько раз запросили именно это слово, употребив его именно в этой словоформе.
Нам интересно в этом разрезе не конкретная словоформа и даже не слово — запрос, нам интересно сколько раз словоформы данного ключа набирали на клавиатуре в поисковой строке — то есть базовая частотность. Снимем для порядка все виды и посмотрим.
По базовой частотности золотой обогнал ключик в 27,5 раз, по частотности в кавычках в 30 раз, а по точной в 23,5 раза. Все это в два раза ниже варианта с выдачей (там в 64,5 раза, но ему я не доверяю в пограничных случаях). С первым вариантом разобрались, естественно слово ключик в этом запросе значительно важнее золотого — отсюда и такое отношение ПС. А что же с антикоррозийным и просто с ключом? Посмотрим: Что же, теперь все понятно. Слово ключ — имеет частотность сравнимую со словом золотой, отсюда и подтверждение нашего наблюдения. Запрос золотой ключ работает только в паре, так как оба слова — общеупотребимые в равной степени. А антикоррозийный поменялся ролями с ключиком, так как термин еще более редкий.
Самое интересное, что понимая все это — можно не только что то улучшить, но и исправить ошибки. Вывод прост низкочастотные слова перетягивают на себя вес, как в запросе так и на странице и в метатегах.
На этом пожалуй стоит остановится. Как уже не раз писал — в Яндексе все не так просто, как написано тут, все работает намного сложнее. Однако, понимание таких простых принципов будет Вам в любом случае на пользу.
Вступление Сервис контекстной рекламы Яндекс Директ остается удобным
Добрый день дорогой читатель! Каждый день в интернете
С помощью книги Вы по пунктам сможете самостоятельно провести технический аудит сайта и уже получить значительный прирост посетителей и получить первые продажи.