Как часто надо проверять позиции сайта в поисковиках?
Артем ШКОНДИН
"Надо" в данном случае не очень правильное слово. У некоторых сайтовладельцев развилась настоящая мания, и они проверяют позиции в поисковиках несколько раз в день. В этом случае проверку надо делать как можно реже, чтобы избавиться от зависимости :)
Некоторые поисковики, действительно, обновляют отдельные позиции индекса ежедневно, но глобальные изменения происходят, как правило, не чаще одного-двух раз в месяц. Мелкие колебания происходят либо из-за включения в индекс свежедобавленных сайтов, или же из-за распределенной природы поисковых машин: "БД", в которой хранится поисковый индекс, распределяется между несколькими компьютерами, и когда пользователь адресует свой запрос поисковику, производится опрос этих компьютеров, не все их которых могут откликнуться по различным причинам. Поэтому если вы произведёте проверку позиций с интервалом всего в одну минуту, может оказаться так, что именно ваш сайт изменит своё положение в результатах выдачи или даже пропадёт из поиска.
Чтобы не тратить своё время понапрасну, я рекомендую проводить проверку позиций одновременно с анализом логов сервера, чтобы отслеживать заодно и позиции по новым запросам, по которым посетители приходят на сайт. В зависимости от ротации логов делать это можно либо раз в неделю, либо раз в месяц. Единственное, что можно порекомендовать в дополнение к вышеизложенному, это проводить проверки не каждый понедельник или первое число месяца, а привязаться к обновлениям в Яндексе, которые происходят как правило в ночь с понедельника на вторник или с четверга на пятницу.
Сергей ПЕТРЕНКО
Это зависит от самого поисковика. Яндекс обновляет базу системы два раза в неделю - в ночь на вторник и в ночь на пятницу. Впрочем, лучше использовать возможность, предоставляемую самим Яндексом и подписаться на запросы http://www.yandex.ru/subscribe/. После обновления базы вам придет письмо с новыми результатами. Рамблер заявляет, что обновляет базу постоянно, а сайты индексируются в течение 2-8 дней. Таким образом, еженедельной проверки, как правило, будет достаточно. Апорт индексирует быстро, и новые страницы в базу попадают в течение недели. Google индексирует сайты по разному графику - в зависимости от параметров сайта. Тут опять-таки стоит проверять раз-два в неделю.
Алексей ПОЛЯКОВ
Это целиком зависит от ваших предпочтений. :) Можно проверять очень редко, но постоянно следить за объемом трафика, и в случае каких-то нездоровых тенденций уже разбираться внимательнее.
Герман ОСТАШЕВСКИЙ
Вполне достаточно проверять позиции сайта раз в две недели.
Мой сайт построен на технологии фреймов. Хочется перейти на современную технологию - PHP. Но возникает вопрос об индексировании поисковыми системами сайта, написанного на PHP. Также было бы интересно для себя решить раз и навсегда - когда лучше всего использовать технологию PHP, а когда можно обойтись простым использованием html? В сети встречала некоторые сайты, часть которых написана на PHP, а часть - на html. Есть ли в этом смысл - вроде бы, с одной стороны, смешение стилей не совсем правильно, но, может быть, построенные таким образом сайты лучше индексируются?
Артем ШКОНДИН
PHP - это не стиль, это язык программирования. PHP = PHP HypertText preprocessor - обработчик гипереткста. Его применяют в тех случаях, когда необходимо получать страницы сайта динамически, возможно, что и в ответ на какие-то действия пользователя. Например, тот же каталог можно организовать при помощи только статических HTML страниц. Но тогда при добавлении новой ссылки в раздел, вам придётся вручную править HTML код страницы. На PHP можно написать сценарий добавления ссылки в каталог: пользователь заполняет форму и отправляет её содержимое PHP-обработчику нажатием кнопки, обработчик проверяет правильность заполнения полей формы, помещает их в случае правильного заполнения в раздел каталога "непроверенное" и отправляет администратору каталога уведомление о добавлении новой ссылки и т.д.
Сами по себе PHP страницы индексируются так же хорошо, как статические страницы HTML, особенно если роботу (впрочем, как и остальным посетителям) возвращаются все HTTP заголовки, соответствующие статической HTML странице. О проблемах, которые возникают при передаче параметров в строке запроса, а в особенности идентификатора сессии, а также способа устранения этих проблем, рекомендую почитать следующий топик: http://www.searchengines.ru/forum/showthread.php?s=&threadid=679
В вашем же случае, возможно наиболее оптимальным способом избавления от фреймов будет использование SSI (подробнее см. http://www.citforum.ru/internet/webd/article_11.shtml) - всего программирования тут ровно на одну инструкцию, которая включает содержимое одного файла в другой.
Герман ОСТАШЕВСКИЙ
Поисковый робот, как и пользователь, получает html-код страницы, поэтому для него нет никакой разницы какие серверные скрипты эту страницу сгенерили.
С индексацией динамического контента могут возникнуть проблемы в Апорте, Гугле и Рамблере. Яндекс динамику индексирует неплохо.
Поисковик распознает динамическую страницу по наличию в url знаков "?" и "=" Почитать о том, как можно замаскировать динамику под статику можно здесь:
http://www.searchengines.ru/forum/showthread.php?s=&threadid=679
Алексей ПОЛЯКОВ
Для робота, запрашивающего страницы с вашего сайта, не важно, сделаны ли они с помощью PHP или как-то еще - он получает html-код в любом случае. Адреса страниц могут иметь значения, поэтому лучше эмулировать такие адреса, как у простых сайтов.
Светлана КУЧИНСКАЯ
Фреймы, это, скорее, способ экранного отображения, а серверные скрипты или статические файлы, это способы хранения и выдачи контента. Индексирование сайта прямо не зависит от его движка. Раньше (а у некоторых поисковиков и сейчас) имел значение вид URL (наличие в нем строки запроса вида "?x="). Но в любом случае, если это существенно, вид URL можно преобразовать средствами сервера, например mod_rewrite, избавившись от строки запроса.
Главные преимущество серверных скриптов, это возможность построения интерактивных сайтов, хранения больших объемов данных в базах, и возможность построения различных управляющих интерфейсов, позволяющих обновлять сайт без участия вебмастера и без знания html. Еще, если файлу .html дать расширение .php его отображение не изменится (к вопросу о "смешении стилей").
Главным критерием в выборе php - html (динамики - статики) должна быть частота и легкость предполагаемого обновления содержания сайта. Кроме того, при большом числе страниц с одинаковыми элементами дизайна, использование скриптовой конструкции позволит менять их на всем сайте, изменив 1-2 файла. При использовании же статического html, менять придется все файлы.
Суммируются ли индексы цитирования при склейке страниц-дубликатов в Яндексе, или у страницы остается тот индекс, который был у выбранного зеркала?
Сергей ПЕТРЕНКО
Да, суммируются. Яндекс прямо об этом говорит на http://www.yandex.ru/info/ci.html "Индексы цитирования так называемых зеркал (алиасов) объединяются, то есть веса всех неповторяющихся ссылок на зеркальные адреса суммируются для вычисления тИЦ главного адреса. Главный адрес определяется автоматически и не может быть изменен." Стоит обратить внимание, что в итоговом тИЦ не будут учтены повторяющиеся ссылки.
Алексей ПОЛЯКОВ
Различают два вида склейки, осуществляемой Яндексом: склейка доменов (зеркал) и склейка страниц (дублей). При склейке доменов тИЦ вычисляется с учетом всех ссылок на все домены, признанные зеркалами, и итоговый тИЦ присваивается зеркалу, выбранному главным. Все страницы считаются страницами на главном зеркале, их ВИЦ вычисляется с учетом ссылок извне на страницы каждого из зеркал.
При склейке дублей (одинаковых страниц на одном сайте) ВИЦ дубля, выбранного в качестве главного, вычисляется, похоже, только с учетом ссылок именно на этот дубль. Это ошибка Яндекса, которую они почему-то не хотят исправлять. При неправильном выборе основного дубля это приводит к сильным потерям позиций (кстати, при неправильном выборе зеркала проблемы тоже бывают). Поэтому ситуацию с зеркалами и дублями нельзя выпускать из под контроля.
Герман ОСТАШЕВСКИЙ
Если речь идёт о взвешенном индексе цитирования (ВИЦ) , то для страниц сайтов-зеркал он суммируется. В случае, когда страницы признаны нечеткими дубликатами, суммирования не происходит и учитываются только ссылки на страницу, оставшуюся в поисковой базе.
Светлана КУЧИНСКАЯ
Если вопрос касался тИЦ (тематического индекса цитирования), то он рассчитывается не для страницы, а для ресурса. Индексы цитирования зеркал (алиасов) объединяются, то есть веса всех неповторяющихся ссылок на зеркальные адреса суммируются для вычисления тИЦ главного адреса. Подробнее читайте: http://www.yandex.ru/info/ci.html
Уточнение: не следует забывать, что в случае захвата брошенного домена, его индекс может быть обнулен.
Яндекс иногда выводит сообщения "Найден по ссылки"? Что это означает? Я проверял ссылки на данный сайт и ссылок с данным запросом там просто нет.
Алексей ПОЛЯКОВ
Это значит, что сайт найден по ссылке. :) Яндекс не позволяет найти ссылки на страницу с заданным словом (эта функция в нем работает некорректно, еще одна ошибка, которую они не хотят исправлять). Также при обычных способах поиска ссылок вы могли не найти внутреннюю ссылку, либо это вовсе не ссылка, а описание/заголовок из каталога так сработали.
Светлана КУЧИНСКАЯ
Это значит, что ссылка с таким запросом есть в базе Яндекса, хотя страница сайта, на которой была ссылка, уже могла измениться, но еще не была переиндексирована, или данные новой индексации еще не попали в базу.
Герман ОСТАШЕВСКИЙ
Это означает, что документ был найден благодаря ссылочному ранжированию, то есть ссылкам на страницу, в тексте которых присутствуют слова запроса. При этом на самой странице слов запроса не обнаружено, или же вообще эта страница пока присутствует в поисковой базе.
Посмотреть все ссылки на страницу, содержащие данное ключевое слово, в Яндексе можно с помощью оператора
a#link="url страницы"["ключевое слово"]
Отсутствие слов запроса в тексте ссылок на страницу, найденную по ссылке, может означать, что ссылки на этих страницах были убраны или видоизменились с момента последней переиндексации.