CTR - Click Through Ratio - отношение числа кликов по ссылке или кликов по баннеру к числу показов ссылки или баннера посетителям (дробь с числителем, равным числу кликов, и знаменателем, равным числу показов). CTR измеряется в процентах. На практике CTR честного баннера порядка 0,1-1%, в выдаче поисковых результатов CTR может достигать десятков процентов и обычно тем выше, чем выше ссылка на странице поиска: Зависимость количества переходов от позиции в результатах поиска.
Host
1-е значение - хост, он же ip
2-е значение - директива Host - нестандартное расширение (от Яндекса) стандарта robots.txt. Для того, чтобы индексировалось выбранное вами зеркало сайта, достаточно запретить индексацию всех остальных зеркал при помощи файла robots.txt. Это можно сделать, используя нестандартное расширение стандарта robots.txt — директиву Host, в качестве ее параметра указав имя основного зеркала. Если wwwsite.su - основное зеркало, то robots.txt должен выглядеть примерно так:
Код:
User-Agent: *
Disallow: /forum
Disallow: /cgi-bin
Host: wwwsite.su
В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву Host необходимо добавлять в группе, начинающейся с записи User-Agent, непосредственно после записей Disallow.
Аргументом директивы Host является доменное имя с номером порта (80 по умолчанию), отделенным двоеточием. Если какой-либо сайт не указан в качестве аргумента для Host, для него подразумевается наличие директивы Disallow: /, т.е. полный запрет индексации (при наличии в группе хотя бы одной корректной директивы Host).
nofollow - Google использует атрибут rel="nofollow" у ссылки. Такие ссылки не учитываются при расчете "авторитета" сайта для поисковых результатов. Страница на которой будут такие ссылки не получит штрафа "negative vote". Например, ссылку в блоге или в форуме
Код:
Посетите форум по интернет-рекламе.
Можно будет автоматически сделать такой:
Посетите форум по интернет-рекламе
Подробнее здесь: Google применил атрибут nofollow у ссылки для борьбы с поисковым спамом.
Если есть желание закрыть ссылку ещё и от Рамблера и Яндекса, то надо писать:
Код:
Посетите форум по интернет-рекламе
noindex - теги . Мета тег Robots и файл robots.txt могут запретить индексацию поисковыми системами только целых страниц. Как запретить поисковым системам индексацию определенных частей текста? Чтобы запретить поисковым системам индексирование определенных фрагментов текста в документе, пометьте их тегами
текст запрещенный к индексации.
Замечу, что теги понимают только наши поисковики Яндекс и Рамблер, а остальные, например Google - не понимают. Это можно использовать, если вы хотите закрыть текст (например в сучае если он на английском языке) от Яндекса и Рамблера, но показать этот текст Google.
PageRank (Page Rank, PR, ПР) -
1-е значение - PageRank - авторитет сайта для поисковой системы Google. PageRank придумали Larry Page (по имени которого PageRank и получил своё название) и Sergey Brin в Стэндфордском университете. Увидеть приведенное (нормированное на единицу) значение PageRank можно используя Google ToolBar (панель инструментов браузера), там он показывается в виде зеленой полоски. Также существует много сервисов определения PageRank без тулбара, но они не всегда точны.
Примеры:
wwwbe1.ru/stat/
wwwtop25web.com/pagerank.php
wwwpagerank.net/pagerank-checker/
На PR конкретной страницы, который зависит от весов и количества ссылающихся страниц количество и наличие исходящих ссылок не влияет.
PR (Google PageRank) вообще - вероятность нахождения посетителя на странице. При этом имеется ввиду классическое понимание нормирования PR, а не та мера авторитета сайта, которая показывается в Гугл баре. Эта вероятность тем больше, чем больше ссылок на эту страницу (безразлично - внутренних или внешних), и, чем больше, в свою очередь, вероятность нахождения посетителей на ссылающихся страницах (PR ссылающихся страниц). Естественно, что вероятность попадания посетителя на данную страницу (PR страницы) никак не связана с вероятностью уйти с неё (количеством ссылок), а тем более с качеством (PR) страниц на которые ведет ссылка.
А вот вес, передаваемый по ссылке, как раз обратно пропорционален количеству ссылок на данной странице.
2-е значение - PageRank - Технология расчета релевантности страниц для поисковой системы Google.
robots.txt - файл robots.txt запрещает индексацию поисковыми системами отдельных частей сайта (страниц) или даже всего сайта. Описание robots txt - стандарт для роботов поисковых систем, Файл robots.txt - Советы от Яндекса.
Бан (Ban), глаголы соответственно банить, забанить, отправить в бан
Происходит от английского:
ban
1. 1) запрещение - under a ban 2) церковное проклятие, анафема 3) приговор об изгнании; объявление вне закона
2. 1) налагать запрет; запрещать 2) проклинать, налагать проклятие.
Соответственно: администратор поисковой системы может наложить проклятье - "забанить сайт", например, запретить индексацию сайты в поисковике за спамдексинг (спам индекса поисковой машины).
Администратор форума может закрыть доступ (отправить в бан) нарушителя правил форума.
Вес ссылки, Что такое "толстая ссылка"?
Толстая ссылка (сильная ссылка) - ссылка со страницы с большим весом (авторитетом). Авторитет этой ссылающейся страницы, в свою очередь, тем выше, чем больше количество и чем сильнее ссылки уже на эту страницу.
Авторитет страницы для каждого поисковика определяется по-разному, например для Google это PR страницы (виден как зеленая полоска в Google баре). Для Яндекса - авторитет страницы не показывается в настоящее время (возможно чтобы им не торговали).
С другой стороны: вес ссылки тем меньше, чем больше других ссылок на данной странице (и внешних и внутренних). При стандартном вычислении "исходящего авторитета" авторитет страницы как бы делится поровну между всеми ссылками на этой странице. При нестандартном - возможно не поровну.
Иногда под весом ссылки понимают не чистый вес (описанный выше), а вес с учетом различных коэффициентов, например тематики.
вИЦ Яндекса для отдельной страницы - взвешенный индекс цитирования Яндекса, который как раз и используется в расчете релевантности поиска в интернете в отличие от "тИЦ Яндекса для сайта", который и показывается на кнопке Яндекса и в Яндекс каталоге, но при расчете не используется. О величине вИЦ Яндекса для страницы ничего нельзя сказать - она сейчас нигде не показывается.
Дорвей (дорвеи), doorway (doorways), входная страница, страница-ловушка, дурьвэй - страница в интернете, основной смысл которой отлавливать посетителей поисковых систем. Такой траффик (или трафик - кому как нравится) обычно переправляется на головной сайт заказчика или владельца дорвея путем редиректа или посетителя просят самостоятельно нажать на ссылку перехода на целевой сайт.
Зеркало сайта - копия сайта по другому адресу: веб-сайт виден во внешнем мире под разными именами (зеркала, разные виртуальные хосты). Как выбрать главный виртуальный хост из нескольких зеркал сайта для поисковой системы Яндекс
Индексация в поисковой системе - добавление страницы в индекс поисковой машины. Обычно происходит в два этапа:
1) постановка в очередь для индексации - происходит либо при самостоятельном добавлении страницы (ссылки для добавления приведены в FAQ по раскрутке сайта)
2) Приход поискового робота, скачивание им страницы и помещение страницы в индекс поисковой системы. Процесс индексации следует отличать от процесса ранжирования. То есть страница может уже находиться в индексе поисковика, но по нужному запросу ранжироваться плохо.
Контекстная реклама - контекстная реклама позволяет разместить рекламу на странице, которая наиболее подходит к содержанию рекламного объявления.
Частным видом контекстной рекламы, является поисковая реклама - реклама, которая показывается по ключевым словам на результатах поиска поисковой системы. Такая реклама на взгляд автора более эффективна, чем обычная контекстная реклама.
Системы контекстной рекламы приведены в статье Раскрутка сайта - FAQ. Лучший вариант, по мнению автора: Яндекс.Директ -это текстовая реклама, которая показывается по ключевым словам на поиске Яндекса. На втором месте в списке предпочтений - Бегун.
Клоакинг - технология, в результате которой человеку выдается одна страница, а роботу поисковика - другая. Клоакинг реализуется при помощи файла ".htaccess". Поисковые роботы при этом отслеживаются, как правило, по IP или по user-agent (в первом случае поисковый робот может придти и с нового IP, а во втором случае роботы поисковиков могут и соврать). Обычно, клоакинг используется для выдачи поисковикам релевантных некоторым запросам страниц, которые настолько переоптимизированы, что их просто стыдно показывать живым посетителям (а живым конкурентам - просто опасно, они непременно настучат в саппорт поисковой системы). Модераторы поисковиков (люди) при обнаружении клоакинга (в том числе по стуку конкурентов) обычно отправляют такие страницы (или даже целые сайты) в бан (все в сад).
Кэш поисковика, снимок страницы из кэша - записанная во время индексации версия интернет-страницы (иногда с форматированием как в Google, а иногда только текст, как в Яндексе). Поскольку страница могла измениться после индексации, то текст в кэше иногда отличается от текста на реальной странице.
Мета теги для поисковиков - Мета теги (meta теги, meta тэги, meta таги) используются для описания свойств HTML документа и должны находится внутри тега HEAD.
Для поисковиков имеют значение три мета тега:
1. Мета тег Description - служит для описания страницы,
Пример:
Поисковики иногда (то есть не обязательно по умолчанию) выводят этот тег (или его часть) в результатах поиска. При ранжировании тег не используется. Если кому-то известно иное, то напишите здесь: Словарь терминов SEO.
2. Мета тег Keywords
Пример
Учет мета тега Keywords для ранжирования рассмотрен в статье:
meta теги Keywords - учет meta keywords поисковыми системами Рамблер, Яндекс, Апорт, Гугл, Майл.ру.
3. Мета тег Robots - содержит указания для роботов поисковвиков.
Значение свойства Robots может состоять из следующих директив, разделенных запятыми:
Index - страница должна быть индексирована.
Noindex - страница не должна индексироваться.
Follow - роботу можно следовать по ссылкам на странице.
Nofollow - роботу нельзя следовать по ссылкам на странице.
All - = index, follow (принято по умолчанию).
None - = noindex, nofollow.
Тег ничего не меняет в работе поискового робота, так как значение "all" принято по умолчанию.
Но если эта страница создается динамически или очень часто обновляется, то нет смысла ее индексировать, так как информация о странице в поисковой машине и ее истинное содержание будут разными. В этом случае можно рекомендовать поисковой машине не индексировать эту страницу, а только отслеживать на ней гиперссылки, что бы проиндексировать остальную часть сайта .
При использовании тега, запрещающего отслеживание гиперссылок часть сайта может остаться не проиндексированной, так как внутри сайта роботы перемещаются по гиперсылкам. И те страницы, переход на которые рорботу запрещен, не будут индексированы.
Мета тег Robots имеет приоритет над файлом robots.txt.
Иногда в составе мета-тегов до кучи называют и тег - тег заголовка страницы.
Часто возникает вопрос: нужны ли запятые или пробелы в мета-тегах. Автор обычно пишет запятые между словами и ставит после них пробел (как советует Яндекс), хотя возможно это и необязательно: либо пробелы после запятых можно не ставить, либо вместо запятых можно ставить просто пробелы. Точного ответа на вопрос автору неизвестно.
Непотизм, непот-спам, непотистский спам - вот, как определяет термин "непотизм" Большая советская энциклопедия:
Непотизм (от латинского слова nepos, родительный падеж nepotis - внук, племянник), раздача римскими папами ради укрепления собственной власти доходных должностей, высших церковных званий, земель своим родственникам (прежде всего сыновьям). Непотизм был особенно широко распространён в 15-16 веках; привёл к возвышению из папской родни могущественных фамилий (Боргезе, Лудовизи, Борджа (Борджиа) и других). Термин "Непотизм" стал нарицательным, употребляется как синоним "кумовства".
Насколько известно автору, термин Непотизм в применении к поисковым системам впервые стал использовать Илья Сегалович (главный по поиску в Яндексе). Яндекс, например, называет непот-спамом размещение ссылок, предназначенных лишь для "накачивания" релевантности в поисковой системе, в том числе участие в программах обмена ссылками с указанной целью.
Таким образом, Непот-спам - это "кумовство" вебмастеров. Непотизм является прямым следствием учета поисковиками "ссылочного ранжирования", основанного на технологии PageRank.
Непот-фильтр - фильтр, по слухам, налагаемый на сайт. Фильтрация заключается в прекращении учета ссылок с этого сайта для целей ранжирования в поисковых системах. При этом сайт обычно индексируется как обычно и на первый (да и на второй тоже) взгляд непот-фильтр незаметен. Вопрос о том, показываются ли ссылки с сайта под непот-фильтром в результатах поиска ссылок на другой сайт, требует дополнительного изучения. Автор, считает, что, например для Яндекса, такие ссылки показываются.
Оптимизация сайта - комплекс мероприятий, цель которых, улучшение индексации и ранжирования сайта в поисковых системах. Различают Белую оптимизацию сайта и черную оптимизацию сайта. Между ними - серая оптимизация с серыми же методами. Белая оптимизация - это та, что не черная и не серая. Точного определения черной оптимизации не существует. Примерно можно сказать, что она включает Поисковый спам. Более подробно, в статье Германа Осташевского Оптимизация - осторожно, передозировка! .
Переиндексация страницы - повторная индексация веб-страницы. При переиндексации меняется содержание кэша страницы в поисковой системе.
Пессимизация сайта - комплекс мероприятий поисковой системы по понижению позиций сайта при ранжировании. Пессимизация сайта подтверждается только в Рамблере: поисковая пессимизация в Рамблере.
Влад Шабанов 22 Дек 2003
Цитата:
Да, у нас есть специальный "пессимизатор", который автоматически выявляет участки сайта и гиперссылки, которые не стоит учитывать при ранжировании. Узнать, какая часть текста и ссылок проигнорирована - нельзя. Понижение автоматически включается как только робот распознает "накрутки". Так же автоматически - и выключается, как только все накрутки будут полностью ликвидированы.
Про остальные поисковики:
представители, как правило отрицают автоматическую частичную пессимизацию. То есть если сайт "нарушает лицензию" поисковой системы и это обнаружено человеком (работником поисковой системы), то сайт вообще удаляют из индекса поисковой системы.
Поисковые роботы - программы, входящие в состав программного обеспечения поисковой машины. Поисковые роботы занимаются индексацией страниц - скачивают страницы и заносят в индекс. Интеллектуальный поисковый робот может определить, изменялась ли страница с прошлого посещения и стоит ли тратить время и компьютерные ресурсы на повторную индексацию страницы.
У Яндекса, например, есть несколько роботов, которые представляются по-разному.
Yandex/1.01.001 (compatible; Win16; I) — основной индексирующий робот
Yandex/1.01.001 (compatible; Win16; P) — индексатор картинок
Yandex/1.01.001 (compatible; Win16; H) — робот, определяющий зеркала сайтов
Yandex/1.03.003 (compatible; Win16; D) — робот, обращающийся к странице при добавлении ее через форму «Добавить URL»
Yandex/1.03.000 (compatible; Win16; M) — робот, обращающийся при открытии страницы по ссылке «Найденные слова»
IP-адресов, с которых «ходит» робот Яндекса, много, и они могут меняться. Список адресов IP роботов Яндекса - военная тайна.
По прямым ссылкам наверняка "передается" авторитет для ссылочного ранжирования. "Кривые" ссылки - те, что не прямые, например ссылки с использованием Javascript. При нажатии на "кривую" ссылку посетитель также попадает на целевую страницу, но поисковики относятся к таким ссылкам по-разному и, как правило, не учитывают при ранжировании. Есть сведения, что Google учитывает такие ссылки, если и не для ранжирования, то для индексации: Google и "кривые" ссылки. Думаю, что "кривые" ссылки, в которых содержится адрес сайта стоит называть "полукривыми", в отличие от "истинно кривых" ссылок, в которых такого адреса нет, а есть, например, id.
Ранжирование в поисковой системе - определение места в результатах поисковой выдачи для страницы. По умолчанию, ранжирование происходит по релевантности (соответствию страницы запросу в поисковой системе). По выбору посетителя могут быть и другие принципы ранжирования, например, по дате документа или по алфавиту.
Редирект - перенаправление посетителя на другую страницу
Релевантность - соответствие веб-страницы поисковому запросу. Поисковики по умолчанию сортируют страницы в поиске по убыванию релевантности (могут ещё, например, и по дате создания страницы). Формула расчета релевантности - страшная тайна поисковиков. Если узнать эту формулу, то можно жить не только в Сочи, но и южнее и даже западнее. Алгоритм расчета формулы релевантности для Яндекса можно найти на форуме http://www.ebanners.ru/ . Факторы влияющие на расчет релевантности для различных поисковиков рассмотрены в статье: ЯГА и Рамблер: почему Яндекс, Гугл, Апорт ищут иначе чем Рамблер.
СЕРП (SERP), поисковая выдача - Search Engine Results Page, страница выдачи результатов, поисковой машины. Фраза "Появиться в серпе" означает, что сайт появился на странице выдачи (обычно имеется в виду несколько первых страниц, хотя это и необязательно).
Системы обмена ссылками, линкаторы - Система обмена ссылками - это как правило, это система сайтов, позволяющая автоматически ставить чужие ссылки на своем сайте (и, соответственно, размещать свои ссылки на чужих сайтах). Одна из первых систем такого рода (или, возможно, первая русская система обмена ссылками) "Линкатор" и дала второе название таким системам в России.
Сквозная ссылка (Сквозняк) - ссылка, которая находится на всех страницах сайта.
Словоформы - различные формы одного слова, Поисковики иногда ведут поиск по словоформам как по слову в нормальной форме (именительный падеж единственного числа для существительных и неопределенная форма для глаголов). Существительные и глаголы - это разные слова, а не словоформы.
Как русские поисковики интернета воспринимают словоформы и морфологию языка.
Сниппет - часть текста страницы, как правило, содержащая слова поискового запроса, которую поисковик выводит в результатах поиска по этому запросу. Часто, оценив сниппет, можно приблизительно понять, соответствует ли страница именно вашему запросу, даже не открывая самой этой страницы.
Спамдексинг, поисковый спам - спам индекса поисковой машины, например, путем клоакинга или создания дорвеев. Поисковики обычно не сообщают исчерпывающий список методов спама, которые могут вызвать удаление сайта из индекса. Тем не менее, вот некоторые из них для поисковой системы Яндекс: использование на странице элементов, вводящих в заблуждение поисковую систему (текст, ссылки и др.); создание и размещение обманных "входных" страниц, перенаправляющих посетителей тем или иным способом на целевую страницу; специальное программирование веб-сайта с целью выдачи роботу Яндекса содержимого, отличного от того, которое выдается обычным пользователям; размещение ссылок, предназначенных лишь для "накачивания" релевантности в поисковой системе, в т.ч. участие в программах их обмена с указанной целью.
Титул, титл, title - тег <title> - тег заголовка страницы, а также сам текст в этом теге.
тИЦ - мера авторитета сайта для каталога Яндекса. тИЦ Яндекса (тематический индекс цитирования, Яндекс цитирования, CY) определяет "авторитетность" интернет-ресурсов с учетом качественной характеристики ссылок на них с других сайтов. Эту качественную характеристику Яндекс называет "весом" ссылки. Рассчитывается она по специально разработанному алгоритму. Большую роль играет тематическая близость ресурса и ссылающихся на него сайтов. Само по себе количество ссылок на ресурс также влияет на значение его тИЦ, но тИЦ определяется не количеством ссылок, а суммой их весов.
тИЦ как средство определения авторитетности ресурсов призван обеспечить релевантность расположения ресурсов в рубриках каталога Яндекса. тИЦ не является чисто количественной характеристикой, поэтому Яндекс показывает некоторые округленные значения, которые помогают ориентироваться в "значимости" ("авторитетности") ресурсов в каждой области (теме).
Что такое интернет-ресурс
тИЦ рассчитывается для интернет-ресурсов. Под интернет-ресурсом может пониматься как сайт (хост), так и некоторый раздел сайта (физически это директория). Раздел сайта (директория) считается самостоятельным ресурсом, если она описана в каталоге Яндекса. Если для сайта в каталоге описаны несколько директорий, тИЦ будет обсчитываться для каждой из них, в противном случае весь сайт будет считаться одним интернет-ресурсом.
тИЦ Яндекса, по мнению автора, не влияет непосредственно на расчет релевантности страницы запросу. Во-первых, тИЦ - показатель для всего сайта, а не для отдельной страницы, поэтому авторитет пятой по ссылке страницы от главной страницы сайта может оказаться совсем небольшим. Во-вторых, при расчете релевантности в Яндексе используется "вИЦ", который соотносится с тИЦ, как двоюродные братья - у них общий предок: число ссылающихся страниц.
Топ, рейтинг, пузомерка - любой рейтинг, в частности рейтинг сайтов, например рейтинг посещаемости сайтов - топ 100 Рамблера или рейтинг релевантности сайтов запросу в поисковой системе того же Рамблера. Кроме приятной гордости обычно приносит и деньги, особенно интернет-магазинам. Кто выше - у того и купят (просто потому, что людям лень просмотреть все сайты в рейтинге).
Траффик (трафик) сайта - поток посетителей сайта.