Главная » 2013 » Октябрь » 16 » мета теги
09:06
мета теги
Мета-теги html-документов и файл "robots.txt"

Мета-теги - информационные и управляющие команды в html-документах

META-теги — это необязательные атрибуты страницы, которые могут содержать ее описание, ключевые слова к ней, информацию об авторе, управляющие команды для броузера и поисковых роботов, и прочую служебную информацию, не предназначенную для вывода на экраны браузеров. Многие из поисковых систем используют META-теги для качественной индексации сайтов.

Команды META вносятся в "шапку" документа - внутри блока ... .

Выглядят META-теги следующим образом:
так просто


Код
<meta name="атрибут" content="набор слов">

- Поле name определяет, за что данный тег отвечает. Длина поля content по стандарту ограничена 1024 знаками, включая пробелы и знаки препинания. Но в поисковых системах разных типов могут быть свои ограничения на длину воспринимаемых мета-тегов.

Дополнительно информационные теги перед атрибутом content могут содержать атрибут Lang="ru" - язык, на котором написано значение свойства content, если он не английский.

Мета теги делятся на две группы: NAME и HTTP-EQUIV. Мета теги NAME содержат информацию о документе, его авторе и рекомендации для поисковых машин. Мета теги HTTP-EQUIV определяют режим его обработки. В интернете можно найти много генераторов мета-тегов как в форме htm-документов (перенос сгенерированных тегов в htm-файлы документов вручную), так и специальных программ, позволяющих записывать мета-теги непосредственно в htm-файлы.
Описание мета тегов группы NAME.

Код
<meta name="title" content="заголовок web-страницы">

- Используется поисковым сервером для индексирования. Длина содержимого, как правило, не должна превышать 60-100 символов. Делайте заголовок кратким и точно соответствующим содержанию страницы.

Код
<meta name="author" content="автор">

Код
<meta name="copyright" content="права автора">

- Необязательные тэги, используются для указания имени автора (поисковые системы могут найти нужный сайт по имени автора) и описание авторских прав на документ. Формат записи произвольный, можете вписать своё имя, название вашей организации, ваш e-mail, адрес вашей симпатии или номер ее телефона. Может использоваться для поиска в интернете копии ваших страниц.
Код
<meta name="subject" content="тема страницы, в двух-трех словах">

- Тег необязательный, но важен для регистрации сайта некоторыми поисковыми машинами.
Код
<meta name="description" content="краткое описание содержания страницы">

- Используется поисковым сервером для индексирования и в качестве краткой аннотации при ссылке в ответе на запрос . Длина содержимого тегов МЕТА "desctiptions", как правило, не должна превышать 200 символов (часть поисковиков индексирует только первые 200 символов). Делайте описание точным и не пишите его прописными буквами — умные поисковые машины считают это спамом и и уменьшают рейтинг в результатах поиска. Тег очень полезен, когда в документе мало текста или в начале документа используются скрипты. Если тег отсутствует, то в качестве описания поисковые машины используют первую строку текста или отрывок из текста с найденным ключевым словом.

Код
<meta name="abstract" content="аннотация содержания страницы">

- Необязательный тег, используется некоторыми поисковиками для индексирования. Длина содержания не должна превышать 1000 символов.

Код
<meta name="keywords" content="ключевые слова, через запятую">

- Список терминов, ключевых слов и устойчивых фраз, что должно быть главным при индексировании сайта поисковой машиной. Длина содержимого тегов МЕТА "keywords" не должна превышать 1000 символов. По словам, которые вы пропишете здесь, и должна находиться ваша страница в результатах выдачи поисковых систем. Однако многие поисковики (в их числе - Яndex, Rambler и Google) ориентированы на содержимое страницы и другие факторы, а не на ключевые слова. Но пренебрегать этим тегом не следует, и машины могут менять свои привычки.
Мета тег Keywords используется поисковыми машинами для оценки релевантности. При формировании списка ключевых слов необходимо использовать слова, содержащиеся в тексте документа. Ключевые слова не должны повторятся (в крайнем случае, не более двух раз). Имеет смысл использовать не более 10 слов, большее количество релевантности не увеличит. В большинстве случаев поисковые машины находят ключевые слова, стоящие во множественном числе, даже если поиск задан в единственном числе. Поэтому рекомендуется существительные во множественном числе. Не рекомендуется разбивать содержание на несколько строк.

Код
<meta name="document-state" content="одно из двух значений">

- Static - нет необходимости индексировать эту страницу в будущем (содержание страницы меняться не будет), Dynamic - регулярно индексировать страницу. Тег применяется, в основном, с первым значением, для применения второго необходимости нет - индексация проводится регулярно по умолчанию.
Код
<meta name="generator" content="название программы">

- Тег был придуман разработчиками html-редакторов для рекламы собственных программных продуктов. В качестве название программы вы можете написать Notepad. Тогда пользователи, увидевшие html код вашей странички, будут считать вас крутым web-дизайнером, посчитав, что вы готовили свой сайт вручную, при помощи блокнота. Можете регулярно выбрасывать его, если он упорно генерируется Вашим html-редактором. Все развлечение, и память тренирует.
Код
<meta name="resource-type" content="document (рекомендуется)">

- Не обязательный тег, указывает на тип вашего ресурса (Build, Classification, Creation и др.). Многие машины индексируют только документы.

Код
<meta name="revisit-after" content="7 days">

- Команда поисковой системе посещать данную страницу сайта, как прописано (в днях, неделях или месяцах, в данном случае каждые 7 дней). На деле — каждый поисковый робот заходит на сайт с частотой, которую сам посчитает нужной и возможной. Эта частота зависит от показателя цитируемости документа, чем он выше — тем чаще будет приходить поисковый робот.

Код
<meta name="URL" content="http://www.leninakan.com/">

- служит для исключения из индексации генерируемых страниц и зеркал. Встретив этот тег, робот поисковой машины должен прекратить индексацию текущего документа и перейти по указанной ссылке.

Код
<meta name="robots" content="index, follow">

- Этот тег отвечает за управление поисковыми роботами при индексировании документа. Он может иметь следующие значения в поле содержания:
noindex - запрещает индексирование документа;
nofollow - запрещает проход по ссылкам, имеющимся в документе;
index - разрешает индексирование документа;
follow - разрешает проход по ссылкам, имеющимся в документе.
all - разрешает как индексирование документа, так и проход по ссылкам (равносильно index, follow)
none - запрещает индексирование и проход по ссылкам (равносильно noindex,nofollow)

Если META name="robots" в документе не указан, то по умолчанию - content="all". Мета тег Robots имеет приоритет над директивами управления, заданными в файле robots.txt, если таковой имеется.

и - Во многих случаях HTML-документы содержат как ссылки на чужие ресурсы, так и ссылки на свои. Переход роботов на свои ресурсы, обычно, желателен, а на чужие нет. META name="robots" в таких ситуациях не пригоден, поскольку управляет переходом по всем ссылкам файла. Теги и , вставляемые вовнутрь документа, запрещают индексацию части документа, заключенной между ними. Это способ управления роботами, поддерживаемый не всем поисковыми системами. Рамблер и Яндекс учитывают их.

Описание мета тегов группы HTTP-EQUIV.
Код
<meta http-equiv="Content-language" content="ru">

- Указание языка документа. Используется поисковыми машинами при индексировании. Хотя большинство из них умеют различать язык по тексту..
Используется для указания браузеру автоматически переключался на новый адрес. Данная конструкция через 5 секунд начнет перезагрузку окна браузера по адресу http://antina.3dn.ru/. Обычно тег используется на страницах, которые вставляются вместо титульных при переезде сайта на другой адрес. Если этот МЕТА-тег записать в таком виде то текущая страница будет обновляться через N секунд
Код
<meta http-equiv="Cache-Control" content="параметр">

- Определяет действия кэша по отношению к данному документу. Значения параметров: Public - документ кэшируется в доступных для всех кэшах, Private - только в частном кэше, no-cache - не может быть кэширован, no-store - может быть кэширован, но не сохраняется.
Этот тег контролирует занесение страниц в кэш-память компьютера. Страницы с этим тегом не будут кэшироваться броузерами. Однако современные версии интернет-броузеров сами умеют распознавать, обновилась страница или нет, и обновлять ее без дополнительных инструкций.

Код
<meta http-equiv="content-type" content="text/html; charset=windows-1251">

- Используется для того, чтобы браузер мог правильно отобразить содержимое страницы, и для определения поисковой машиной языка, на котором написана страница. В данном случае это стандартная кодировка Windows. В принципе, определять кодировку должен либо сервер, либо браузер, но прямое указание не помешает.

Код
<meta http-equiv="Content-Script-Type" content="text/javascript">

- Определение языка программирования сценариев. Некоторые из возможных значений: JavaScript (по умолчанию), PerlScript, VBScript. Если тег Content-Script-Type не используется, то тип языка программирования сценариев, отличный от принятого по умолчанию, должен быть указан непосредственно в каждом теге
Код
<badscript>.


Код
<meta http-equiv="Content-Style-Type" content="text/css">

- Указавает язык таблицы стилей, значение "text/css" принимается по умолчанию. Если оно вас устраивает и вы не используете в этом документе теги
Код
<style> и <Span>,
то использовать этот тег необязательно .

Код
<meta http-equiv="reply-to" content="ваш адрес электронной почты">
- Указывается в файлах отчета некоторых поисковых машин.

Код
<meta http-equiv="Expiries" content="Mon, 02 Sep 2003 05:14:53 GMT">

- Тег определяющий дату «устаревания» страницы для протоколов HTTP. Если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Часто в данной директиве указывают устаревшую дату, что позволяет избежать кэширования документа и при каждом запросе он читается заново.

Код
<meta http-equiv="Window-target" content="_top">
- Определяет окно текущей страницы. Приведенный пример может быть использован для прекращения появления новых окон броузера при применении фреймовых структур. Действует для многих (но не для всех) броузеров.

Спецификация файла "robots.txt"

При индексации страницы робот закачивает ее, индексирует, анализирует ссылки и закачивает указанные в них страницы. И так многократно. При обнаружении ссылок на страницы другого сайта, робот начинает закачивать страницы и оттуда, а там новые ссылки на следующие сайты. При этом существует вероятность полного переключения робота на другие сайты, а Ваши страницы останутся недоиндексированными (не навсегда, но, возможно, надолго). Вот тут-то определенная директива, запрещающая индексацию страниц со ссылками на другие сайты, была бы кстати. Такие директивы закладываются в файл robots.txt.
Файл robots.txt должен находиться в корневом каталоге и определять, какие файлы и каталоги не индексируются. Например, если сайт называется antinavteme.narod.ru, то файл robots.txt должен иметь адрес http://antina.3dn.ru/robots.txt. Файлы robots.txt во внутренних каталогах сайта поисковыми машинами игнорируются. Наименование файла robots.txt должно состоять из букв нижнего регистра.
Поисковые машины поддерживают всего три директивы файла robots.txt:

# - означает начало комментария. Cтрока, следующая за этим знаком, игнорируется.
User-agent:Кодовое название робота - указывает робота, которому адресован приведенный в следующих за строкой User-agent блок инструкций. Например, робот поисковой системы Рамблер называется StackRambler. В одной директиве User-agent можно указать только одного робота. Для указания нескольких роботов применяется несколько директив User-agent. Допускается указание имени всех роботов: знак * в виде User-agent:*.
disallow:имя файла - указывает имя или часть имени не индексируемых файлов. Директива допускает не более одного параметра, для указания нескольких файлов, требуется употребление нескольких строк disallow. Директивы disallow должны идти в следующей строке после строки User-agent с именем робота. Пустая строка является окончанием блока параметров для одного робота и началом блока параметров для следующего, со своей строкой User-agen в начале блока. Дойдя до пустой строки в блоке со своим именем User-agent, робот прекращает чтение параметров и начинают индексацию файлов. Поэтому пустые строки внутри блока параметров также недопустимы. Если требуется задание различных параметров индексации различным роботам, перед началом блока параметров для каждого робота обязательно наличие пустой строки (завершение предыдущего блока). Имена некоторых роботов: Yandex, StackRambler, Aport, Googlebot, Lycos
Блок параметров для Рамблера, к примеру, должен выглядеть так:
>> user-agent: StackRambler
>> disallow: /alt
>> disallow: /mac
>> disallow: /koi
Этот блок запретит индексацию файлов, путь к которым начинается с alt, mac и koi. Параметр директивы disallow должен указывать относительный путь от корня сайта. Директива disallow не признает шаблонов типа *.htm, поэтому, чтобы не повторять строки многократно, рекомендуется собирать неиндексируемые файлы в один или несколько каталогов и запрещать индексацию этих каталогов.
Корневой каталог сайта обозначается обратным слешем (/). Если не требуется индексация всего сайта, достаточно указывать на корень: "disallow: /" .Директива disallow без слеша ничего не запрещает. Если не требуется индексация файлов, имя которых начинается с некоторой последовательности символов, в директиве disallow указывается обратный слеш и требуемая последовательность. Например:
>> disallow: /dir - Запретит индексацию файлов «/dir.html», «/dir/index.html», «/directory.html» и т.п.
Если требуется указать не начало имени файла или пути к нему, а имя целиком, это имя следует закончить обратным слешем. Например:
>> disallow: /dir/
>> disallow: /dir.html/
в разделе помощь, можете задать вопрос, помогу решить.
Категория: web master | Просмотров: 1422 | Добавил: antina | Теги: мета теги для ucoz | Рейтинг: 0.0/0
Всего комментариев: 0
avatar