<?xml version="1.0" encoding="windows-1251"?>
<rss version="2.0" xmlns="http://backend.userland.com/rss2" xmlns:yandex="http://news.yandex.ru">
<channel>
<title>Раскрутка сайта - Web-Stroy.Ru - Все для вебмастера: шрифты, шаблоны, скрипты, учебники</title>
<link>http://www.web-stroy.ru/</link>
<language>ru</language>
<description>Раскрутка сайта - Web-Stroy.Ru - Все для вебмастера: шрифты, шаблоны, скрипты, учебники</description>
<image>
<url>http://www.web-stroy.ru/yandexlogo.gif</url>
<title>Раскрутка сайта - Web-Stroy.Ru - Все для вебмастера: шрифты, шаблоны, скрипты, учебники</title>
<link>http://www.web-stroy.ru/</link>
</image>
<generator>DataLife Engine</generator><item>
<title>SAPE - биржа ссылок, статей или как грамотно заработать на своем сайте</title>
<link>http://www.web-stroy.ru/partners/837-sape.html</link>
<description>





&amp;nbsp;


 Сегодня рассмотрим биржу SAPE, как источник заработка для Вебмастера и минимальный доход с вашего любимого сайта составит&amp;nbsp; от 70 долларов и выше.
&amp;nbsp;
&amp;nbsp;
Допустим, &amp;nbsp;у вас есть сайт или много сайтов, ваши сайты интересны и посещаемы, но доход с них меньше чем вы тратите на хостинг и их обновление.
Вы уже столкнулись со следующими проблемами:

Вы столкнулись с проблемой размещения баннеров, цена в баннерообменных сетях за 1000 показов очень низкая
Слив трафа прибыльная ниша, но сайт должен быть популярным и тематичным
Clickunder и Pounder &amp;nbsp;- ждите санкций Яндекса

Один из самых безопасных (если подходить с головой) способов заработка это БИРЖИ ССЫЛОК, а именно самая популярная биржа в Рунете &amp;ndash;
SAPE.RU
&amp;nbsp;
Преимущества ссылочной биржи SAPE:

Ссылки размещаются в ручном или автоматическом режиме. 
Ваш заработок зависит от количества страниц, чем больше страниц, тем больше продаж
Вы получаете прибыль вне зависимости от количества посетителей вашего сайта
Вы развиваете сайт, у вас растут показатели [ТИЦ, PR] &amp;ndash; РОСТ ПРИБЫЛИ


</description>
<category>Партнерские программы, Раскрутка сайта, Yandex</category>
<author>napnik</author>
<pubDate>Wed, 24 Nov 2010 04:43:47 +0300</pubDate>
<yandex:full-text>Советы:

Не ставьте все ссылки в одном блоке &amp;nbsp;на странице 
Не размещайте более 4 ссылок на одной странице
Уберите внешние ссылки в &amp;lt;noindex&amp;gt;&amp;hellip;&amp;lt;/noindex&amp;gt;
Запретите размещение на страницах сайта ссылки Adult тематики
Попробуйте &amp;laquo;контекстные ссылки&amp;raquo;, они более естественные
Можете размещать статьи, прибыль разовая, но значительно выше, чем за ссылки

Часть прибыли вложите в покупку ссылок на свой сайт, за остальными советами по увеличению прибыли для рефералов &amp;nbsp;в асю 392393
&amp;nbsp;</yandex:full-text>
</item><item>
<title>301 редирект и домены с WWW и без WWW</title>
<link>http://www.web-stroy.ru/2007/10/07/301_redirekt_i_domeny_s_www_i_bez_www.html</link>
<description>Каждый сайт должен иметь 301 редирект (или что-нибудь подобное этому) настроенный так, чтобы сайт с или без www был главным. Почему? Сейчас расскажу!  Я видел много клиентов и сайтов, которые сталкиваются с этой проблемой. Они находятся обычно в фантастически ужасном состоянии из-за потери ранжирования и возможно именно поэтому не могут получить первые места в поисковой выдаче. Обычно я говорю им, что одна из причин, почему Google, Yahoo и другие поисковые системы могут понижать их в выдаче это возможное дублирование контента. Они стандартно отвечают: «Только не мой сайт! Нет, нет, нет! На моем сайте только оригинальный контент и фактически я сам пишу статьи для сайта». После объяснения, что сайт с www может быть признан как отдельный сайт, обычно из-за внешних ссылок с других сайтов, и, показывая им такие ссылки меня начинали слушать.  </description>
<category>Разное о поисковых системах</category>
<author>napnik</author>
<pubDate>Sun, 07 Oct 2007 21:02:40 +0400</pubDate>
<yandex:full-text>Конечно, все мы надеемся, что другие сайты поставят внешние ссылки на наш сайт без лишних вопросов, но когда они ставят ссылку как они это делают? Они могут использовать в ссылке www, а могут и нет. Большая часть сайтов, из тех, что я вижу, обычно ставит ссылки без www на Ваш главный домен и в результате проблема начинает закипать.С другой стороны я видел, как сайты живут без подобного редиректа из года в год. Так, когда это действительно проблема? Я думаю, что Ваш сайт должен иметь большой Page Rank как с www так и без него, чтобы это не вызвало проблем в поисковой системе.Конечно, всегда есть надежда. Как только код 301 редиректа написан, любая поисковая система начинает читать сайт его с указанного там домена. Но происходит это гораздо дольше, чем Вы переключаете домены.Для окружения веб-сервера Apach написать код редиректа очень легко, но для MS IIS есть свои хитрости.Конечно не только клиенты, но и очень много популярных сайтов не используют 301 редирект, но в последнее время ситуация стала меняться так как все больше специалистов SEO начинают понимать эту проблему.Когда Вы решаете поставить ссылку на другой сайт, потому что находите этот ресурс очень полезным, независимо от того, что… используйте всегда www пред доменом, так как это самый общий метод.Синтаксис редиректа .htaccessRewriteCond %{HTTP_HOST} ^www.site.net.uaRewriteRule ^(.*)$ http://site.net.ua/ [L,R=301] </yandex:full-text>
</item><item>
<title>Небольшая заметка по работе в системе Sape.</title>
<link>http://www.web-stroy.ru/2007/10/03/nebolshaja_zametka_po_rabote_v_sisteme_sape..html</link>
<description>Не буду писать описание интерфейсов, плюсы и минусы системы, можете почитать следующих авторов:



	
	http://www.tagirov.org/blog/27/
	
	http://seoplace.spb.ru/?p=199
	
	http://web-blog.ru/2007/03/07/webmaster-tricks/
	
	http://www.blog.votinfo.com/2007/03/2-dnya-v-sape-polet-normalnyiy/




Итак, продвигаем вместе с Sape.



	
	 
		
		1) Регистрация. Регистрируемся (если еще нет аккаунта жмем баннер внизу страницы) в системе Sape (ссылка реферальная, моих рефералов консультирую по работе в системе бесплатно. ).



	
	 
		
		2) Создаем проект. Создаем новый проект, добавляем урлы продвигаемых страниц. 
	
	
Небольшой оффтопик: современная реальность диктует золотой закон оптимизатора - 
	
	одна страница - один запрос. 
	
	
В частности, это связано с неоднозначным поведением нескольких запросов
на одной странице - кореллирующие запросы поднимают общую часть,
некореллирующие - выталкивают друг друга (речь идет о
высококонкурентных запросах). 
	
	
Поясню на примере - вы можете продвигать одну страницу по запросам 
	
	
- офисная мебель 
	
	
- недорогая офисная мебель 
	
	
- офисная мебель Москва 
	
	
- продажа офисной мебели 
	
	
- интернет магазин офисной мебели 
	
	
Но не сможете вывести одну страницу по запросам 
	
	
- офисная мебель 
	
	
- мягкая мебель 
	
	
Уточню, что данный принцип актуален для 
	
	всех поисковых систем.



	
	 
		
		3) Составляем анкоры.  Итак, у нас есть готовый проект с разбитым по страницам семантическим ядром - пора составлять тексты ссылок. 
	
	
Несколько тонкостей: 
	
	
- для конкурентных запросов не советую составлять тексты состоящие только из прямого вхождения запроса 
	
	
- можно выделить 3 вида текстов: 
	
	
 — запросы разбавленные незначащими словами (к примеру, “офисная мебель” -&gt; “качественная российская офисная мебель”) 
	
	
— запросы, имитирующие газетные заголовки (к примеру, “Компания
Test-Мебель предлагает офисную мебель и недорогие офисные кресла.”) 
	
	
 — запросы-перечисления (к примеру “офисная мебель, офисные кресла, офисные стулья”) 
	
	
Примерное соотношение количества таких текстов 2:2:1 
	
	
- не забываем оформлять анкоры ссылок текстом (желательно с вхождением
запросов) (к примеру “Офисная мебель Test-Mebel - #a#качественная
офисная мебель#/a# от производителя.”) 
	
	
Для генерации лучше всего использовать собственный софт, при его
отсутствии - можете использоватье генератор AllSubmitter-a, генератор SePack или любой другой. 



	
	 
		
		 
		
		</description>
<category>Раскрутка сайта</category>
<author>napnik</author>
<pubDate>Wed, 03 Oct 2007 03:08:09 +0400</pubDate>
<yandex:full-text>4) Покупка ссылок. Тексты составлены, приступаем к покупке ссылок.


Основной способ покупки, используемый мной и большинством опытных
оптимизаторов - “лесенка” автофильтров. Т.е. создание каскада
автофильтров исходя из качественной и ценовой категории площадок.


Самая простая лесенка выглядит так:




	
	
Filter1: PR, CY, уровень вложенности не имеют значения, цена до 0.04
		
		
Filter2: PR от 0 до 9 | CY от 120 до 20000  уровень вложенности не имеет значения, цена до 0.06
		
		
Filter3: PR от 0 до 9 | CY от 300 до 20000 уровень вложенности не имеет значения, цена до 0.16
		
		
Filter4: PR от 0 до 9 | CY от 500 до 20000 | уровень вложенности=2, цена до 0.26
		
		
Filter5: PR от 1 до 9 | CY от 500 до 20000 | уровень вложенности=2, цена до 0.69
		
		
Filter6: PR от 1 до 9 | CY от 900 до 20000 | уровень вложенности=2, цена до 0.99

	
	Filter1t: тематическая | PR, CY, уровень вложенности не имеют значения, цена до 0.04
		
		
Filter2t: тематическая | PR от 0 до 9 | CY от 120 до 20000 | уровень вложенности не имеет значения, цена до 0.06
		
		
Filter3t: тематическая | PR от 0 до 9 | CY от 300 до 20000| уровень вложенности не имеет значения, цена до 0.16
		
		
Filter4t: тематическая | PR от 0 до 9 | CY от 500 до 20000 | уровень вложенности=2, цена до 0.26
		
		
Filter5t: тематическая | PR от 1 до 9 | CY от 500 до 20000 | уровень вложенности=2, цена до 0.69
		
		
Filter6t: тематическая | PR от 1 до 9 | CY от 900 до 20000 | уровень вложенности=2, цена до 0.99





Данный пример не является лучшим, это просто образец для составления собственной системы фильтров.
	
	
Несколько слов о фильтрах Filter*t - буквально на днях система Sape
ввела возможность покупки ссылок только со страниц содержащих выбранные
слова. Эффективность данного метода на порядок выше обычной покупки (о
причинах расскажу в одной из следующих статей), но количество свободных
“тематических” страниц относительно невелико.
	
	
На всех фильтрах не советую покупать страницы с числом внешних более 10, на слабых страницах - с числом внешних более 7.



Распределение бюджета по фильтрам вещь тоже сугубо индивидуальная
(кто-то предпочитает много слабых страниц, тем самым имитируя линкатор,
кто-то немного, но помощнее, имитирую биржу). Я советую распределять
бюджет равномерно, в первую очередь покупая “тематические” страницы,
затем все остальное.




	
	
		
		
5) Индексация ссылок. Не открою Америку, если
сообщу что внутренние страницы индексируются много медленнее чем
главные, а самые слабые, нулевые странички вообще могут не
индексироваться месяцами. Наша цель - исправить ситуацию, ускорив
индексацию купленных ссылок.
	
	
Способов решения много, самые популярные:
	
	
- экспорт всех урлов ссылок в один файл (т.н. “простыня ссылок”),
публикация ее на фрихосте и проставление нескольких ссылок на данный
документ. Плюсы - простота метода. Минусы - а вот минусы советую
проверить самим, лишь намекну что связаны они с индексацией Яндексом
страниц, содержащих большое число ссылок.
	
	
- бомбардировка AddUrl-илки адресами. Не использую данный метод и другим не советую.
	
	
- метод, используемый нами: генерация псевдо-сайта, с размещением 5-10
ссылок на страницу в тексте. Описывать подробно инструментарий нет
смысла (скажу, что делается все автоматом - от экспорта из Sape до
заливки на FTP), дорвейщики меня поймут. Пример подобного “сайта”:
http://matlib3.narod.ru/ (как правило, яндексом индексируется на ура)




	
	
		
		
6) Поддержка проекта. Созданный проект постоянно
нуждается в мониторинге - удалению занепоченных страниц, страниц с
большим числом внешних ссылок (кстати, причина не в самом количестве, а
в потенциальной возможности наложения санкций на такие страницы) - BL и
GBL вам в помощь, докупке дополнительных ссылок, добавлению текстов et
cetera.



И напоследок несколько нюансов:
	
	
1) добавьте в проект урл продвигаемого документа (только вместо
http://www.sait.ru/ добавьте http://www.sait.ru), тексты к нему
составьте следующим образом




	
	
www.sait.ru
		
		
http://www.sait.ru/
		
		
http://sait.ru
		
		
sait.ru





И купите сотню ссылок по фильтру Filter1.
	
	
Зачем это делать? В двух словах - делаем анкор-лист более
“естесственным”. Более подробно отпишу после получения результата
экспериментов.
	
	
2) Самые дорогие ссылки (от $1 и выше) лучше покупать вручную, сразу проверяя на санкции.
	
	
3) Довольно часто встречаются недобросовестные вебмастера, неадекватно
увеличивающие цену на площадках, устанавливающие код ссылок вне ,
закрывающие страницы от индексации, устанавливающие огромное количество
внешних ссылок. Использование GBL сэкономит вам бюджет и нервы 
	
	  



4) не используйте знаки разделители (”.” , “!” и “?”) в текстах ссылок - Яндекс учтет текст ссылки до разделителя.



P.S. Надеюсь, мой небольшой мануал принесет кому-то пользу.




	
	

Оригинал: http://me.miralab.ru/2007/07/01/prodvigaem-vmeste-s-sape-tonkosti-i-nyuansy-raboty/
	
	
</yandex:full-text>
</item><item>
<title>ВИЦ, ТИЦ, PR</title>
<link>http://www.web-stroy.ru/2007/10/02/vic_tic_pr.html</link>
<description>Как известно, количество информации в сети Интернет растет очень быстро, чего нельзя сказать о ее качестве. Пользователь в поисках нужной информации может провести всю жизнь, если только случайно не наткнется на искомый материал; единственный выход для него - воспользоваться поисковиками, которые хранят информацию об адресах и содержимом веб-страниц. Поисковые машины, которые помогают пользователю, пытаются решить проблему - как среди сотен однотипных документов выбрать лучший?

В настоящее время используются текстовые и ссылочные критерии ранжирования страниц при поиске. Первые определяют уместность (“релевантность”) документа исходя из наличия слов запроса в тексте и заголовках страницы. Однако, наличие большого количества документов может обесценить изощренные механизмы расчета релевантности, основанные только на содержимом страницы. Это и произошло, когда люди поняли, какую выгоду они получают от целевых посетителей, которых бесплатно предоставляют поисковики. Качество поиска испортилось, количество документов возросло - “релевантный” документ стало очень легко создать.</description>
<category>Разное о поисковых системах</category>
<author>Administrator</author>
<pubDate>Tue, 02 Oct 2007 17:32:09 +0400</pubDate>
<yandex:full-text>В целях улучшения качества поиска часть работы по определению “хороших”, “важных” документов косвенно возложили на вебмастеров сети. Размещая ссылку на внешний сайт, создатель как бы рекомендует его посетителям своего сайта - именно эту особенность интернета решили использовать для улучшения качества поиска. Повышенная значимость документа определяется, таким образом, с учетом ссылок извне на сайт, содержащий этот документ.

Ссылочные критерии ранжирования помогли несколько исправить положение. Такой критерий достаточно трудно подделать - на это требуется добрая воля других вебмастеров, которые заботятся о качестве своих ресурсов и не будут “продвигать” недостойные сайты. Таким образом, ставка была сделана на саморегуляцию интернета, но новичков такой порядок не устраивал - их просто так никто не пускал в “клуб известных сайтов”. И когда новые правила игры были осознаны, поисковики постепенно начали проигрывать.

Однако, как учесть цитируемость ресурса? Ссылки ведь тоже бывают разные. Количество внешних ссылок на сайт не годится для представления цитируемости - с появлением бесплатных хостингов количество ссылок очень легко увеличить. Но важность таких ссылок ничтожна по сравнению со ссылками с известных ресурсов. PageRank и есть такой параметр важности, он выражает цитируемость страницы.
	

Что такое PageRank и зачем он нужен?

 

Слово PageRank буквально можно перевести как “ранг страницы”. Само название определяет алгоритм расчета цитируемости, разработанный и используемый by Sergey Brin &amp; Larry Page, разработчиками поисковой системы Google. Русские аналоги - Взвешенный Индекс Цитирования (ВИЦ у Яндекса), есть аналог и у Апорта, Рамблер планирует ввести учет цитируемости осенью 2002 года. В дальнейшем будем употреблять обозначения цитируемость и PR наравне с PageRank.

Цитируемость -это число, которое рассчитывается для каждой веб-страницы отдельно, и определяется цитируемостью ссылающихся на нее страниц. Своего рода замкнутый круг.

В чем основная идея? Нужно найти жизненный критерий, выражающий важность страницы. В качестве такого критерия была выбрана теоретическая посещаемость страницы. Была построена модель путешествия пользователя по сети путем перехода по ссылкам. При этом есть вероятность того, что посетителю сайт надоест и он закроет броузер и начнет со случайной страницы (допустим, вероятность этого равна 0.15 на каждом шаге). Соответственно, с вероятностью 0.85 он продолжит путешествие, кликнув на одну из доступных на странице ссылок (все ссылки при этом равноправны). Продолжая путешествие до бесконечности, он побывает на цитируемых страницах много раз, а на нецитируемых - меньше.

Таким образом, PageRank веб-страницы был определен как вероятность нахождения пользователя на этой веб-странице; при этом, конечно, сумма вероятностей по всем веб-страницам сети равна единице - где-то он должен обязательно быть!

Из модели следуют три вывода. Во-первых, PageRank нормируется по всем документам сети. Правда, сами величины, в общем-то, относительны, поэтому при расчетах часто нормируют не на единицу по сумме всех страниц, а на единичный усредненный PR (т.е. суммарный по N страницам PageRank равен N, а в среднем - единица). Пугаться этого не следует, просто PR выражен уже не в единицах вероятности, а в относительных единицах.

Во-вторых, PR передается не полностью, есть “затухание”. Поэтому длинные цепочки ссылок на сайте малополезны. С человеческой точки зрения то же самое выражает известное правило “трех кликов”.

В-третьих, каждая страница изначально имеет ненулевой PR, но очень маленький.
	Относитесь с осторожностью к расчетам PageRank, если-

* PR рассчитывается для совокупности страниц без учета “внешнего” PR. PageRank - величина, которая не имеет физического смысла в отрыве от Глобальной сети. Точнее, такой PR - это совсем новый PR.
	* Выявляются закономерности о “сохранении среднего PR” или проводятся нормировки по ограниченному набору страниц. PageRank определен и действует в глобальном масштабе. 

 

Аналогия

 

Представьте себе озеро (сайт), в которое впадают ручьи и речки (потоки посетителей, пусть “теоретических”). Количество потоков может быть любым, но река приносит много воды, а ручей мало. Поэтому в свое озеро нужно направлять мощные потоки. Какая-то часть воды “уходит в песок”, остальное вытекает из вашего озера и впадает в другие озёра. Часть воды испаряется.

В этом смысле рассмотрение распределения PageRank по страницам сайта в отрыве от внешних источников PageRank аналогично переливанию из пустого в порожнее. По внешнему виду сухого русла сложно представить силу потока в реке. Дождь дает очень мало воды - это и есть PageRank сайта, на который никто не ссылается.
	

Замечания

 

PageRank - не единственный ссылочный критерий ранжирования. Он учитывает только наличие ссылки, но не учитывает текст в ссылке, и текст ссылающегося документа.

Алгоритм “выдавливает” наверх в поиске те документы, которые и без поисковика наиболее популярны. Однако введение такого алгоритма при поиске существенно ужесточает конкуренцию, если это поисковик масштаба Google. 

 

Расчет PageRank


	Итак, будем рассматривать PageRank страницы как вероятность попадания пользователя на страницу, выраженную в относительных единицах. PageRank (
	Pi) страницы 
	i выражается как
	
	{1} где: 
	
	d -т.н. “damping factor”, параметр затухания. Принимается равным 0.85-0.9. Выражает вероятность того, что пользователь, зашедший на страницу, будет продолжать путешествие и переходить по ссылкам. 
	
	Pi - PageRank интересующей нас страницы 
	i 
	
	j - обозначение страниц, на которых есть ссылки на 
	i-ю 

 

 


	
	Pj - PageRank страницы 
	j, ссылающейся на 
	i-ю. 
	
	Сj - Число ссылок на странице 
	j. 
	
	1/Сj - Вероятность того, что пользователь, находящийся на странице 
	j, из 

 


	Сj доступных ему ссылок выберет именно ссылку на нашу страницу 
	i. 
	
	d*Pj/Сj - поток “теоретической посещаемости”, который дойдет до страницы 
	i со страницы 
	j. Суммирование идет по всем страницам, ссылающимся на 
	i-ю. 
	
	(1-d) - минимальный PageRank страницы. Он не равен нулю за счет того, что пользователь регулярно выбирает новый сайт в качестве стартовой точки. 

 

Однако, на PageRank наложено ограничение:
	
	 где 
	N - общее количество веб-страниц в Интернет. Т.е., 
	средний PageRank равен единице. Ограничение это следует из нормировки вероятности пребывания пользователя по всей сети - сумма вероятностей по всем страницам равна единице. Таким образом, 
	
	Вероятностьi=PageRanki/число страниц в сети Отметим, что значение PageRank, равное единице, только кажется большим. Количество страниц в сети (N) очень велико, и вероятность 1/N - чрезвычайно мала. Решая систему уравнений, можно найти PageRank всех страниц в Интернет. Расчет можно вести разными методами: 

Итерационный метод расчета PageRank

Метод наиболее часто используется. Он состоит в численном решении системы уравнений: 


	

		
Выбираем геометрию сайта, расстановку ссылок, систему уравнений 
	

		
Задаемся начальными значениями PageRank для каждой страницы. Они могут быть любыми. 
	

		
Рассчитываем новый набор значений PageRank по уравнению (1) исходя из имеющегося набора значений 
	

		
Рассчитываем средний PageRank по всему набору страниц, и делим PR 
			каждой страницы на полученную величину. В результате средний PR становится равным единице. 
		
 
		
 
		
 
	

		
Если набор значений PageRank изменился по сравнению с исходным набором шага 3, возвращаемся к шагу 3. Если нет, то расчет заканчиваем. 


При исследовании влияния геометрии сайта на распределение PageRank удобно представить структуру ссылок в виде матрицы: 

 

 


	

		

			

				
0-ссылки нет
					1-ссылка есть
				
На какую
					страницу 
					указывает 
					ссылка
			
			

				
На какой
					странице
					находится
					ссылка
				
 
				
 
				

					

						

							

								

									

									
1
									
2
									
3
									
4
								
								

									
1
									
0
									
 
									
 
									

										
1
										
0
										
0
								
								

									
2
									
0
									
0
									
1
									
0
								
								
 
								
 
								

									

										
3
										
0
										
0
										
0
										
1
									
									

										
4
										
1
										
0
										
 
										
 
										

											
0
											
0
									
							
						
			
		
	

В таблице выше представлен сайт из четырех страниц, на котором ссылки замкнуты в “кольцо”. Страница 1 ссылается на 2 (1- есть ссылка, 0-ссылки нет), 2 на 3, 3 на 4, 4 обратно на 1. Представление структуры сайта в таком виде удобно, в частности для расчетов. Для того, чтобы поэкспериментировать с различными структурами сайтов, можно скачать заготовки в MS Excel для 
		10 страниц (30 итераций) и 
		30 страниц (90 итераций). Распределение PageRank по страницам рассчитывается сразу и представлено в желтой строке. 

Матричный метод расчета PageRank

По уравнению 1: Нижеприведенную 
	“матрицу связей” можно умножить на вектор значений PageRank 

 

 


	m-го шага итерации, полученный вектор умножить на 
	d , прибавить единичный вектор, умноженный на 
	(1-d) и получить следующее приближение вектора PageRank с номером 
	m+1, который нужно пронормировать (чтобы сумма проекций вектора PR была равна N). При навыках работы с математическими программами (например, Mathcad) этот способ может быть более удобным. 

 


	

		

			

				

				
1
				
 
				
 
				

					
2
					
3
					
4
			
			

				
1
				
0
				
1/3
				
1/3
				
1/3
			
			
 
			
 
			

				

					
2
					
0
					
0
					
1/2
					
1/2
				
				

					
3
					
0
					
0
					
 
					
 
					

						
0
						
1
				
				

					
4
					
1
					
0
					
0
					
0
				
		
	

Здесь страница 1 ссылается на 2, 3, 4; страница 2 - на 3 и 4; страница 3 на 4, а 4 на 1. Представленная матрица содержит значения 
	Mij=1/Cj-&gt;i, т.е. значение в каждой ячейке разделено на общее количество ссылок 
	Cj на странице 
	j. 

 

 

Недостатки численных и итерационных методов

Фактически, оба приведенные выше метода являются разными формулировками 
	итерационного метода расчета значений PageRank. Они требуют работы с конкретными 
	численными значениями PageRank. Методы использованы для расчетов в работах [
		3,
		4]. Однако, рассмотрим реальную ситуацию. Для того, чтобы воплотить в жизнь свои знания о распределении PageRank, необходима индексация ваших страниц. В случае Google, ваш сайт не будет проиндексирован (либо придется ждать индексации очень долго) до достижения некоего порогового значения PageRank. В любом случае, на ваш сайт должны существовать ссылки, хотя бы одна. Это значит, что ваш сайт не оторван от “внешнего мира”, и существует ненулевой 
	“входящий PageRank”, направленнный извне на ваш сайт. Из этого рассуждения следует, что: 


	
 
	
 
	
 
	

		
Расчеты PR “в отрыве” от окружения сайта неточны для каждой страницы вашего сайта - они проделаны для 
			нулевого входящего PageRank 
	

		
Правило нормировки не работает в пределах вашего сайта (но работает в пределах 
			глобального набора проиндексированных страниц, т.е. в рамках Интернет по версии Google) 
	

		
Никакой численный расчет не может применяться в динамике - ведь входящий PageRank изменяется по мере раскрутки сайта (если вы дочитали до этого места, вероятно, раскруткой своего сайта будете заниматься так же упорно). Соответственно, меняется во времени PR каждой страницы. 


Стоит помнить о том, что по своей сути 
	PageRank - это поток (поток теоретической посещаемости). Соответственно, расматривая свой сайт как “маленькую вселенную”, вы не учитываете потоки извне. Если применить аналогию, такой сайт похож на высохшее озеро, на дне которого осталось несколько луж, и вы рассчитываете, в какой из них будет больше воды. 

 

 

Посмотрим, что происходит при увеличении входящего PageRank. Вот простейший сайт из четырех страниц, ссылок извне нет-
	
	 

 

А здесь входящий PageRank равен единице-
	
	 Но нам скоро станет лень рассчитывать PageRank при каждом “воображаемом” изменении внешнего PageRank (P0). Поэтому рассмотрим общий случай и выразим PR страниц как функции от P0-
	
	 В дальнейшем будем рассчитывать PageRank страниц как функции от входящего PR. Это позволит выделить ту компоненту PageRank, которая увеличивается по мере раскрутки, и отделить “остатки” в виде констант, величина которых порядка единицы. А солипсистскими методами расчета пользоваться на будем - мы ведь не одни в Интернете… 

Функциональный метод расчета PageRank

Задача: рассчитать стабильные значения PageRank, не применяя итерационных методов. Рассмотрим уравнение (1) внимательнее - в нем нет никаких особенностей, которые требуют применения итераций. Наоборот, PR каждой страницы определяется как функция PR других страниц. Предположим, 
	что мы достигли стационарного состояния, и PageRank страниц не меняется. Остается только записать уравнения для PR каждой из страниц и решить систему. 
	{1} Итак, будем рассчитывать PageRank страниц сайта как функцию от внешнего, “входящего” PageRank. Для этого нужны: уравнение (1) и представление об 
	эквивалентности страниц одного типа. Пример- 

 

 

На сайте, который приведен ниже, 3 нижних страницы эквивалентны между собой во всех смыслах. Соответственно, все они будут иметь одинаковый PageRank (P2). Головная страница отличается от них и имеет PR=P1.
	
	 Запишем уравнения для страниц вида 1 и вида 2: P1=0.15+0.85*(P0+3P2)
	- на страницу 
	вида 1 ссылаются 3 страницы 
	вида 2, на каждой из которых есть одна ссылка. 

 

P2=0.15+0.85*(P1/3)
	- на страницу 
	вида 2 ссылается страница 
	вида 1, на которой есть 3 ссылки. Решая эту систему, получаем- P1=0.15*(1+3*0.85)/(1-0.85^2)+0.85/(1-0.85^2)*P0=1.92+3.06*P0
	P2=0.69+0.87*P0 

 

Этим методом хотя и сложнее пользоваться, но он обладает одним хорошим качеством, которого нет у итерационных методов - 
	общностью. 

Откуда берется PageRank?


	Поль Дирак выдвигал предположение, что существует оптимальное расстояние, с которого лучше всего наблюдать женское лицо. Действительно: на нулевом расстоянии, равно как и на бесконечном, удовольствие от созерцания стремится к нулю. В то же время, на промежуточном расстоянии оно явно не нулевое. Значит, между нулевым и бесконечным расстоянием существует максимум функции Удовольствие=f(Расстояние) Давайте рассмотрим, хотя бы с помощью итерационного метода, два граничных случая связности сайтов. 
	Случай 1: Все страницы в Интернете замкнуты в “кольцо” - на каждой есть только одна ссылка на соседа, и только одна входящая ссылка. 
	
	Результат: PageRank равен единице для всех страниц. 
	Случай 2: Все страницы в Интернете перелинкованы друг с другом - на каждой из N страниц есть ссылки на всех N-1 соседей, и столько же входящих ссылок (N-1). 
	
	Результат: PageRank равен единице для всех страниц. 

 

 

 

Откуда же берется большой PageRank?


	Ответ: из неоднородности распределения ссылок по страницам. Дело в том, что все страницы сети были 
	эквивалентны, что привело к одинаковому значению PageRank. Но если в 
	однородном Интернете две страницы “обменяются ссылками”, их PageRank увеличится. А у всего остального Интернета - чуть-чуть, но уменьшится. Таким образом, те, кто обмениваются ссылками, “стягивают одеяло на себя”. Надо сказать, что приведенный выше функциональный метод чуть-чуть неточен. Дело в том, что он не учитывает изменения среднего PageRank сети при появлении рассмотренного сайта. На сайте средний PageRank не равен единице, в отличие от Интернета, поэтому после проведенного расчета нужно пересчитать PR всех страниц в сети: PRinew=PRiold*(Средний PR в интернете без вашего сайта)/(Средний PR в интернете, включая ваш сайт) 

 

 

Но, поскольку суммарный PR по Интернету никто не знает, делать этого мы не будем. В любом случае эти изменения мизерные, но именно они и являются тем самым “
	стягиванием одеяла на себя”. 

Промежуточные выводы


	

		
Мало смысла в расчете PageRank страниц без учета “внешнего” PageRank 
	

		
Нормировка PageRank на единицу работает только в глобальном масштабе, но не в пределах одного сайта 
	

		
Значения PageRank порядка единицы очень малы и неинтересны для анализа. Основной интерес представляет передача потока PageRank от одной страницы к другой 


Продолжение, в котором рассмотрены частные случаи и различные случаи иерархии страниц сайта следует. 

Литература по PageRank


	

		
Larry Page
			
				PageRank: Bringing Order to the Web 
		
 
	

		
Александр Садовский
			
				Растолкованный PageRank, перевод старого варианта статьи [4] 
	

		
Ian Rogers
			
				The Google Page Rank Algorithm and How It Works
			
				Обзор ошибок старого варианта статьи [4] 
	

		
Chris Ridings
			
				PageRank Explained, новый вариант статьи 
	

		
Артем Шкондин
			
				PageRank: Больше ссылок хороших и важных
</yandex:full-text>
</item><item>
<title>Особенности поисковой системы Google</title>
<link>http://www.web-stroy.ru/2007/10/02/osobennosti_poiskovojj_sistemy_google.html</link>
<description>Безусловно, Google является самым лучшим поисковым сервером в мире. В его индексе хранится более 3 миллиардов документов, Google переведен на 26 языков, крупнейшие порталы во всем мире выбрали Google в качестве поискового инструмента (с недавних пор компания Mail.ru стала использовать технологию поиска Google). Новаторская технология PageRank позволила создать качественный поиск и выдавать при запросе более релевантные результаты. Давайте посмотрим на основные отличия Google от других поисковых систем и на его особенности.</description>
<category>Google</category>
<author>Administrator</author>
<pubDate>Tue, 02 Oct 2007 17:30:55 +0400</pubDate>
<yandex:full-text>
	1) Google'овский паук называется Googlebot. Через файл robots.txt можно запретить роботу Googlebot индексацию каких-либо из ваших страниц. Аналогично этому файлу на работу паука влияют meta-теги. Помимо стандартных noindex, nofollow, index, follow Google использует еще один тег:


	


Дело в том, что при выдаче результатов, пользователи имеют возможность просмотреть найденную страницу не на вашем сервере, а в кэше Google. При частом обновлении вашего ресурса такая возможность может вам только навредить. Поставив вышеприведенный тег на нужную страницу, Google не сохранит ее в кэш и ваши посетители всегда будут получать только свежую информацию с вашего сайта.

Для сужения области действия, вы можете разрешить/запретить какое-нибудь действие только пауку Google. Для этого достаточно вместо name=&quot;robots&quot; написать name=&quot;googlebot&quot;.


	Пример


	


Робот-паук Googlebot следует и индексирует документы по ссылкам HREF и SRC.


	2) Объем проиндексированных документов у Google огромен, и вносить дополнительные изменения в ход индексации паука Google очень сложно. Поэтому нередко Googlebot быстрее сам находит ваш сайт, чем получает информацию из формы AddURL. В любом случае первая индексация вашего сайта произойдет через 2-3 недели. Зато переиндексация идет очень интенсивно, особенно если вы добавите свой сайт в каталог DMOZ. Googlebot просматривает этот каталог практически каждый день.

Но проходит достаточно времени, а ваш сайт до сих пор не проиндексирован. На то могут быть несколько причин.


	

		
Динамические страницы (.php и т.д.) Google индексирует не в полном объеме. А при использовании сессий паук не проиндексирует сайт вовсе. 
	

		
Если вы используете дорвеи (doorways, об их использовании я расскажу вам в других публикациях). 
	

		
Ваш сайт использует фреймы. Фреймовая структура доставляет неудобство пользователям всех поисковых машин. Хотя Google лучше всех них обрабатывает фреймы, даже он может на них споткнуться. Выхода из сложившейся ситуации только два: или составлять полноценное описание в теге , или не использовать фреймы вообще. 



	3) Технология 
	PageRank основывается на количестве и &quot;качестве&quot; внешних ссылок на ваш сайт. Именно от нее в первую очередь зависит релевантность вашей страницы и, соответственно, положение вашей страницы в результатах поиска (в России подобную технологию использует Яндекс, она называется Яндекс цитирования (CY)). 

Кроме PageRank на релевантность страницы влияет:


	

		
Имя вашего домена; 
	

		
Текст заголовка страницы (тот, что в теге ); 
	

		
Текст ссылок, ведущих с других серверов на ваш сайт; 
	

		
Содержимое атрибута ALT; 
	

		
Наличие ключевых слов в заголовках ,  ...; 
	

		
Визуальное выделение ключевых слов (, размер, цвет); 
	

		
Плотность ключевых слов на странице, т.е. их частота в документе. 


***

Вот, пожалуй, это все особенности поисковой системы Google. Но кое-какие моменты в поиске Google выходят за рамки представленной статьи, поэтому публикации об этой системе в дальнейшем будут продолжены.</yandex:full-text>
</item><item>
<title>Успешный сайт для Google за 12 месяцев</title>
<link>http://www.web-stroy.ru/2007/10/02/uspeshnyjj_sajjt_dlja_google_za_12_mesjacev.html</link>
<description>Довольно часто встречается мнение, что в подобных статьях слишком много говорится о теории разработки успешных сайтов. Что ж, отбросим теорию и обратимся к проверенным временем методам. Следующая система со 100%-ной вероятностью достичь желаемого положения в Google по широкому кругу запросов. Это те методы, которые я использую постоянно в своей работе. Результаты зависят, как правило, от темы, потенциальной аудитории и уровня конкуренции в нише. 
Следующие методы позволят построить успешный сайт для Google в течение одного года. Впрочем, можно уложиться и в более короткий срок - если вы действительно решите постараться. 
 </description>
<category>Google</category>
<author>Administrator</author>
<pubDate>Tue, 02 Oct 2007 17:30:00 +0400</pubDate>
<yandex:full-text>
	A) Начинайте строить содержание сайта. Прежде чем даже выбрать доменное имя для сайта, отметьте для себя следующее - необходимо иметь 100 страниц сайта. Это, причем, только для начала. Это только страницы с реальным содержанием - не списки ссылок, вступительные страницы и что-либо подобное.


	B) Доменное имя - легко запоминающееся и осмысленное. Не надо вставлять ключевые слова - вам надо создать брэнд, торговую марку, которые будут легко запоминаться. Времена доменов из ключевых слов прошли. Поучитесь на примере GoTo.com, который недавно стал Overture.com - по моему мнению, это был один из лучших примеров создания брэнда в Интернет, который, кстати, потребовал отбросить целые годы, потраченные на создание другого брэнда.


	C) Дизайн сайта - чем проще, тем лучше. Текста должно быть больше, чем тэгов разметки. Страницы должны быть видны в любом броузере - от lynx до IE 6.0 - старайтесь соблюдать стандарт HTML 3.2. Не похоже, чтобы роботы понимали HTML 4.0. Воздерживайтесь от всякого рода тяжестей на странице - Flash, Java, JavaScript - они, как правило, мало помогают сайту, но могут серьезно повредить по целому ряду причин, и нелюбовь поисковиков к ним лишь одна из них.
	

Стройте сайт структурно понятным. Включайте в имена директорий слова запросов, которые вы хотите “перекрыть”. Можете поступить иначе и все страницы положить в корневую директорию - несмотря на противоположность совета, он неплохо срабатывает на многих поисковиках, и в т.ч. на Google.
	Воздержитесь от ненужных ссылок, засоряющих сайт, например, “Best viewed with”, счетчиков, кнопочек, и т.д. Сделайте его простым и профессионально выглядящим. Поучитесь на примере самого Google - простота - вот что хочет посетитель.
	Скорость загрузки - это еще не все. Ваш сайт должен отзываться мгновенно. Если после перехода на сайт в броузере ничего не происходит в течение 3-4 секунд - у вас есть проблемы. Это время может меняться в зависимости от местонахождения сервера, но сайт, расположенный в вашей стране, должен отзываться в течение 3-4 секунд. Секундой больше - и вы начинаете терять аудиторию, по 10% примерно за каждую секунду. Между тем, 10% могут быть разницей между успехом и неудачей.


	Страницы:


	D) Размер страниц - чем меньше, тем лучше. Постарайтесь не превысить 15 кБ. Чем меньше, тем лучше. Постарайтесь не превысить 12 кБ. Чем меньше, тем лучше. Постарайтесь не превысить 10 кБ. Идея понятна? Удержитесь в пределах от 5 до 10 кБ. Да, это сложно сделать - но возможно и это работает. Как для поисковых систем, так и для посетителей.
	
	E) Содержание - сделайте одну страницу с текстом и выкладывайте по 200-250 слов в день. Если вы не знаете, что должно быть на странице - воспользуйтесь сервисом Overture. Полученный список - это ядро вашей страницы, стартовая линия.
	
	F) Частота, положение и т.д. - простой, старомодный стиль здесь наиболее уместен. Включите ключевое слово по разу в title, description, тэге H1, тексте ссылки, жирным шрифтом, курсивом, в начале страницы. Постарайтесь выдерживать частоту употребления ключевого слова в пределах от 5 до 20%. Используйте красивые фразы и проверьте их написание. Поисковые системы все чаще применяют автоматическую корректировку запросов и нет никаких причин этим пренебрегать.
	


	G) Внешние ссылки - поставьте на каждой странице ссылки на один или два сайта, которые хорошо находятся по нужным вам запросам. Используйте эти запросы в тексте ссылок - это окажется весьма полезным в будущем.



	H) Перекрестные ссылки - свяжите ими страницы сайта. Если страница о еде, убедитесь, что на ней есть ссылки на страницы о яблоках и овощах. Именно для Google очень важно связывать ссылками сходные по теме страницы, т.к. в этом случае вы переносите PageRank одной страницы на остальные страницы своего сайта. Не надо делать самую релевантную страницу, которая будет представлять собой весь сайт. Сделайте 50 страниц, которые будут приносить по одному посетителю в сутки, а не одну страницу, на которую придет 50 посетителей.
	
	I) Не пользуйтесь услугами виртуального хостинга - сайт должен иметь свой IP-адрес. Убедитесь, что робот сможет пройти по сайту. Все страницы должны содержать ссылки не менее чем на две другие страницы сайта, причем не глубже, чем на два уровня от корня сайта. Пролинкуйте всю тему по вертикали. Меню на каждой странице должно содержать ссылки на главные страницы тем. И не выкладывайте сайт в Сеть, пока он не готов. Лучше не выкладывать его вообще, чем выложить незаконченный сайт. Не портьте все с самого начала.
	Отправьте сайт в ODP. Если вы запланировали расходы на продвижение сайта, отправьте его также в LookSmart и Yahoo. Если нет - попробуйте удачи с бесплатным сервисом Yahoo.
	
	J) Отправьте главную страницу сайта в следующие системы - Google, Fast, Altavista, WiseNut, DirectHit и HotBot. Когда откроется возможность добавить сайт в Teoma, воспользуйтесь этим. А пока наступает самый сложный период - забудьте о сабмитах на следующие 6 месяцев. Все - отправили и забудьте.
	
	K) Запаситесь хорошим анализатором логов. Не используйте графический счетчик - это для ламеров. Если ваш хостинг не дает возможности работать с логами сервера - выберите другой. Вам нужна полная статистика посещений вашего сайта.
	


	L) Следите за посещениями роботов. Убедитесь, что они прочитали весь сайт. Если нет - проверьте систему ссылок на сайте. Робот должен пройти по ней, прочитав все страницы на сайте. Не беспокойтесь, если роботу потребуется два визита для индексации - обычно именно так индексирует Google или Fast. Остальные системы практически гарантированно добавят в течение 6 месяцев.
	
	M) Отправьте сайт в тематические директории - практически в каждой нише есть такая.
	
	N) Меняйтесь ссылками. Посмотрите на близкие вам по набору ключевых слов сайты - воспользуйтесь для этого Google Directory - версией ODP для Google. Лучше всего это делать после включения вашего сайта в ODP. Найдите сайты, которые имеют страницы для обмена ссылками, и просто предложите обмен. Ссылки ставьте в соответствии с темой сайта, с которым меняетесь.
	Не переживайте, если вам отказали в обмене. Продолжайте работу. Старайтесь меняться минимум с одним сайтом в день. Обычного письма вполне достаточно для этого. Не переживайте, если какой-то сайт не хочет меняться ссылками - они захотят, обязательно захотят.
	
	O) Добавляйте по одной странице на сайт в день. Чем они ближе тематически остальному сайту, тем лучше. Воздерживайтесь от слишком любительских, личных статей - пишите статьи, которые будут интересны основной аудитории. Оттачивайте свое мастерство, нащупайте стиль, который будет отвечать ее пожеланиям.
	

Короткие предложения, рубленые фразы, короткие куски текста - нечто, что можно быстро прочитать.
	Большинство посетителей не читают, они сканируют страницы. Вот почему необходимо делать небольшие страницы. У людей есть занятия получше,чем ждать загрузки вашей страницы и разбираться в суперкрутом меню на флэш. Если некий большой сайт использует флэш - это не означает, что вам тоже стоит это делать.
	Используйте заголовки и фразы, выделенные жирным текстом - они сработают как разделители, глаза посетителей будут цепляться за них.
	
	P) Не используйте что-либо, что может быть признано трюкачеством, некорректным обращением с юзером и т.д.
	



	Q) Если вы получаете письмо с просьбой обменяться ссылками - проверьте сайт, который об этом просит. Проверьте PageRank сайта в Google, каталоги. Не ставьте ссылку на мусор, только потому, что они об этом попросили. Убедитесь, что сайт похож на вас и схож по теме.
	
	R) Используйте всякого рода сервисы, наподобие “Сообщите другу”, форумы, листы рассылки для расширения круга посетителей сайта. Найдите ведущие форумы в вашей нише и изучите их подробно.
	Не используйте сервисы, которые вставляют ленту новостей, рекламу и т.п. в страницы вашего сайта.
	
	S) Старайтесь не превращать ваш сайт в онлайновую версию рекламной брошюры. Люди приходят не почитать “ваш” контент - они приходят найти что-то для себя. Постарайтесь поменьше писать о себе и своих продуктах. (удивлены? угу, я понимаю вас.)
	


	T) Публикуйте минимум одну страницу с хорошим содержанием в день. Обратитесь к сервису Overture - он поможет найти темы для новых статей.
	
	U) Изучайте логи. Через 30-60 дней вы начнете замечать посетителей с поисковых серверов. Проверьте ключевые слова, по которым вас находят. Почему они выглядят именно так? Почему люди используют такие запросы, чтобы найти ваш сайт? Если вы обнаружили, что пропустили какую-то тему - добавьте страницу об этом. Перестройте сайт, чтобы дать поисковику то, что он хочет.
	Поисковики скажут вам, что именно нужно людям - в ваших логфайлах скрыто золото, вопрос лишь в том, чтобы добыть его.
	
	V) Оставайтесь в курсе изменений в вашей нише. Если крупный сайт выходит на рынок с новым продуктом в конце года, подготовьте статью о нем в октябре и выложите на сайт. Как раз к декабрю она попадет в базу поисковика - поищите в Google сайты о Windows XP, они были готовы еще летом.
	
	W) Друзья и семья. Общение в сети важно для успеха сайта. Здесь сыграет свою роль все время, потраченное вами на общение на форумах. Помните при этом - молчание бесполезно. Ценность любого форума в общении с коллегами. Лучше запоминается полученное в общении - а не в чтении.
	

Общение в Сети сказывается в обмене ссылками, полученных советах, и в целом включает вас в круг людей, занимающихся той же темой.
	
	X) Создавая по одной странице в день, будьте готовы к тому, что вдохновение посетит вас в самый неподходящий момент. Если какая-либо мысль пришла к вам в душе или за столом - 
	запишите ее! Через 10 минут вы не сможете вспомнить какую-либо деталь или всю идею в целом. Запишите это так, чтобы после вспомнить все детали. Когда вдохновение пройдет, вы сможете вернуться к записанному.
	
	Y) Через 6 месяцев проверьте, проиндексирован ли ваш сайт поисковыми системами. Если нет - повторите сабмит. Не забудьте проверить, не появились ли новые каталоги.
	
	Z) Делайте по странице в день и выкладывайте на сайт. Уловили мысль? Google любит содержание, много хорошего контента. Старайтесь закрыть большой диапазон запросов. К концу года у вас должно быть около 400 страниц на сайте.

Претворите эти 26 пунктов в жизнь, и я гарантирую, что через год у вас получится успешный сайт. Он будет получать примерно от 500 от 2000 посетителей из поисковых систем в сутки. Если ваш сайт хорош и посетители просматривают 4-5 страниц в сутки, это будет означать 10-15к показов страниц в сутки. Что вы сделаете с этим траффиком - ваше дело, но, думаю, что этого количества вполне хватает, чтобы сделать что-нибудь.</yandex:full-text>
</item><item>
<title>Поисковая система Yandex</title>
<link>http://www.web-stroy.ru/2007/10/02/poiskovaja_sistema_yandex.html</link>
<description>Русскоязычная поисковая система. На сегодняшний день имеет самую большую базу данных, которая имеет кластерную структуру и размещена на нескольких серверах.  
 
У Яндекса достаточно быстрый поисковый робот, после 2-4 часов регистрируемая страница появляется в поисковых результатах. Но это означает лишь то, что страница поставлена в очередь на полную индексацию. После того, как страница проходит полную индексацию, она может пропасть из поисковых результатов, если поисковый робот сочтет ее за спам, либо из-за каких-нибудь технических проблем. Т.е. если ваша станица после первичной индексации вышла на первые места по тому или иному запросу, то после полной индексации, возможно, она будет совсем на других позициях, вывод: положение страницы нужно отслеживать в течение нескольких дней, пока не пройдет полная индексация. 
 
Не стоит волноваться, если попадете в следующую ситуацию:  
 
Страница после полной индексации заняла хорошую позицию. Но после одной из проверок ее место в списке результатов ниже, чем обычно. А на следующий день опять все по-прежнему. 
 
Список результатов может меняться в зависимости от загруженности серверов. Т.к. база данных имеет кластерную структуру и разнесена на несколько серверов. </description>
<category>Yandex</category>
<author>Administrator</author>
<pubDate>Tue, 02 Oct 2007 17:26:59 +0400</pubDate>
<yandex:full-text>


Советы по оптимизации:

Не нужно делать очень маленькие или очень большие документы. Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в ALT описании, но вес слов в этом тэге ниже. 
	
	Хорошо индексируются страницы созданные скриптами cgi, php. Это касается гостевых книг, форумов и т.п. Для индексации остальных (кроме главной) страниц сайта требуется примерно 2 недели. 
	
	Если сайт на русском языке, а домен не в зоне .ru, то Яндекс все равно проиндексирует. Я ждал индексации dkarlov.net -16 дней, но за это время проиндексировано только 2 страницы, немного позже все страницы были проиндексированы. 

UserAgent

Имя поискового робота: Yandex/1.03.00х, где х - тип паука, в зависимости от типа индексации (первичная, полная).
	
	

Поддержка мета тэгов

Мета тэги keywords и description: ключевые слова в них особенно не помогают достигать хороших позиций. В мета тэгах нужно писать лишь те слова, которые встретятся в тексте страницы.
	
	
	Однако мета тег description, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, т.к. это будет один из критериев, по которым пользователь решает приходить к ваи, или нет. 
	
	Мета тэги, такие как revisit-after, content - не поддерживаются. 

Советы по улучшению позиции сайта. 


	ключевые слова в: Title, заголовки (h1-h6), содержание страницы, ALT.
	
	В формулу вычисления релевантности включен Взвешенный Индекс Цитирования, аналог Page Rank в Google. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает ВИЦ . 
	

Спам 

Разработана технология определения спама, но пока она является кране не эффективной. Часто встречаются спамерские страницы. Но команда разработчиков работает над этим. По сему, крайне не рекомендую использовать спамерские методы. </yandex:full-text>
</item><item>
<title>Все о работе поисковых систем</title>
<link>http://www.web-stroy.ru/2007/07/03/vse_o_rabote_poiskovykh_sistem.html</link>
<description>Поисковые системы состоят из пяти отдельных программных компонент: 
 
1. spider (паук): браузероподобная программа, которая скачивает веб-страницы. 
 
2. crawler : «путешествующий» паук, который автоматически идет по всем ссылкам, найденным на странице. 
 
3. indexer (индексатор): «слепая» программа, которая анализирует веб-страницы, скаченные пауками. 
 
4. the database (база данных): хранилище скаченных и обработанных страниц. 
 
5. search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.</description>
<category>Разное о поисковых системах</category>
<author>napnik</author>
<pubDate>Tue, 03 Jul 2007 00:39:57 +0400</pubDate>
<yandex:full-text>Spider: Паук – это программа, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же действие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете «просмотр HTML-кода» в своем браузере.

Crawler: Как и паук скачивает страницы, он может «раздеть» страницу и найти все ссылки. Это его задача – определять, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов.

Indexer: Индексатор разбирает страницу на различные ее части и анализирует их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и других стилевых частей страницы вычленяются и анализируются.

Database: База данных – это хранилище всех данных, которые поисковая система скачивает и анализирует. Это часто требует огромных ресурсов.

Search Engine Results Engine: О, самое сердце зверя. Именно система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск.

Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании постоянно меняющихся критериев. Алгоритмом называется метод, по которому она принимает решение. Профессиональные оптимизаторы (SEO) иногда употребляют термин «algos» - это и есть то, о чем мы говорим.

Не смотря на то, что поисковые системы сильно изменились, большинство до сих пор отбирают результаты поиска на основании примерно следующих критериев:

• Title (заголовок): Присутствует ли ключевое слово в заголовке?

• Domain/URL (Домен/адрес): Присутствует ли ключевое слово в имени домена или в адресе страницы?

• Style (стиль): Жирный (STRONG или B), Курсив (EM или I), Заголовки HEAD: если место на странице, где ключевое слово использовано в жирных, курсивных или Hx (H1, H2,…) текстовых заголовках?

• Density (плотность): Как часто ключевое слово употреблено на странице? Количество ключевых слов относительно текста страницы называется плотностью ключевого слова.

• MetaInformation (мета данные): Хотя многие отрицают, некорые поисковые системы до сих пор читают мета ключевые слова (meta keywords) и мета описания (meta description).

• Outbound Links (ссылки наружу): На кого есть ссылки на странице и встречается ли ключевое слово в тесте ссылки?

• Inbound Links (внешние ссылки): Кто еще в Интернет имеет ссылку на данный сайт? Каков текст ссылки? Это называется «внестраничный» критерий, потому что автор страницы не всегда может им управлять.

• Insite Links (ссылки внутри страницы): На какие еще страницы данного сайта содержит ссылки эта страница?

Как видите, поисковой системе необходимо делать множество уточняющих запросов, используя скаченную страницу целиком.

Это сокращенное описания функционирования поисковой системы.</yandex:full-text>
</item><item>
<title>Поисковая система Яндекс</title>
<link>http://www.web-stroy.ru/2007/07/03/poiskovaja_sistema_jandeks.html</link>
<description>Поисковая система Yandex 
 
* URL's: http://www.yandex.ru/ 
* http://www.ya.ru/ - текстовая версия 
 
Русскоязычная поисковая система. На сегодняшний день имеет самую большую базу данных, которая имеет кластерную структуру и размещена на нескольких серверах. 
 
У Яндекса достаточно быстрый поисковый робот, после 2-4 часов регистрируемая страница появляется в поисковых результатах. Но это означает лишь то, что страница поставлена в очередь на полную индексацию. После того, как страница проходит полную индексацию, она может пропасть из поисковых результатов, если поисковый робот сочтет ее за спам, либо из-за каких-нибудь технических проблем. Т.е. если ваша станица после первичной индексации вышла на первые места по тому или иному запросу, то после полной индексации, возможно, она будет совсем на других позициях, вывод: положение страницы нужно отслеживать в течение нескольких дней, пока не пройдет полная индексация.</description>
<category>Разное о поисковых системах</category>
<author>napnik</author>
<pubDate>Tue, 03 Jul 2007 00:24:37 +0400</pubDate>
<yandex:full-text>Не стоит волноваться, если попадете в следующую ситуацию:

Страница после полной индексации заняла хорошую позицию. Но после одной из проверок ее место в списке результатов ниже, чем обычно. А на следующий день опять все по-прежнему.

Список результатов может меняться в зависимости от загруженности серверов. Т.к. база данных имеет кластерную структуру и разнесена на несколько серверов.

Советы по оптимизации:

Не нужно делать очень маленькие или очень большие документы. Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в ALT описании, но вес слов в этом тэге ниже.

Хорошо индексируются страницы созданные скриптами cgi, php. Это касается гостевых книг, форумов и т.п. Для индексации остальных (кроме главной) страниц сайта требуется примерно 2 недели.

Если сайт на русском языке, а домен не в зоне .ru, то Яндекс все равно проиндексирует. Я ждал индексации dkarlov.net -16 дней, но за это время проиндексировано только 2 страницы, немного позже все страницы были проиндексированы.
UserAgent

Имя поискового робота: Yandex/1.03.00х, где х - тип паука, в зависимости от типа индексации (первичная, полная).

Поддержка мета тэгов

Мета тэги keywords и description: ключевые слова в них особенно не помогают достигать хороших позиций. В мета тэгах нужно писать лишь те слова, которые встретятся в тексте страницы.


Однако мета тег description, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, т.к. это будет один из критериев, по которым пользователь решает приходить к ваи, или нет.

Мета тэги, такие как revisit-after, content - не поддерживаются.
Советы по улучшению позиции сайта.

ключевые слова в: Title, заголовки (h1-h6), содержание страницы, ALT.

В формулу вычисления релевантности включен Взвешенный Индекс Цитирования, аналог Page Rank в Google. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекса. Влияние на положение в результатах поиска оказывает ВИЦ .
Спам

Разработана технология определения спама, но пока она является кране не эффективной. Часто встречаются спамерские страницы. Но команда разработчиков работает над этим. По сему, крайне не рекомендую использовать спамерские методы.


Оригинал статьи: 
http://www.raskrutka.net/yandex.html</yandex:full-text>
</item></channel></rss>
