May 17, 2023

Google PageRank

Созданный основателями Google Ларри Пейджем и Сергеем Брином, PageRank представляет собой алгоритм, основанный на совокупной относительной силе всех гиперссылок в Интернете. Большинство людей утверждают, что название было основано на фамилии Ларри Пейджа, в то время как другие предполагают, что «Пейдж» относится к веб-странице. Обе позиции, вероятно, верны, и совпадение было преднамеренным.

История развития PageRank

Во время своего пребывания в Стэнфорде в конце 1990-х годов и Брин, и Пейдж изучали методы поиска информации. В то время использование ссылок для определения того, насколько «важна» каждая страница по сравнению с другой, было революционным способом упорядочивания страниц.

Это было сложно с вычислительной точки зрения. У некоторых сторон было так много институциональной веры в подход Google, что компания изначально запустила свою поисковую систему, не имея возможности получать доход. И хотя компания Google (известная в то время как «BackRub») была поисковой системой, PageRank являлся алгоритмом, который использовался для ранжирования страниц на страницах результатов поисковой системы (SERP).

Google Dance

Одна из проблем PageRank заключалась в том, что математика, хотя и простая, требовала многократной обработки. Расчет выполняется несколько раз для каждой страницы и каждой ссылки в Интернете. На рубеже тысячелетий для обработки этих математических исчислений требовалось несколько дней. За это время поисковая выдача Google двигалась вверх и вниз.

Эти изменения часто были ошибочными, так как для каждой страницы постоянно рассчитывались новые значения PageRank. Это явление было известно как «Google Dance», и оно останавливало SEO-профессионалов каждый раз, когда запускалось ежемесячное обновление.

Отступление PageRank

Алгоритм Google изначально считался «незащищающим от спама» внутри компании, поскольку важность страницы определялась не только ее содержанием, но и своего рода «системой голосования», генерируемой ссылками на страницу. Однако уверенность Google длилась недолго.

PageRank начал становиться проблематичным по мере роста индустрии обратных ссылок. Поэтому Google удалил его из публичного доступа, но продолжал полагаться на него в своих алгоритмах ранжирования. Панель инструментов PageRank была закрыта к 2016 году, и в конечном итоге весь публичный доступ к PageRank был ограничен. Но к этому времени Majestic (инструмент SEO), в частности, смог достаточно хорошо соотнести свои расчеты с PageRank.

Toolbar PageRank против PageRank

Google изначально так гордился своим алгоритмом, что был рад публично поделиться результатом своего расчета со всеми, кто хотел его увидеть. Наиболее заметным представлением было расширение панели инструментов для таких браузеров, как Firefox, которое показывало оценку от 0 до 10 для каждой страницы в Интернете.

По правде говоря, PageRank имеет гораздо более широкий диапазон оценок, но от 0 до 10 дает специалистам по поисковой оптимизации мгновенный способ оценить важность любой страницы в Интернете. Панель инструментов PageRank сделала алгоритм чрезвычайно наглядным, что также сопровождалось некоторыми сложностями. В частности, это означало, что ссылки — самый простой способ «обыграть» Google. Чем больше ссылок (или, точнее, чем лучше ссылка), тем выше рейтинг страницы в поисковой выдаче Google по любому целевому ключевому слову.

Как PageRank произвел революцию в поиске

Другие поисковые системы в значительной степени полагались на анализ содержимого каждой страницы в отдельности. Этих методов было мало, чтобы определить разницу между влиятельной страницей и просто написанной со случайным (или манипулятивным) текстом.

Это означало, что SEO-специалистам было очень легко манипулировать методами поиска других поисковых систем. Таким образом, алгоритм Google PageRank был революционным. В сочетании с относительно простой концепцией «nGrams», помогающей установить релевантность, Google нашел выигрышную формулу.

Вскоре он обогнал основных игроков того времени, таких как AltaVista и Inktomi (которые, среди прочего, поддерживали MSN). Работая на уровне страниц, Google также нашел гораздо более масштабируемое решение, чем подход, основанный на «каталогах», принятый Yahoo, а затем DMOZ, хотя DMOZ (также называемый проектом Open Directory) изначально смог предоставить Google с открытым исходным кодом собственный каталог.

Как работает PageRank

Формула PageRank представлена в нескольких формах. Изначально каждой странице в Интернете присваивается приблизительный рейтинг PageRank. Это может быть любое число.

Исторически PageRank представлялся публике как оценка от 0 до 10, но на практике оценки не обязательно должны начинаться с этого диапазона. Затем PageRank для этой страницы делится на количество ссылок со страницы, в результате чего получается меньшая доля. Затем PageRank распределяется по связанным страницам — и то же самое делается для любой другой страницы в Интернете.

Затем для следующей итерации алгоритма новая оценка PageRank для каждой страницы представляет собой сумму всех долей страниц, которые ссылаются на каждую данную страницу. Формула также содержит «коэффициент демпфирования», который был описан как вероятность того, что человек, просматривающий веб-страницы, может вообще прекратить просмотр.

Перед запуском каждой последующей итерации алгоритма предлагаемый новый PageRank уменьшается на коэффициент демпфирования. Эта методология повторяется до тех пор, пока оценки PageRank не достигнут установленного равновесия. Полученные числа затем для удобства обычно переводили в более узнаваемый диапазон от 0 до 10.

Один из способов представить это математически:

Где:

PR = PageRank в следующей итерации алгоритма.

d = коэффициент демпфирования.

j = номер страницы в Интернете (если каждая страница имела уникальный номер).

n = общее количество страниц в Интернете.

i = итерация алгоритма (первоначально установленная как 0).

У формулы есть некоторые проблемы: если страница не ссылается ни на одну другую страницу, то формула не достигнет равновесия. Таким образом, в этом случае PageRank будет распределен между каждой страницей в Интернете. Таким образом, даже страница без входящих ссылок может получить некоторый PageRank.

Еще одна менее документированная проблема заключается в том, что новые страницы будут иметь более низкий PageRank. Это означает, что со временем старый контент может иметь непропорционально высокий PageRank.

Как PageRank используется на страницах?

Если страница начинается со значения 5 и имеет 10 ссылок, то каждой странице, на которую она ссылается, присваивается 0,5 PageRank (за вычитанием коэффициента демпфирования).

Таким образом, PageRank перемещается по Интернету между итерациями.

По мере того, как новые страницы появляются в Интернете, они начинаются только с крошечного количества PageRank. Но по мере того, как другие страницы начинают ссылаться на эти страницы, их PageRank со временем увеличивается.

Хотя публичный доступ к PageRank был удален в 2016 году, считается, что оценка все еще доступна для поисковых инженеров в Google. И независимо от того, какие другие алгоритмы Google может использовать, PageRank, вероятно, остается встроенным во многие системы поискового гиганта по сей день.

👍🏻 Инфа была полезной? Ставь лайк!

Всем конверта и ROI высоченного

Официальный сайт 👉🏻 rocketprofit.com

Наш Telegram-чат 👉🏻 t.me/rocketprofitchat