<?xml version="1.0" encoding="utf-8" ?><feed xmlns="http://www.w3.org/2005/Atom" xmlns:tt="http://teletype.in/" xmlns:opensearch="http://a9.com/-/spec/opensearch/1.1/"><title>Tom</title><author><name>Tom</name></author><id>https://teletype.in/atom/k2_aff</id><link rel="self" type="application/atom+xml" href="https://teletype.in/atom/k2_aff?offset=0"></link><link rel="alternate" type="text/html" href="https://teletype.in/@k2_aff?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=k2_aff"></link><link rel="next" type="application/rss+xml" href="https://teletype.in/atom/k2_aff?offset=10"></link><link rel="search" type="application/opensearchdescription+xml" title="Teletype" href="https://teletype.in/opensearch.xml"></link><updated>2026-05-14T09:13:29.155Z</updated><entry><id>k2_aff:rFFeI8kXW3J</id><link rel="alternate" type="text/html" href="https://teletype.in/@k2_aff/rFFeI8kXW3J?utm_source=teletype&amp;utm_medium=feed_atom&amp;utm_campaign=k2_aff"></link><title>Різниця між PageRank та PageRank_NS</title><published>2026-03-09T15:31:27.748Z</published><updated>2026-03-09T15:41:28.827Z</updated><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://img1.teletype.in/files/8a/4b/8a4b06ce-defe-494e-a4fd-ec3adb3a2e9d.png"></media:thumbnail><summary type="html">&lt;img src=&quot;https://img3.teletype.in/files/e2/f8/e2f8f1a1-0860-4617-b9f1-adf1167f5750.png&quot;&gt;Всі пам'ятають https://hexdocs.pm/google_api_content_warehouse/api-reference.html</summary><content type="html">
  &lt;figure id=&quot;Gxsw&quot; class=&quot;m_column&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/e2/f8/e2f8f1a1-0860-4617-b9f1-adf1167f5750.png&quot; width=&quot;1728&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;5itg&quot;&gt;Всі пам&amp;#x27;ятають &lt;a href=&quot;https://hexdocs.pm/google_api_content_warehouse/api-reference.html&quot; target=&quot;_blank&quot;&gt;https://hexdocs.pm/google_api_content_warehouse/api-reference.html&lt;/a&gt; &lt;/p&gt;
  &lt;p id=&quot;2JQL&quot;&gt;з якого наче классичний PageRank був скасований на користь Pagerank_NS. Я спробував розібрати патент &lt;a href=&quot;https://patents.google.com/patent/US9165040B1/en&quot; target=&quot;_blank&quot;&gt;Producing a ranking for pages using distances in a web-link graph &lt;/a&gt;   який схоже на все описує саме принцип роботи Pagerank_NS. &lt;/p&gt;
  &lt;p id=&quot;OL79&quot;&gt;Щоб зрозуміти суть цього патенту, треба згадати, з чого все починалося:&lt;/p&gt;
  &lt;ul id=&quot;wt5A&quot;&gt;
    &lt;li id=&quot;fyyE&quot;&gt;&lt;strong&gt;Класичний PageRank:&lt;/strong&gt; Це система &amp;quot;голосування&amp;quot;. Кожне посилання - це голос. Чим більше голосів у сторінки, тим вона важливіша. &lt;strong&gt;Проблема:&lt;/strong&gt; цю систему легко обдурити, створивши мільйон штучних сайтів (&amp;quot;ферми посилань, link-loops&amp;quot;), які голосують один за одного.&lt;/li&gt;
    &lt;li id=&quot;RbJB&quot;&gt;&lt;strong&gt;PageRank_NS (на основі Seed Sites):&lt;/strong&gt; Тут Google вибирає невелику групу &amp;quot;&lt;strong&gt;Seed Sites&amp;quot;&lt;/strong&gt;, яким він довіряє на 100% (наприклад, The New York Times). Вагу отримують лише ті сторінки, на які прямо чи опосередковано посилаються ці довірені ресурси. &lt;strong&gt;Проблема:&lt;/strong&gt; це дуже складно рахувати. Щоразу, коли додається новий довірений сайт, системі доводиться перераховувати весь інтернет заново, що дуже повільно і дорого.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;p id=&quot;0F87&quot;&gt;&lt;strong&gt;Рішення:&lt;/strong&gt; Замість того, щоб передавати &amp;quot;вагу&amp;quot;, система вимірює &amp;quot;&lt;strong&gt;відстань&amp;quot;&lt;/strong&gt;. Чим менше кліків відділяє вас від Nearest Seed, тим вищий ваш рейтинг.&lt;/p&gt;
  &lt;h3 id=&quot;Sljx&quot;&gt;Ключові концепції системи ранжування&lt;/h3&gt;
  &lt;p id=&quot;tGAz&quot;&gt;Для архітектурного розуміння методу необхідно виділити наступні фундаментальні елементи:&lt;/p&gt;
  &lt;ul id=&quot;M4NG&quot;&gt;
    &lt;li id=&quot;0ebq&quot;&gt;&lt;code&gt;&lt;strong&gt;seed pages&lt;/strong&gt;&lt;/code&gt;: Спеціально підібраний набір сторінок, які слугують довіреними точками відліку. Ключовою особливістю є те, що вони містять &lt;code&gt;outgoing links&lt;/code&gt; до набору сторінок, які підлягають ранжуванню.&lt;/li&gt;
    &lt;li id=&quot;ahhD&quot;&gt;&lt;code&gt;&lt;strong&gt;web-link graph&lt;/strong&gt;&lt;/code&gt;: Графова структура, вузлами якої є вебсторінки, а ребрами - гіперпосилання, що забезпечують взаємозв&amp;#x27;язок між ними.&lt;/li&gt;
    &lt;li id=&quot;UnwO&quot;&gt;&lt;code&gt;&lt;strong&gt;link lengths&lt;/strong&gt;&lt;/code&gt;: Числове значення, що присвоюється кожному посиланню в графі. Важливо розуміти, що довжина визначається на основі властивостей самого посилання (link properties) та властивостей сторінок, приєднаних до цих посилань (page properties).&lt;/li&gt;
    &lt;li id=&quot;qEsa&quot;&gt;&lt;code&gt;&lt;strong&gt;shortest paths&lt;/strong&gt;&lt;/code&gt;: Найкоротша сумарна відстань від масиву &lt;code&gt;seed pages&lt;/code&gt; до кожної цільової сторінки в графі, де відстань є сумою значень &lt;code&gt;link lengths&lt;/code&gt; на шляху кліку.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;h3 id=&quot;Y0Us&quot;&gt;Покроковий алгоритм розрахунку рейтингу&lt;/h3&gt;
  &lt;figure id=&quot;dlbG&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img4.teletype.in/files/b5/e8/b5e8467d-1c59-4568-83a1-e5fc7d999a7f.png&quot; width=&quot;1134&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;k8Xp&quot;&gt;Відповідно до логіки, зображеної на Фіг. 2 (&amp;quot;Flowchart&amp;quot;), процес розрахунку виконується за наступним алгоритмом:&lt;/p&gt;
  &lt;ol id=&quot;4AGP&quot;&gt;
    &lt;li id=&quot;lEIt&quot;&gt;&lt;strong&gt;Точка входу&lt;/strong&gt;: Отримання набору сторінок для ранжування та ідентифікація відповідних &lt;code&gt;seed pages&lt;/code&gt;.&lt;/li&gt;
    &lt;li id=&quot;Mf4Q&quot;&gt;&lt;strong&gt;Зважування силок&lt;/strong&gt;: Призначення значень &lt;code&gt;lengths&lt;/code&gt; для кожного посилання. Розрахунок базується на аналізі технічних характеристик посилань та якості пов&amp;#x27;язаних з ними сторінок.&lt;/li&gt;
    &lt;li id=&quot;ONUI&quot;&gt;&lt;strong&gt;Графові обчислення&lt;/strong&gt;: Розрахунок &lt;code&gt;shortest distances&lt;/code&gt; від множини &lt;code&gt;seed pages&lt;/code&gt; до кожного вузла (сторінки) у цільовому наборі.&lt;/li&gt;
    &lt;li id=&quot;aoBT&quot;&gt;&lt;strong&gt;Скоринг&lt;/strong&gt;: Визначення &lt;code&gt;ranking score&lt;/code&gt; для кожної сторінки як прямої функції від обчислених найкоротших відстаней. Чим менша сумарна відстань до сід сайтів, тим вищим є бал.&lt;/li&gt;
    &lt;li id=&quot;quax&quot;&gt;&lt;strong&gt;Кінцева точка&lt;/strong&gt;: Генерація впорядкованого ранжування для всього набору сторінок на основі отриманих балів.&lt;/li&gt;
  &lt;/ol&gt;
  &lt;h3 id=&quot;xPbi&quot;&gt;Фактори впливу на довжину посилань та якість ранжування&lt;/h3&gt;
  &lt;p id=&quot;jZgO&quot;&gt;У патенті значення &lt;code&gt;lengths&lt;/code&gt; не є статичним. Воно змінюється низкою факторів, що дозволяє ефективно виявляти маніпуляції.&lt;/p&gt;
  &lt;p id=&quot;8Hf6&quot;&gt;Технічний аспект&lt;/p&gt;
  &lt;p id=&quot;bMDf&quot;&gt;Вплив на результат&lt;/p&gt;
  &lt;p id=&quot;0Hr2&quot;&gt;&lt;code&gt;&lt;strong&gt;out-degree&lt;/strong&gt;&lt;/code&gt;&lt;/p&gt;
  &lt;p id=&quot;2u5L&quot;&gt;Велика кількість вихідних посилань з однієї сторінки збільшує &lt;code&gt;link lengths&lt;/code&gt;, що призводить збільшення відстані.&lt;/p&gt;
  &lt;p id=&quot;sUX5&quot;&gt;&lt;code&gt;&lt;strong&gt;damping factor&lt;/strong&gt;&lt;/code&gt;&lt;/p&gt;
  &lt;p id=&quot;qM6y&quot;&gt;Діє як модифікатор, що адитивно збільшує &amp;quot;вартість&amp;quot; або відстань кожного наступного переходу, моделюючи згасання довіри.&lt;/p&gt;
  &lt;p id=&quot;5HfB&quot;&gt;&lt;code&gt;&lt;strong&gt;link farms&lt;/strong&gt;&lt;/code&gt;&lt;/p&gt;
  &lt;p id=&quot;sx98&quot;&gt;Спроби штучного накопичення маси посилань не дозволяють зменшити відстань до &lt;code&gt;seed pages&lt;/code&gt;, оскільки алгоритм ігнорує об&amp;#x27;єм на користь близькості до трастових донорів.&lt;/p&gt;
  &lt;p id=&quot;EPJ2&quot;&gt;&lt;code&gt;&lt;strong&gt;spam pages&lt;/strong&gt;&lt;/code&gt;&lt;/p&gt;
  &lt;p id=&quot;lFBK&quot;&gt;Ресурси з низькою якістю отримують високі значення &lt;code&gt;lengths&lt;/code&gt;, що відсуває їх на периферію графа і забезпечує низький &lt;code&gt;ranking score&lt;/code&gt;.&lt;/p&gt;
  &lt;p id=&quot;lZaS&quot;&gt;&lt;strong&gt;Властивості сторінок&lt;/strong&gt;&lt;/p&gt;
  &lt;p id=&quot;pk0q&quot;&gt;Висока якість контенту або високий рівень довіри до сторінки, до якої веде посилання, може знижувати &lt;code&gt;link lengths&lt;/code&gt;, скорочуючи шлях до цілі.&lt;/p&gt;
  &lt;h3 id=&quot;JJVj&quot;&gt;Роль у загальній архітектурі пошукової системи&lt;/h3&gt;
  &lt;figure id=&quot;LJB0&quot; class=&quot;m_original&quot;&gt;
    &lt;img src=&quot;https://img3.teletype.in/files/a0/8b/a08bf002-0e1e-4560-ace0-e263177b3e65.png&quot; width=&quot;1112&quot; /&gt;
  &lt;/figure&gt;
  &lt;p id=&quot;0ZSG&quot;&gt;Згідно з Фіг. 3, патент інтегрує систему ранжування у глобальний цикл обробки даних:&lt;/p&gt;
  &lt;ul id=&quot;wKoe&quot;&gt;
    &lt;li id=&quot;dKUx&quot;&gt;&lt;strong&gt;&lt;code&gt;Web crawler&lt;/code&gt; (304)&lt;/strong&gt;: Здійснює безперервне сканування інтернету та передає зібрані дані до центрального вузла.&lt;/li&gt;
    &lt;li id=&quot;KS2C&quot;&gt;&lt;strong&gt;&lt;code&gt;Data center&lt;/code&gt; (308)&lt;/strong&gt;: Виступає ядром системи, де відбуваються процеси стискання (&lt;code&gt;compressing&lt;/code&gt;), індексування (&lt;code&gt;indexing&lt;/code&gt;) та безпосереднього ранжування (305) за методом найкоротших відстаней.&lt;/li&gt;
    &lt;li id=&quot;kGuM&quot;&gt;&lt;strong&gt;&lt;code&gt;Search engine&lt;/code&gt; (311)&lt;/strong&gt;: Слугує посередником, який приймає &lt;code&gt;query&lt;/code&gt; від користувача через &lt;code&gt;browser&lt;/code&gt;, звертається до обчислених у &lt;code&gt;Data center&lt;/code&gt; рейтингів і повертає структурований &lt;code&gt;response&lt;/code&gt;.&lt;/li&gt;
  &lt;/ul&gt;
  &lt;h3 id=&quot;jm5W&quot;&gt;Порівняння з традиційним PageRank&lt;/h3&gt;
  &lt;p id=&quot;sIkh&quot;&gt;Основна архітектурна відмінність між &lt;code&gt;PageRankNS&lt;/code&gt;  та традиційним &lt;code&gt;PageRank&lt;/code&gt; полягає в природі передачі авторитету. Якщо &lt;code&gt;PageRank&lt;/code&gt; базується на імовірнісній моделі &amp;quot;потоку&amp;quot; (probability flow), де авторитет розподіляється між усіма вихідними посиланнями вузла, то система &lt;code&gt;PageRankNS&lt;/code&gt;використовує модель &amp;quot;доданої вартості&amp;quot; (additive cost). У цій моделі кожне посилання додає певну дистанцію до загального шляху від довіреного джерела.&lt;/p&gt;
  &lt;p id=&quot;Jp7O&quot;&gt;Такий підхід є значно стійкішим до маніпуляцій з боку &lt;code&gt;link farms&lt;/code&gt;. У класичних ітераційних алгоритмах спамери можуть підвищувати рейтинг сторінки шляхом накопичення величезного обсягу вхідних посилань. Однак у системі &lt;code&gt;PageRankNS&lt;/code&gt; спам-структури стають неефективними: оскільки вони не мають прямих або коротких зв&amp;#x27;язків із &lt;code&gt;seed pages&lt;/code&gt;, кожне додаткове посилання всередині спам-мережі лише збільшує сумарну відстань або залишає її незмінно великою. Таким чином, замість оцінки &amp;quot;популярності&amp;quot; через об&amp;#x27;єм посилань, система фокусується на геометричній близькості вузла до еталонних зон довіри в &lt;code&gt;web-link graph&lt;/code&gt;.&lt;/p&gt;

</content></entry></feed>