PageRank

2023年3月1日 (水) 22:38時点におけるMasahiko Tsuji (トーク | 投稿記録)による版

PageRank(ページランク)とは、検索エンジンの検索結果でウェブページをランク付けするためにGoogle検索で最初に利用されたアルゴリズムの名称であり「PR」とも略される。

2016年にPageRankを表示するためのツールバーを廃止。

PageRankは依然として、検索順位を決定するための重要な指標ではあるが、ランク付けするために使用しているアルゴリズムはPageRankだけではない。

概要

PageRankの詳細

PageRankはページへのリンクの数と品質をカウントし、ウェブサイトの重要性の概算を決定することによって機能する。

基本的な仮定は、より重要なウェブサイトが他のウェブサイトからより多くのリンクを受け取る可能性が高いことを意味している。

また、「Wikipedeiaのページランク」では、以下のように解説している。

単純なネットワークの数学的PageRankは、パーセンテージで表されます。(Googleは対数目盛を使用しています。)Cへのリンクは少ないですが、ページCのPageRankはページEよりも高くなっています。Cへの1つのリンクは重要なページからのものであるため、価値が高くなります。ランダムなページから開始するWebサーファーが、現在アクセスしているページからランダムなリンクを選択する可能性が85%で、Web全体からランダムに選択されたページにジャンプする可能性が15%の場合、ページEに到達します。 8.1%の確率で。(任意のページにジャンプする可能性が15%の場合、減衰係数は85%に相当します。)減衰がないと、すべてのWebサーファーは最終的にページA、B、またはCに到達し、他のすべてのページのPageRankはゼロになります。ダンピングが存在する場合、ページAは、それ自体の発信リンクがない場合でも、Web内のすべてのページに効果的にリンクします。

PageRankの計算方法

ページAにはそれを指すページT1 … Tnがあると仮定する(つまり、引用)。

パラメータdは、0〜1の範囲で設定できるダンピングファクターである。

通常、dは0.85に設定。

dについての詳細は、次のセクションにあり、またC(A)は、ページAから出るリンクの数として定義される。

そのため、ページAのPageRankは、次のように与えられる。

  • PR(A)=(1-d)+ d(PR(T1)/ C(T1)+ … + PR(Tn)/ C(Tn))

PageRanksはWebページ全体に確率分布を形成するため、すべてのWebページのPageRanksの合計は1になることに注意する。

PageRankの重要度の推移

出典