PageRank
PageRank(ページランク)とは、検索エンジンの検索結果でウェブページをランク付けするためにGoogle検索で最初に利用されたアルゴリズムの名称であり「PR」とも略される。
2016年にPageRankを表示するためのツールバーを廃止。
PageRankは依然として、検索順位を決定するための重要な指標ではあるが、ランク付けするために使用しているアルゴリズムはPageRankだけではない。
概要
PageRankの詳細
PageRankはページへのリンクの数と品質をカウントし、ウェブサイトの重要性の概算を決定することによって機能する。
基本的な仮定は、より重要なウェブサイトが他のウェブサイトからより多くのリンクを受け取る可能性が高いことを意味している。
また、「Wikipedeiaのページランク」では、以下のように解説している。
単純なネットワークの数学的PageRankは、パーセンテージで表されます。(Googleは対数目盛を使用しています。)Cへのリンクは少ないですが、ページCのPageRankはページEよりも高くなっています。Cへの1つのリンクは重要なページからのものであるため、価値が高くなります。ランダムなページから開始するWebサーファーが、現在アクセスしているページからランダムなリンクを選択する可能性が85%で、Web全体からランダムに選択されたページにジャンプする可能性が15%の場合、ページEに到達します。 8.1%の確率で。(任意のページにジャンプする可能性が15%の場合、減衰係数は85%に相当します。)減衰がないと、すべてのWebサーファーは最終的にページA、B、またはCに到達し、他のすべてのページのPageRankはゼロになります。ダンピングが存在する場合、ページAは、それ自体の発信リンクがない場合でも、Web内のすべてのページに効果的にリンクします。
PageRankの計算方法
ページAにはそれを指すページT1 … Tnがあると仮定する(つまり、引用)。
パラメータdは、0〜1の範囲で設定できるダンピングファクターである。
通常、dは0.85に設定。
dについての詳細は、次のセクションにあり、またC(A)は、ページAから出るリンクの数として定義される。
そのため、ページAのPageRankは、次のように与えられる。
- PR(A)=(1-d)+ d(PR(T1)/ C(T1)+ … + PR(Tn)/ C(Tn))
PageRanksはWebページ全体に確率分布を形成するため、すべてのWebページのPageRanksの合計は1になることに注意する。
PageRankの重要度の推移
ページランクの重要度を表した「PageRankの重要度の推移」。
(Googleのツールバーに表示されていた)ページランクは、0から10の11段階の指標であった。
当時(2014年頃まで)は「Google」や「Yahoo!JAPAN」などが「PageRank10」となっていた。
また、Googleのツールバーに表示されたPageRankは、2014年の後半頃に更新ストップ、2016年4月の正式削除された。
出典
- PageRank(英語版Wikipedeia)
- ページランク(日本語版Wikipedeia)
- PageRankの特許
- PageRankの論文・定義式