「PageRank」の版間の差分
Masahiko Tsuji (トーク | 投稿記録) (ページの作成:「PageRank(ページランク)とは、検索エンジンの検索結果でウェブページをランク付けするためにGoogle検索で最初に利用されたアルゴリズムの名称であり「PR」とも略される。 2016年にPageRankを表示するためのツールバーを廃止。 PageRankは依然として、検索順位を決定するための重要な指標ではあるが、ランク付けするために使用しているアルゴリズム…」) |
Masahiko Tsuji (トーク | 投稿記録) 編集の要約なし |
||
4行目: | 4行目: | ||
PageRankは依然として、検索順位を決定するための重要な指標ではあるが、ランク付けするために使用しているアルゴリズムはPageRankだけではない。 | PageRankは依然として、検索順位を決定するための重要な指標ではあるが、ランク付けするために使用しているアルゴリズムはPageRankだけではない。 | ||
== 概要 == | |||
=== PageRankの詳細 === | |||
PageRankはページへのリンクの数と品質をカウントし、ウェブサイトの重要性の概算を決定することによって機能する。 | |||
基本的な仮定は、より重要なウェブサイトが他のウェブサイトからより多くのリンクを受け取る可能性が高いことを意味している。 | |||
また、「[[wikipedia:PageRank|Wikipedeiaのページランク]]」では、以下のように解説している。<blockquote>単純なネットワークの数学的PageRankは、パーセンテージで表されます。(Googleは対数目盛を使用しています。)Cへのリンクは少ないですが、ページCのPageRankはページEよりも高くなっています。Cへの1つのリンクは重要なページからのものであるため、価値が高くなります。ランダムなページから開始するWebサーファーが、現在アクセスしているページからランダムなリンクを選択する可能性が85%で、Web全体からランダムに選択されたページにジャンプする可能性が15%の場合、ページEに到達します。 8.1%の確率で。(任意のページにジャンプする可能性が15%の場合、減衰係数は85%に相当します。)減衰がないと、すべてのWebサーファーは最終的にページA、B、またはCに到達し、他のすべてのページのPageRankはゼロになります。ダンピングが存在する場合、ページAは、それ自体の発信リンクがない場合でも、Web内のすべてのページに効果的にリンクします。</blockquote> | |||
=== PageRankの計算方法 === | |||
[[ファイル:PageRank.png|代替文=PageRankの詳細図|サムネイル|[[wikipedia:PageRank|PageRankの詳細図]]]] | |||
ページAにはそれを指すページT1 … Tnがあると仮定する(つまり、引用)。 | |||
パラメータdは、0〜1の範囲で設定できるダンピングファクターである。 | |||
通常、dは0.85に設定。 | |||
dについての詳細は、次のセクションにあり、またC(A)は、ページAから出るリンクの数として定義される。 | |||
そのため、ページAのPageRankは、次のように与えられる。 | |||
* PR(A)=(1-d)+ d(PR(T1)/ C(T1)+ … + PR(Tn)/ C(Tn)) | |||
PageRanksはWebページ全体に確率分布を形成するため、すべてのWebページのPageRanksの合計は1になることに注意する。 | |||
=== PageRankの重要度の推移 === | |||
== 出典 == | |||
* [[wikipedia:PageRank|PageRank]](英語版Wikipedeia) | |||
* [https://ja.wikipedia.org/wiki/%E3%83%9A%E3%83%BC%E3%82%B8%E3%83%A9%E3%83%B3%E3%82%AF ページランク](日本語版Wikipedeia) | |||
* [https://patents.google.com/patent/US6285999 PageRankの特許] | |||
* [http://infolab.stanford.edu/~backrub/google.html PageRankの論文・定義式] |
2023年3月1日 (水) 22:38時点における版
PageRank(ページランク)とは、検索エンジンの検索結果でウェブページをランク付けするためにGoogle検索で最初に利用されたアルゴリズムの名称であり「PR」とも略される。
2016年にPageRankを表示するためのツールバーを廃止。
PageRankは依然として、検索順位を決定するための重要な指標ではあるが、ランク付けするために使用しているアルゴリズムはPageRankだけではない。
概要
PageRankの詳細
PageRankはページへのリンクの数と品質をカウントし、ウェブサイトの重要性の概算を決定することによって機能する。
基本的な仮定は、より重要なウェブサイトが他のウェブサイトからより多くのリンクを受け取る可能性が高いことを意味している。
また、「Wikipedeiaのページランク」では、以下のように解説している。
単純なネットワークの数学的PageRankは、パーセンテージで表されます。(Googleは対数目盛を使用しています。)Cへのリンクは少ないですが、ページCのPageRankはページEよりも高くなっています。Cへの1つのリンクは重要なページからのものであるため、価値が高くなります。ランダムなページから開始するWebサーファーが、現在アクセスしているページからランダムなリンクを選択する可能性が85%で、Web全体からランダムに選択されたページにジャンプする可能性が15%の場合、ページEに到達します。 8.1%の確率で。(任意のページにジャンプする可能性が15%の場合、減衰係数は85%に相当します。)減衰がないと、すべてのWebサーファーは最終的にページA、B、またはCに到達し、他のすべてのページのPageRankはゼロになります。ダンピングが存在する場合、ページAは、それ自体の発信リンクがない場合でも、Web内のすべてのページに効果的にリンクします。
PageRankの計算方法
ページAにはそれを指すページT1 … Tnがあると仮定する(つまり、引用)。
パラメータdは、0〜1の範囲で設定できるダンピングファクターである。
通常、dは0.85に設定。
dについての詳細は、次のセクションにあり、またC(A)は、ページAから出るリンクの数として定義される。
そのため、ページAのPageRankは、次のように与えられる。
- PR(A)=(1-d)+ d(PR(T1)/ C(T1)+ … + PR(Tn)/ C(Tn))
PageRanksはWebページ全体に確率分布を形成するため、すべてのWebページのPageRanksの合計は1になることに注意する。
PageRankの重要度の推移
出典
- PageRank(英語版Wikipedeia)
- ページランク(日本語版Wikipedeia)
- PageRankの特許
- PageRankの論文・定義式