今回はどんな matrix が生成されたかについて述べる.
実装
今回以下の 4 つのプログラムを実装した.- Link_Vector_Extractor: 作家のリストベクトルを作成する
- Graph_Extractor: 隣接行列を作成する
- Page_Rank: PageRank の計算を行う
- Remapper: PageRank 結果を作家のリストベクトルに map する
実験に利用した計算機環境は CPU: Intel(R) Core(TM) DUO CPU P8400, 2 Cores, OS: 64bit Linux 3.2.0.32, Kubuntu 12.04. である.プログラミング環境としては Python 2.7.3, Beautiful Soup 4.0.2, matlab R2006a, octave 3.2.4を用いた.
Adjacency matrix
Adjacency matrix がどんな形になっているのかを図 2, 3, 4 に示す.この図では隣接関係がある著者間に点がうたれている.Figure 2: Adjacency matrices. Top to bottom: German authors in de.wikipedia.org, en.wikipedia.org, ja.wikipedia.org. |
Figure 3: Adjacency matrices. Top to bottom: English authors in de.wikipedia.org, en.wikipedia.org, ja.wikipedia.org. |
Figure 4: Adjacency matrices. Top to bottom: Japanese authors in de.wikipedia.org, en.wikipedia.org, ja.wikipedia.org. |
Table 2: Matrix size, non zero elements, and the average number of links between authors. Wiki ``en'' means en.wikipedia.org. |
この結果縮小された matrix の大きさとその rank を表 3 に示す.
Figure 3: Adjacency matrices: original size, reduced size, and its rank. |
次回はようやく Wikipedia 的に誰が重要な著者かの結果である.
注1: この記事を連載していた当時(2012-12-29) 友人の Joerg M. より指摘がありこの箇所を更新した.
Comments
Post a Comment