Skip to main content

マルコフ行列の中の著者達: どの著者がもっとも人々に影響を与えたのか? (23)


Again, at which station am I?

2つの街の人口の移動の関係を用いて Eigenanalysis に関して説明してみた.これは Berlin の S-Bahn の例に用いることもできる.その方法を示そう.

街の人口の推移と同様,駅間での人の移動ということを考えることができる.隣の駅に行く可能性はどの場合も同じとしてみよう.この場合,隣かそうでないか,つまりトポロジが人の移動形態を決定する.この移動可能性を示す行列は隣接行列のカラムを正規化することで作ることができる.もしある駅が2つの駅に接続されていたならば,各駅に移動する可能性は 1/2 づつになる.同様に3つの駅に接続されている場合には各接続されている駅に移動する可能性は 1/3 である.これは最初に隣の駅に行く可能性をどの駅でも同じと仮定したからである.違うモデルを用いることもできる.駅の隣接行列をこの可能性の行列に各カラムを確率として\(L_1\)で正規化すると,以下のようになる.(細かいことになるが,ここでは確率を考えているので,\(L_1\)ノルムを使用した.)
\begin{eqnarray*}
 \left[
  \begin{array}{cccc}
   1 & 1 & 0 & 0 \\
   1 & 1 & 1 & 1 \\
   0 & 1 & 1 & 0 \\
   0 & 1 & 0 & 1 \\
  \end{array}
 \right]
 \rightarrow
 \left[
  \begin{array}{cccc}
   0.5 & 0.25 & 0   & 0 \\
   0.5 & 0.25 & 0.5 & 0.5 \\
   0   & 0.25 & 0.5 & 0 \\
   0   & 0.25 & 0   & 0.5 \\
  \end{array}
 \right]
\end{eqnarray*}
これが隣接行列から生成された S-Bahn の Markov Matrix である.

octave で各駅に滞在する可能性がどのようになるか計算してみよう.
octave:10> Mb =
[0.5 0.25 0 0; 0.5 0.25 0.5 0.5;
 0 0.25 0.5 0; 0 0.25 0 0.5];
octave:11> [L D] = eig(Mb)
L =
2.88e-01  8.16e-01 -3.77e-1  1.25e-01
-8.66e-1 -4.83e-16 -7.55e-1 -3.25e-16
2.88e-01 -4.08e-01 -3.77e-1 -7.61e-01
2.88e-01 -4.08e-01 -3.77e-1  6.35e-01
D =
Diagonal Matrix
  -0.2500       0       0       0
        0  0.5000       0       0
        0       0  1.0000       0
        0       0       0  0.5000
octave:12> x1 = L(:,3)/ sum(L(:,3))
x1 =
   0.20000
   0.40000
   0.20000
   0.20000
 3 番目のカラムベクトルを使ったのは,3番目の固有値が1だからである.1000回行列 M を適用した場合も計算してみる.
octave:16> Mb^1000 * w
   0.20000
   0.40000
   0.20000
   0.20000
1000 step 移動した際の各駅にいる可能性はそれぞれ 0.2, 0.4, 0.2, 0.2 である.どの駅から出発しても十分長いステップ移動するとこの値に近づくが,それは既に固有値解析によってわかっている.駅のトポロジを思い出してみると(図 7),二番目の駅,Alexanderplatz, に滞在する可能性が高い.この例では Alexanderplatz がハブの役目を果たしているからであるが,ハブとなる駅には他の駅に比較してどれだけ人が集まるのかが計算できた.
Graph example 2. Each node is a train station.

これで基本的な理論は説明した.では著者の重要性とどの駅にいるかはどういう関係なのだろうか.既にこれらは同じグラフというもので示されることを見てきた.グラフという観点を持てば,駅のネットワークを移動してどの駅が重要であるかを計算することと,著者の関係ネットワークを移動してどの著者が重要であるかを計算することは,同じである.人間の解釈は異なるが数学ではこれらは同一である.数学では形が同じものは同じなのである.それは \(2+3=5\) の各数字が牛乳を示していても,ユーロであっても,時間であってもこの計算が正しいことに似ている.2リットルの牛乳と3リットルの牛乳を合わせれば 5 リットルであり,2時間と3時間を合わせれば5時間であり,2 ユーロと3ユーロを合わせれば 5ユーロであるように,数学では同じ形には様々な解釈はあるが,これらは量の加算としては同じものである.グラフを駅のネットワークと見るか,著者間の関係と見るかはただの解釈であった.

このように抽象化することは意味を失うとして人間的でないと嫌う向きもある.この感情は私にはよく理解できる.全てをお金に換算して価値をお金の数字としてしか見ないことは数学的抽象化に似ており,それが全てであるとは思えない.しかし,お金がさまざまな価値と返還できることは,数学的な抽象化が,様々な問題に適応できることにも似ている.つまり未知の問題にも過去の知識が適用できる可能性がある.これは数学を重要な道具にしてきた.個人的には,問題に対してどこまで抽象化を行うかというバランスが大事であると思う.あまりに無理な仮定から抽象化を行うとそれが実際の問題とあまり合致しないにもかかわらず,つまり意味がまったくないにもかかわらず,その答えに意味があるように錯覚してしまうからである.これはお金が全ての価値であると考えると,様々な弊害が起きてくることに似ている.この部分は,(応用)数学者の人間が問われる部分でもある.私は,人間性と数学の関係はあまりないというのは誤解であると思う.問題を解くことは数学者の感情からであることは既に述べたが,数学者の質というものは人間性に関わってくることは私には興味深い.

Comments

Popular posts from this blog

共有メモリによるプロセス間通信

Unix の共有メモリを使ったプロセス間通信について調べて実験をしてみた.対象は1つのホスト上での複数のプロセスである.ネット上でいくつか例題はないかと探したが,どうも良い例となるコードが見当たらなかった.結局はある解説記事と,Stack Overflow の議論と,man page を見て作ってみたものになったので,例をここに置くのも有用かと考え,この記事を書く.(もしかしたら探し方が悪くて良いコード例をみつけられなかっただけかもしれない.) mmap を使うかどうかという話がいくつもでていたが,POSIX の方向としては,shmem_open と mmap を使うという方向があるということだったので,それを信じてその形での実装を試してみた. 基本的なコードの流れは次のようになる. 共有メモリ領域を1つのプロセスが shm_open() を使って作成する.その際に,プロセス間で共通の文字列を識別子(``identifier'')とする.(Linux ではこれが /dev/shm/identifier のように見える.) 共有メモリ領域を mmap() でメモリにマップする.共有メモリポインター (shared_ptr)が得られる. shared_ptr を使って複数のプロセスで通信をする. 利用終了後は munmap() をつかってマップを消す. 共有メモリオブジェクトを shm_unlink() によって消す. 以下に示すプログラムは,server と client の2つのプロセスが共有メモリを使って通信をするものである.ここで,server プロセス数と client プロセス数は共に 1 を仮定する.server と client は自分の領域にしか値を書き込まないことで,ロックを避けている.互いに相手の値を読み,それよりも1大きい数を一定の期間ごとに自分の領域に書くという例題である.シンプルではあるが,共有メモリで通信をする基本としては十分なものだと思う.ソースコード(shmem_test.cpp)を以下に付加する.ソースコードのコメントにコンパイル方法とどのように利用するかを書いておく. /*   Shared memory inter process communication minimal exa...

複数の線を持つ線グラフを Jenkins の plot plugin で描く方法

私は毎夜のソフトウェアテストを自動化するために Jenkins というツールを使っています.今回は, valgrind  を使ってメモリーリークのテストを自動化することにし ました.その際,エラーの数の結果をグラフとして表そうと思って, Plot plugin  を使うことにしました. Plot plugin の例図からは,複数のデータラインを描くことができるのは明らかなのですが,どうやったらいいのかは参照のページや,例としてあった Perl script,plugin 中の help からは私にはよくわからなかったのです. ここで重要な考えは,それぞれのデータラインにはそれぞれの出力ファイルが必要ということでした.私はこれを誤解していました. 例として,ビルドの時に次の property データファイルを出力します.それぞれのファイルが1つのデータラインを表します. valgrind_trunk_result.definitely.property valgrind_trunk_result.indirectly.property valgrind_trunk_result.possibly.property それぞれのデータの中身は1行のデータ点です.たとえば, valgrind_trunk_result.definitely.property ファイルの中身は次のような1行 です. YVALUE=0 このファイルを ${WORKSPACE} ディレクトリ以下に出力します.ここで," WORKSPACE " は jenkins が提供する環境変数です. 図1が私の plot plugin の設定を示しています.これは jenkins の config 画面です.3つの data series があって,それぞれにデータファイルがあります. Figure 1: Plot plugin configuration in Jenkins 図2が結果です.複数の線が描かれているのがわかります.(実際には 3 本の線がありますが,最初の線と2番目の線が同じデータなので,重ねって見えません.) Fugure 2: Plot data with multiple data lines

ソニーのカメラ (α 5000) の 30 分のビデオ録画時間の制限を外す方法

私は Sony の Alpha 5000 を気にいって使っています。しかし一つだけ問題がありました。それはビデオの録画時間の制限が 30 分というものです。 今日,ちょっと気になって探したらこの制限を解除できることがわかりました。以下のビデオがその紹介です。 https://youtu.be/7cstA_PuRIg このビデオの作者によれば,ほとんどのソニーのカメラのビデオの制限はなくせるそうです。ただし私が試したのは,Alpha 5000 のみです。 手順 カメラ側 スイッチ On Menu -- Setup --- USB connection を MTP にする スイッチ Off and On USB ケーブルでカメラをコンピュータに接続する (以下接続したままにする) コンピュータ側でソフトのダウンロードとインストール (私は Windows 10 で試しました) 次の URL に行く https://sony-pmca.appspot.com/apps ただし,Internet Explorer か Safari のみサポートということでした。Chrome では上手くいきませんでした。私が試したのは Windows 10,Internet Explore 11 です。 注意事項: このサイトは Sony のサイトですが,ここにあるソフトウェアは Sony のものとは限らないので保証はありません。御自分でリスクを判断してご利用下さい。当方も何も責任を負えません。 上記の URL から,OpenMemories のページに移動する。 このページにある PMCADownloader plugin (PMCADownloader.msi) をダウンロードする PMCADownloader をインストールする 私はいちどここでページを閉じてもう一度 https://sony-pmca.appspot.com/apps を開き,OpenMemories のページに移動しました ここで log に Loading plugin Plugin loaded と表示されます。PMCADownloader の Install がされていない時には,``Plugin loaded'...