ならば

音とかで遊んでいたログ

元号で使われた漢字の関係グラフ

大化から平成までの元号で使われた漢字の前後関係をグラフ化。
頂点数:72、辺数:257。

このグラフはCytoscapeの使い始めにテストで作った。以下全部メモ。少し触って分かったことだけ。


生物学の研究者は情報技術の応用に非常に積極的だと言われている[要出典]
Cytoscapeバイオインフォマティクスの研究コミュニティによって開発されているオープンソースソフト。分子間相互作用ネットワークの可視化やデータ統合が本来の目的らしいが、グラフ構造の可視化や解析であれば他の用途にも使える。
嬉しいのがGUIでグラフを操作できること。グラフレイアウトのアルゴリズムを切り替えられるし、グラフの一部を選択して移動することもできるし、頂点や辺の追加・削除もできるし、頂点や辺の大きさ、形、色を変更することもできる。
特に設定しなくても日本語は問題なく表示される。結果の出力形式は画像ファイルやPDFから選択可能。
描画だけではなくて、解析もできる。頂点間の接続情報を書いたデータをインポートするだけで頂点数と辺数は自動でカウントしてくれるし、最大次数の頂点とその隣接頂点を全て選択したり、頂点の名前で検索することもすぐできる。
プラグイン形式で追加できる機能もある。たとえば、NetworkAnalyzerというプラグインを入れると主なネットワーク指標値が出せる。


最後に今回はまった点。多重辺について。
Cytoscapeでは、その本来の目的に沿って、ネットワークの辺はある種の化学的作用を表すことを想定して作られている。辺の属性には作用の種類というものがあり、これが同じだとインポートするデータに多重辺があっても無視されて一本の辺になってしまう。多重辺を描きたいときには、一本ずつ違う作用の種類を指定しておけば良い。作用の種類とは言っても、単に多重辺を区別したいだけなら適当な文字列で問題ない。
今回直感で解決できなくてCytoscapeのマニュアルを見たのはこの多重辺のところくらいだった。