ならば

音とかで遊んでいたログ

可聴化について調べた

元々音の要素がないデータやプロセスの情報を反映した音が鳴る仕組みを作れば可聴化だろうってことで、それっぽい内容のエントリをいくつか書いてきたわけだけど、学術的なことも概要くらいは知っておこうと思って可聴化についてネットで探せる範囲で調べた。簡単なまとめ。

定義

研究領域としての可聴化は比較的若く学際的で、心理学から工学まで多様なバックグランドを持つ研究者がいる。こうした研究領域の中で、可聴化([英]sonification)の厳密な定義として確定したものはまだ存在せず、今のところ広く受け入れられているのは、「可聴化とは情報を伝達するために非言語音を使うこと」程度のものらしい。
つい最近、Thomas Hermannという研究者が、もう少しはっきりした次の定義を提案した。抄訳。

データを入力として用いて音の信号を生成する方法は、以下の条件を満たすとき かつそのときに限り可聴化といえる。
(A) 音が入力データの特性や関係性を反映していること
(B) 音への変換の方法が厳密に定義されていること
(C) 結果が再現可能であること
(D) 意図的に異なるデータを入力できること。また、同じデータを繰り返し入力できること

この定義自体も確定したものではなく、Hermann自身もコメントを受け付けている。
可聴化は、聴覚ディスプレイ([英]auditory display)の一部分として見なせる。聴覚ディスプレイとは、視覚的な情報の提示の代わりに音を使って情報を提示するシステム一般のことで、可聴化への入力データの前処理から、可聴化処理、インタフェース(アンプやスピーカなど)、さらにはユーザまでをひっくるめた範囲全体を指す場合もある。可聴化と同様に聴覚ディスプレイにも厳密な定義はまだない。

サウンドアートとの関係

可聴化によって生成された音とサウンドアートの間に明確な境界線を引くことはできない。Hermannの可聴化の定義を満たす方法で生成された音が、結果的にサウンドアートとして鑑賞されるケースも十分あり得る。これは可視化によって生成された画像がアートとして鑑賞されるケースも多いことと同じ。
ただし、両者の本来の目的は異なる。可聴化をメインとするなら、音楽的な魅力よりも入力データに含まれる情報が明確に伝わることを優先すべきだし、逆にサウンドアートを目指すなら、鑑賞者の心に残るような音をデザインすべきだろう。

利点・欠点

基本的に聴覚の利点・欠点と直接結びつく。
利点:全方位的、経時的な変化を自然に表現できる、大量の情報を高速に表現できる(知覚させられる)
欠点:うるさい、気が散る、絶対的な量を表現しにくい

ガイドライン

可聴化の手法として確立したものはまだない。一般的には入力データの変化を音量、音高やテンポの増減などに対応させることが多いが、音色など他の要素を変化させるほうが分かりやすくなる場合もある。効果的な手法を確立することは、可聴化の主要な研究テーマのひとつ。

用途

サウンドアートは数多くあるだろうけど、上で書いたように可聴化の本来の目的からは外れているのでここでは触れない。実用になっているものとしては、物理現象や自然現象のモニタリングが多い。最初期の成功例としてはガイガーカウンターがある。あと、複雑な作業中に視覚が既に使われている状況で、補完的に情報を提供する手段として使われるケースも多い。例としては一部の医療機器や航空機器など。今後は、マルチモーダル・インタフェースでの利用も増えると予測されているようだ。

参考にしたサイト

Wikipedia英語版の"sonification"
可聴化の概要。とっかかり。外部リンクが多い。
Wikipedia英語版の"auditory display"
聴覚ディスプレイの概要。利点と欠点。
sonification.de
Hermannのサイト。可聴化と聴覚ディスプレイの概観、可聴化の定義の簡潔なまとめ。
TAXONOMY AND DEFINITIONS FOR SONIFICATION AND AUDITORY DISPLAY
Hermannの2008年の論文(PDF)。可聴化と聴覚ディスプレイの定義、位置付けの提案。Hermannの可聴化の定義の詳細と概評はこの論文に書いてある。
International Community for Auditory Display(ICAD)
聴覚ディスプレイの国際学会のサイト。サイドメニューのNavigation > Knowledge Base > Toolsで表示されるツール紹介にChucKが載っている。
Sonification Report: Status of the Field and Research Agenda
研究領域としての可聴化の概況を米国国立科学財団へ報告するために作成されたレポート。1997年のレポートなので情報としては古い。

雑感

  • Hermannのサイトと論文が分かりやすくて簡潔に整理されているために、意図せず彼の研究内容の比重が大きくなってしまった気がする。だけど、特に学際的な研究領域では、彼のように研究領域について整理し、提案し、議論を促そうとする研究者の存在は重要だと思う。
  • 可聴化の欠点ではなく、実際に音を扱う成果一般に言える欠点だけど、生成した音の録音サンプルをネットで公開するという限定的な状況を考えたとき、実際に聴いてもらうことのハードルが高いと思う。当然のことだが、可視化の結果である画像とは違って音には一覧性がなく、実際に再生して聴かない限りどんな感じの音なのかわからない。可視化の場合、例えばvisualcomplexityのようなサイトで大量に画像があってもぱっと見てどれが有用そうか、面白そうかをある程度判断できるけど、可聴化の場合はそうはいかない。
    付け加えると、普段PCで作業するときにBGMを流している人も多いだろうし、それを中断させる、あるいは邪魔する音を聴かせることは割と難しいのではないかと思う。