氏    名  王   新 平 (ワン シンピン)

学位論文題目  A statistical method for classifying cry of
        infant using power spectrum
       (パワースペクトルを用いた幼児泣き声に関する統計的識別手法)

論文内容の要旨

 
乳幼児期の疾患の一つとして,舌・喉頭蓋・喉頭偏移症(ADEL)という疾患が存在する。この疾患は乳幼児における異常な泣き声(疳泣き)の原因の一つとして考えられており,育児ストレスや親子間のコミュニケーション阻害,ひいては乳幼児虐待へつながることが懸念されている。そこでADEL疾患の乳幼児か健常な乳幼児かを診断し,適切な処置を行うことは重要である。本研究ではADELの乳幼児と健常な乳幼児の判別を試みる。

 パワースペクトル概形は啼泣の原因の推定に有効であることが知られており,またファルマントは声道形状を反映する。そこで本研究では17個のADELをもつ乳幼児の泣き声サンプルと22個の健常な乳幼児の泣き声サンプルを対象に,パワースペクトル値を説明変数とした判別分析を行う手法を提案する。しかし,すべてのパワースペクトル値を説明変数とした判別関数を求めることは計算上の困難をともなうばかりでなく必ずしも必要ではない。そこで本研究ではForward variable selection method (FSM)を提案する。FSMはF値と呼ばれる統計量を用いて変数選択を行い,判別に有用な説明変数を順番に並び替え,判別式を構築する。しかしながら,本研究で用いたサンプルは合計39と少ないため,評価結果はテストデータと学習データの分類に依存して判別精度が大きく異なる可能性がある。そのため本研究では判別精度の推定のためLOOCVと呼ばれる交差検定を用いて,ADELの乳幼児と健常な乳幼児の識別を評価する。

 結果として,学習データにおける誤判別の割合は変数の数の増加に伴ってほぼ一様に減少し,変数が10個以上では誤判別率が0となっている。これは,説明変数を増やすことで用いたサンプルをほぼ完全に判別できるモデルを構成することが可能であることを示している。また,未知のデータに対して,誤判別率の予測値は最小で0.154であり,変数が少ない場合でも0.31以下まで抑えられている。最後にフォルマントと喉の構造を考察する。

 結論として,泣き声のパワースペクトル概形を用いて,ADELの乳幼児と健常な乳幼児を識別するために有効な統計的手法が提案された。


論文審査結果の要旨

 
本論文は,言語能力の未発達な乳幼児の泣き声を対象に音響的特徴の解析手法を提案したものである。赤ちゃんの泣き声のような音声は通常の成人のスピーチ音声と異なり,テキストとしての意味情報を持たないため,従来高度に発展した音声情報技術の主たる対象とはならなかった。
 
しかしながら,赤ちゃんは言語能力が未発達であっても,泣き声によって自分の欲求や意図あるいは感情などを周囲に伝えており,乳幼児の泣き声はコミュニケーションの成立過程や感情の表出問題など音声工学としても重要な多くの未解決課題と関わっている。本論文は特に病理的疾患により咽喉部に変異をもった赤ちゃんの泣き声を取り上げ,その音響的な特徴を解析することによる病理診断の可能性を検討したものである。
 
本論文では特に,疾患乳幼児(ADEL)の泣き声と正常な泣き声サンプルのパワースペクトルをそれぞれのクラスにおけるパターンと見なし,それらの識別問題を解決するため,統計的パターン認識手法を開発している。
 
提案手法では,統計量としてF−値を採用し,識別に寄与するスペクトル成分の抽出を可能にしている点に新規性が認められる。この提案手法を論文では,疾患(ADEL)乳幼児と正常な乳幼児の泣き声の識別能力に関して,LOOCVによる交差検定によって評価した。その結果,学習能力としては100%,また予測能力に関しては80数%の正答率が得られている。
 
本論文で提案された識別手法は,予測能力に改善の余地を残してはいるが,ADEL疾患の泣き声を正常な泣き声と音響学的に識別できる可能性を示したものであり,コンピュータによるADEL病理診断技術の基盤を与えると考えられる。よって,本論文は情報工学に寄与し,博士(工学)の学位論文に値するものと認められた。