タジマ ヤスヒロ   YASUHIRO TAJIMA
  但馬 康宏
   所属   データサイエンス学部 データサイエンス学科
   職種   教授
言語種別 日本語
発行・発表の年月 2013/03
形態種別 学術雑誌
査読 査読あり
標題 言語モデルの違いによるHMMを用いたテキストセグメンテーションの性能比較
執筆形態 単著
掲載誌名 情報処理学会論文誌数理モデル化と応用(TOM)
出版社・発行元 情報処理学会
巻・号・頁 6(1),38-46頁
担当区分 筆頭著者
著者・共著者 但馬 康宏
概要 HMMによるテキストセグメンテーションの問題について,HMMの状態が表す言語モデルを変化させることによる性能の変化を示す.一般にHMMでテキストをモデリングする場合,各状態は単語ユニグラムを言語モデルとして段落を表現する.これに対して本論文では,複数の単語をとりまとめて1つの出力記号とする手法を複数提案し,その性能の変化を考察する.評価実験の結果,1文を出力記号単位とし,単語がその文章に含まれるか否かを確率として持つナイーブな言語モデルが高い性能であることが明らかとなった.また提案手法は,本論文における設定よりも利用できる情報が多くなる教師あり学習の枠組みによるアルゴリズムの性能にはおよばないが,従来法である単語ユニグラムモデルを利用するHMMの性能を上回ることが確認された.
ISSN 1882-7780
NAID 110009552317
PermalinkURL http://id.ndl.go.jp/bib/024421432
researchmap用URL http://id.nii.ac.jp/1001/00091252/