|
タジマ ヤスヒロ
YASUHIRO TAJIMA
但馬 康宏 所属 データサイエンス学部 データサイエンス学科 職種 教授 |
|
| 言語種別 | 日本語 |
| 発行・発表の年月 | 2013/03 |
| 形態種別 | 学術雑誌 |
| 査読 | 査読あり |
| 標題 | 言語モデルの違いによるHMMを用いたテキストセグメンテーションの性能比較 |
| 執筆形態 | 単著 |
| 掲載誌名 | 情報処理学会論文誌数理モデル化と応用(TOM) |
| 出版社・発行元 | 情報処理学会 |
| 巻・号・頁 | 6(1),38-46頁 |
| 担当区分 | 筆頭著者 |
| 著者・共著者 | 但馬 康宏 |
| 概要 | HMMによるテキストセグメンテーションの問題について,HMMの状態が表す言語モデルを変化させることによる性能の変化を示す.一般にHMMでテキストをモデリングする場合,各状態は単語ユニグラムを言語モデルとして段落を表現する.これに対して本論文では,複数の単語をとりまとめて1つの出力記号とする手法を複数提案し,その性能の変化を考察する.評価実験の結果,1文を出力記号単位とし,単語がその文章に含まれるか否かを確率として持つナイーブな言語モデルが高い性能であることが明らかとなった.また提案手法は,本論文における設定よりも利用できる情報が多くなる教師あり学習の枠組みによるアルゴリズムの性能にはおよばないが,従来法である単語ユニグラムモデルを利用するHMMの性能を上回ることが確認された. |
| ISSN | 1882-7780 |
| NAID | 110009552317 |
| PermalinkURL | http://id.ndl.go.jp/bib/024421432 |
| researchmap用URL | http://id.nii.ac.jp/1001/00091252/ |