講演抄録/キーワード |
講演名 |
2010-07-22 14:00
地方議会会議録における政治的カテゴリの自動推定手法の提案 ○乙武北斗(福岡大)・渋木英潔(横浜国大)・木村泰知(小樽商科大)・高丸圭一(宇都宮共和大)・森 辰則(横浜国大) NLC2010-1 |
抄録 |
(和) |
本論文では,地方議会会議録における議員の各発言がどの政治的カテゴリに属するかを推測する手法を提案する.議員発言の政治的カテゴリを推測する問題は,1つのアイテムに0個以上のカテゴリを付与する多重ラベリングによるテキスト分類問題とみなすことができる.我々は,会議録の特徴を考慮して,Cascadingの考え方に基づく分類器の連結と,対象テキストをサブテキストに一度分解しての判定を行うことで精度の向上を試みる.平成19年度小樽市市議会会議録を対象とした実験において,提案手法は適合率70.8%,再現率66.9%を達成した.Cascadingの考え方の導入に基づく段階的な分類により,再現率の低下を招いたが,提案手法におけるサブテキストに一度分解しての判定は,分類性能の向上に有効であることが明らかとなった. |
(英) |
In this paper, we propose a method for estimating political categories in minutes of local assemblies. We can consider a problem of estimating political categories in minutes as a text classification problem with multiple labeling. With features of local assemblies considered, we show improvements of the estimation accuracy using classifiers concatenation based on "Cascading" and dividing a target paragraph with multiple categories into sentences. In the experiments, we achieve 70.8% precision and 66.9% recall. The performance of this method is higher than those without division of a paragraph. |
キーワード |
(和) |
テキスト分類 / 多重ラベリング / テキスト分割推定 / Cascading / 地方議会会議録 / / / |
(英) |
Text categorization / Multi-category labeling / Segmented text categorization / Cascading / Local assembly minutes / / / |
文献情報 |
信学技報, vol. 110, no. 142, NLC2010-1, pp. 7-12, 2010年7月. |
資料番号 |
NLC2010-1 |
発行日 |
2010-07-15 (NLC) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2010-1 |