講演抄録/キーワード |
講演名 |
2020-07-02 13:05
morfawk: 形態素パターンマッチング/処理言語 ○中西恒夫・吉村賢治・乙武北斗・田辺利文・古庄裕貴(福岡大)・西浦洋一(アイシン精機) SS2020-4 |
抄録 |
(和) |
自然言語で記述されるソフトウェア開発文書のレビューに要するコストを削減するべく自然言語処理の活用が期待されている。係り受けの解析までしなくとも形態素レベルのパターンマッチングでも相当のレビューの自動化が可能である。本稿では,形態素レベルのパターンマッチングとその結果に応じた処理を行う,形態素パターンマッチング/処理言語,morfawkの言語仕様について述べる。morfawkは,形態素レベルの正規表現によるパターン記述とPythonによるアクション記述からなるスクリプトにより,校正をはじめとするパターンベースの自然言語処理を可能にする。 |
(英) |
Natural language processing is a promising scheme to reduce cost for reviews of software development documents described in the natural language. Pattern matching of morpheme is helpful enough for the purpose. In this paper, the authors describe the language specification of morfawk, a morpheme pattern matching and processing language, which performs morpheme level pattern matching and processing according to the result. morfawk enables pattern-based natural language processing including a proofreading with a script consisting of a pattern description based on morpheme regular expressions and an action description in Python. |
キーワード |
(和) |
自然言語処理 / 形態素解析 / パターンマッチング / ソフトウェア開発文書 / / / / |
(英) |
natural language processing / morphological analysis / pattern matching / software development document / / / / |
文献情報 |
信学技報, vol. 120, no. 82, SS2020-4, pp. 19-24, 2020年7月. |
資料番号 |
SS2020-4 |
発行日 |
2020-06-25 (SS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
SS2020-4 |