講演抄録/キーワード |
講演名 |
2022-11-29 10:00
自然言語処理グラフ埋め込みによるテキストのコンテンツからリンク予測 ~ 中国語の雑誌論文を例として ~ 楊 子潁・○邵 軒磊・范 植荃・王 唯馨(台湾師範大) NLC2022-9 SP2022-29 |
抄録 |
(和) |
アブストラクト この論文は、プロジェクト「知識データベース/中国研究のグラフ」の拡張研究です。主な研究対象は、グラフ埋め込みとリンク予測により、既知のジャーナル論文から新しい研究の流れを予測することです。私たちのデータセットの課題には、引用関係は含まれていません。したがって、内部の論文の内容から関係の特徴を直接取得する場合があります。キーワード Collaboration と k-means を使用して次元を削減し、word2vec と MLP を使用して次のラウンド (年) にリンクできる 2 つのノードがあるかどうかを分類しました。最終的に、各ラウンドで 90% 以上の精度を達成できました。これは、ベースライン手法 (Adar および Jaccard スコアを使用したランダム フォレスト) よりも優れています。また、動作中の視覚化グラフも提供します。引用関係を締結しない生の参考文献データセットにパイプライン ワークフローを提供します。このワークフローは、ソーシャル メディアやその他のテキストのみのデータセットで使用できます。 |
(英) |
Abstract This paper is an extended research of the project “The Knowledge Database/ Graph of China-studies”. The main research target is to predict the new research stream from known journal papers by the graph embedding and link prediction. The challenge of our dataset does not include citation relationships; therefore, we might retrieve features of relationships from the content of the papers inside directly. We used keywords collaboration and k-means to reduce dimension, then word2vec and MLP to classify if any two nodes can link in the next round (year). Finally, we could achieve over 90% accuracy in each round which is better than the base-line method (random-forest with Adar and Jaccard score). And we also provide a visualization graph in action. We contribute a pipeline workflow to the rawer bibliography dataset which doesn’t conclude cite-relationship, and this workflow can be used on social media or other text-only datasets.
Keywords knowledge graph, link prediction, natural language processing, GNN learning |
キーワード |
(和) |
ナレッジグラフ / リンク予測 / 自然言語処理 / GNN学習 / 中国研究 / / / |
(英) |
knowledge graph / link prediction / natural language processing / GNN learning / China-studies / / / |
文献情報 |
信学技報, vol. 122, no. 287, NLC2022-9, pp. 1-4, 2022年11月. |
資料番号 |
NLC2022-9 |
発行日 |
2022-11-22 (NLC, SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2022-9 SP2022-29 |
|