機械学習技術 関係データ学習 Clojure デジタルトランスフォーメーション技術 人工知能技術 自然言語処理技術 セマンティックウェブ技術 オントロジー技術 知識情報処理技術 確率的生成モデル 本ブログのナビ
ナレッジグラフの概要と国際学会(ISWC)での関連発表のまとめ
ナレッジグラフ(Knowledge Graph)とは、情報をグラフ構造で表現したものであり、人工知能(AI)の分野において重要な役割を果たすものとなる。ナレッジグラフは、複数のエンティティ(例えば人、場所、事物、概念など)が、その間の関係性(例えば「AがBを所有する」、「XはYの一部である」、「CはDに影響を与える」など)を持っているという知識を表現するために使用される。
具体的には、ナレッジグラフは、検索エンジンの質問応答システムや、人工知能の対話システム、自然言語処理の分野において重要な役割を果たしている。これらのシステムは、ナレッジグラフを利用して、複雑な情報を効率的に処理し、ユーザーに正確な情報を提供することができる。
ナレッジグラフは、ウェブ上の情報を自動的に収集して構築されることが多く、Googleの「Knowledge Graph」や、Microsoftの「Concept Graph」などが有名なものとなる。また、企業や団体内部での情報管理や、医療分野での知識ベースの構築にも利用されている。さらに近年は”知識グラフとビッグデータ処理“等でも述べているように、自然言語処理技術や機械学習技術を活用して、それらナレッジグラフを自動で生成する活動も活発に行われている。
ナレッジグラフを実現するためには、以下のような技術が必要となる。
- セマンティックWeb技術: ナレッジグラフを構築するためには、構造化されたデータを表現する方法が必要となる。そのため、セマンティックWeb技術を利用して、データをRDF形式で表現することが一般的である。RDFは、エンティティ(主にノード)とその属性(主にラベル)を関係性(主にエッジ)でつないだグラフ構造で表現される。セマンティックウェブ技術の理論や具体的な実装に関しては”セマンティックウェブ技術“にて述べている。
- 自然言語処理技術: ナレッジグラフを構築するためには、自然言語処理技術を利用して、自然言語の文章から情報を抽出する必要がある。具体的には、固有名詞や述語、意味的な関係性などを識別し、RDF形式に変換することが必要となる。自然言語処理技術の理論や具体的な実装に関しては”自然言語処理技術“にて述べている。
- データ統合技術: ナレッジグラフを構築するためには、様々なソースからのデータを統合する必要があります。そのために、データ統合技術を利用して、異なる形式のデータを統合し、一つのナレッジグラフとして表現することが必要となる。これらは主に単語や文の類似性を機械学習技術を用いて統合していくこととなる。意味的なデータ統合のアプローチとしては”オントロジーマッチング技術について“にて、データベースの統合としては”Schema Matching and Mapping“にて述べており、また機械学習的なアプローチとしては”深層学習技術“や”グラフデータ処理アルゴリズムと機械学習/人工知能タスクへの応用“等で述べられている。
- ナレッジエンジン ナレッジグラフを利用するためには、ナレッジエンジンが必要となる。ナレッジエンジンは、ナレッジグラフから情報を取得し、検索や推論、質問応答などの機能を提供するためのエンジンとなる。ナレッジエンジンには、SPARQLクエリ言語を利用することが多く、ナレッジグラフ内のデータに対する複雑なクエリを実行することができる。知識情報へのアプローチは”知識情報処理技術“で述べており、RDFストアやSPARQLに関しては”RDF ストアとSPARQLについて“にて、検索技術の理論と実装に関しては”検索技術について“にて、推論技術に関しては”推論技術“にて述べてある。さらに質問応答技術に関しても”チャットボットと質疑応答技術“にて述べられている。
以上のような技術を組み合わせることで、ナレッジグラフを実現することができる。ただし、ナレッジグラフの構築には、多くのデータを収集し、正確に変換する必要があるため、高度な技術と多くのリソースが必要となる。
ナレッジグラフに機械学習技術を適用することで、より精度の高いナレッジグラフを構築し、その利用価値を高めることができる。以下に、ナレッジグラフに機械学習技術を適用する方法について述べる。
- エンティティリンキング: エンティティリンキングとは、異なるデータソースから得られたエンティティ情報を結びつける技術となる。自然言語処理技術と機械学習技術を用いることで、エンティティの特徴を学習し、異なる表記方法、異なるカテゴリーのエンティティなどを同一のエンティティとしてリンクすることができる。エンティティリンキングを実現することで、ナレッジグラフ内のエンティティ同士を自動的に結びつけ、より豊富なナレッジグラフを構築することができる。エンティティリンキング技術には、”OpenNLP“や”自然言語処理の各種ツールの紹介“等で述べている様々なオープソースの自然言語処理ツールの中にあるNER(Named Entity Recognition)モジュールを使って単語へのラベル付けを行ったり、”トピックモデル“で述べている文章へのトピックの割り付けを行い、それらのトピックやラベルを”関係データ学習“や”グラフデータ処理アルゴリズムと機械学習/人工知能タスクへの応用“で述べられている機械学習の手法を用いてリンク付けを行う。
- リレーションシップ抽出: ナレッジグラフにおいては、エンティティ間のリレーションシップが重要な情報となる。機械学習技術を用いることで、自然言語のテキストからリレーションシップを抽出することができる。例えば、あるエンティティが「AはBを所有している」という文脈で出現した場合、そのエンティティ間に所有のリレーションシップがあることを抽出することができる。これにより、ナレッジグラフに新たなリレーションシップを追加することができる。リレーションシップ抽出に関しては前述の”関係データ学習“や”グラフデータ処理アルゴリズムと機械学習/人工知能タスクへの応用“で述べられている機械学習の手法を用いて行うものや、”論理やルールと確率/機械学習の融合“で述べられている論理データと確率モデルを組み合わせた機械学習技術を用いることで実現される。
- エンティティ分類: ナレッジグラフにおいて、エンティティには様々なカテゴリーがあります。例えば、人物、組織、場所などがある。機械学習技術を用いることで、自然言語のテキストからエンティティのカテゴリーを自動的に分類することができる。これにより、ナレッジグラフにおいて、エンティティのカテゴリーに基づいた検索や分析が可能となる。エンティティ分類は前述の”OpenNLP“や”自然言語処理の各種ツールの紹介“等で述べている様々なオープソースの自然言語処理ツールの中にあるNER(Named Entity Recognition)モジュールを使ったり、”トピックモデル“で述べている文章へのトピックの割り付けを行ったりすることで実現できる。
- 推論エンジン: ナレッジグラフを用いることで、エンティティ間を推論することにより新たな関係を見出すことができる。論理データとナレッジグラフを組み合わせることで”ルールベースと知識ベースとエキスパートシステムと関係データ“で述べているようなエキスパートシステムを使った推論が可能となる。また”メタヒューリスティクスの数理 読書メモ“で述べているような様々なメタヒューリスティクスアルゴリズムや”確率的生成モデルについて“を用いたフレキシブルな推論の実現、”様々な強化学習技術の理論とアルゴリズム“や”バンディット問題の理論とアルゴリズム“に述べているような強化学習的なアプローチの適用も可能となる。さらに”統計的因果推論と探索“に述べているような因果推論を行うことも視野に入れることができる。
ナレッジグラフを用いた応用としては、いかに示すような様々な分野での応用事例がある。
- 検索エンジン: ナレッジグラフは、検索エンジンの精度を向上させるために利用される。ナレッジグラフは、エンティティとその間のリレーションシップをグラフ状に表現することで、検索クエリに対してより正確な回答を提供することができる。例えば、ユーザーが「テニスの試合に出場した選手」というクエリを入力した場合、ナレッジグラフは、テニスの試合に出場した選手のエンティティを特定し、その選手が出場した試合の情報や他の関連するエンティティを提示することができる。
- 自然言語処理: ナレッジグラフは、自然言語処理においても利用される。自然言語処理においては、機械が自然言語のテキストを解釈することが必要となるが、その際にナレッジグラフを用いることで、エンティティの抽出や関連するリレーションシップの抽出などを行うことができる。
- ロボティクス/IOT: ナレッジグラフは、ロボットの自律的な行動に利用される。ロボットが周囲の環境を認識するためには、周囲の物体の種類や配置に関する知識が必要となるが、ナレッジグラフを利用することで、ロボットが自己位置を特定し、周囲の環境を理解することができる。
- データ分析: ナレッジグラフは、データ分析においても利用される。ナレッジグラフを利用することで、データ間の関係性を可視化し、データの相互作用や傾向を分析することができる。例えば、ある商品の販売数と天候の関係性をナレッジグラフ上で分析することで、商品の販売戦略の改善や天候予測の精度向上などが可能となる。
以上のように、ナレッジグラフは様々な分野での応用が期待されており、近年AI系の国際学会でも活発な発表がおこわれている。以下にそれらの一例としてセマンティックウェブ技術の国際学会であるISWC(International Semantic Web Conference)でのナレッジグラフ関連の発表についてまとめたものを示す。
下図に年度ごとの傾向を示す。傾向としては、2018年〜2020年に大きく発表が伸びている。(google knowledge graphの発表は2012年)
<ISWC2021>
- Workshop on Deep Learning for Knowledge Graphs (DL4KG)
- Tutorial: Tools for Creating and Exploiting Large Knowledge Graphs (KGTK)
- Tutorial: Completeness, Recall, and Negation in Open-World Knowledge Bases
- On constructing Enterprise Knowledge Graphs under quality and availability constraints
- Towards Semantic Interoperability in Historical Research: Documenting Research Data and Knowledge with Synthesis
- Leveraging Knowledge Graph and DeepNER to Improve UoM Handling in Search
- Assessing Scientific Conferences through Knowledge Graphs
- Knowledge Graphs to help with Data-driven Clinical Decision-making
- A Healthcare Knowledge Graph-based Approach to Enable Focused Clinical Search
- Improving Knowledge Graph Embeddings with Ontological Reasoning
- Using Compositional Embeddings for Fact Checking
- LiterallyWikidata – A Benchmark for Knowledge Graph Completion using Literals
- Wikibase as an Infrastructure for Knowledge Graphs: the EU Knowledge Graph
- A Graph-based Approach for Inferring Semantic Descriptions of Wikipedia Tables
- Fast ObjectRank for Large Knowledge Databases
- SemTab: Semantic Web Challenge on Tabular Data to Knowledge Graph Matching
- Towards Neural Schema Alignment for OpenStreetMap and Knowledge Graphs
<ISWC2020>
- 13th International Workshop on Scalable Semantic Web Knowledge Base Systems (SSWS2020)
- Pattern-based knowledge base construction (OTTR)
- Common Sense Knowledge Graphs (CSKGs)
- How to build large knowledge graphs efficiently (LKGT)
- Refining Node Embeddings via Semantic Proximity
- Enriching Knowledge Bases with Interesting Negative Statements
- Covid-on-the-Web: Knowledge Graph and Services to Advance Covid-19 Research
- PreFace: Faceted Retrieval of Prerequisites using domain-specific Knowledge Bases
- Generating Referring Expressions from RDF Knowledge Graphs for Data Linking
- AI-KG: an Automatically Generated Knowledge Graph of Artificial Intelligence
- Crime event localization and deduplication
- Contextual Propagation of Properties for Knowledge Graphs: A Sentence Embedding Based Approach
- Explainable Link Prediction for Emerging Entities in Knowledge Graphs
- LM4KG: Improving Common Sense Knowledge Graphs with Language Models
- Enhancing Online Knowledge Graph Population with Semantic Knowledge
- Facilitating COVID-19 Meta-analysis Through a Literature Knowledge Graph
- The Virtual Knowledge Graph System Ontop
- KGTK: A Toolkit for Large Knowledge Graph Manipulation and Analysis
- Generating Compact and Relaxable Answers to Keyword Queries over Knowledge Graphs
- KnowlyBERT – Hybrid Query Answering over Language Models and Knowledge Graphs
- BCRL: Long Text Friendly Knowledge Graph Representation Learning
- Schímatos: a SHACL-based Web-Form Generator for Knowledge Graph Editing
- Squirrel – Crawling RDF Knowledge Graphs on the Web
- FunMap: Efficient Execution of Functional Mappings for Scaled-Up Knowledge Graph Creation
- Fantastic Knowledge Graph Embeddings and How to Find the Right Space for Them
- ExCut: Explainable Embedding-based Clustering over Knowledge Graphs
- A Knowledge Graph for Assessing Agressive Tax Planning Strategies
- Turning Transport Data into EU Compliance while Enabling a Multimodal Transport Knowledge Graph
- Enhancing Public Procurement in the European Union through Constructing and Exploiting an Integrated Knowledge Graph
- Leveraging Semantic Parsing for Relation Linking over Knowledge Bases
- Nanomine: A Knowledge Graph for Nanocomposite Materials Science
- Generating conceptual subgraph from tabular data for knowledge graph matching
- Knowledge Graphs and Creative Applications
- Adaptive Low-level Storage of Very Large Knowledge Graphs
- Relation-Aware Entity Alignment for Heterogeneous Knowledge Graphs
- Multi-view Knowledge Graph Embedding for Entity Alignment
- Learning Triple Embeddings from Knowledge Graphs
- Temporal Knowledge Graph Embedding Model based on Additive Time Series Decomposition.
- PNEL: Pointer Network based End-To-End Entity Linking over Knowledge Graphs
- Knowledge-Based Approach for Structuring Cyclic ML Pipelines in the O&G Industry
- Semantic Integration of Bosch Manufacturing Data Using Virtual Knowledge Graphs
<ISWC2019>
- How to Make Latent Factors Interpretable by Feeding Factorization Machines with Knowledge Graphs
- Using a KG-Copy Network for Non-goal Oriented Dialogues
- Canonicalizing Knowledge Base Literals
- Mining Significant Maximum Cardinalities in Knowledge Bases
- HapPenIng: Happen, Predict, Infer—Event Series Completion in a Knowledge Graph
- Skyline Queries over Knowledge Graphs
- Incorporating Literals into Knowledge Graph Embeddings
- Extracting Novel Facts from Tables for Knowledge Graph Completion
- Difficulty-Controllable Multi-hop Question Generation from Knowledge Graphs
- Non-parametric Class Completeness Estimators for Collaborative Knowledge Graphs—The Case of Wikidata
- Pretrained Transformers for Simple Question Answering over Knowledge Graphs
- Learning to Rank Query Graphs for Complex Question Answering over Knowledge Graphs
- THOTH: Neural Translation and Enrichment of Knowledge Graphs
- Query-Based Entity Comparison in Knowledge Graphs Revisited
- TransEdge: Translating Relation-Contextualized Embeddings for Knowledge Graphs
- Capturing Semantic and Syntactic Information for Link Prediction in Knowledge Graphs
- VLog: A Rule Engine for Knowledge Graphs
- ArCo: The Italian Cultural Heritage Knowledge Graph
- Making Study Populations Visible Through Knowledge Graphs
- FoodKG: A Semantics-Driven Knowledge Graph for Food Recommendation
- Extending the YAGO2 Knowledge Graph with Precise Geospatial Knowledge
- The SEPSES Knowledge Graph: An Integrated Resource for Cybersecurity
- QaldGen: Towards Microbenchmarking of Question Answering Systems over Knowledge Graphs
- Benefit Graph Extraction from Healthcare Policies
- Knowledge Graph Embedding for Ecotoxicological Effect Prediction
- A Pay-as-you-go Methodology to Design and Build Enterprise Knowledge Graphs from Relational Databases
<ISWC2018>
- Hybrid techniques for knowledge-based NLP – Knowledge graphs meet machine learning and all their friends
- Building Enterprise-Ready Knowledge Graph Applications in the Cloud (EKG)
- Contextualized Knowledge Graphs (CKG)
- Scalable Semantic Web Knowledge Base Systems (SSWS)
- Scalable Semantic Web Knowledge Base Systems (SSWS) Posters & Demos
- EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs
- Representativeness of Knowledge Bases with the Generalized Benford’s Law
- Knowledge Graph Solutions in Healthcare for Improved Clinical Outcomes
- Elsevier’s Healthcare Knowledge Graph and the Case for Enterprise Level Linked Data Standards
- Using Knowledge Graph to improve enterprise search experience
- Populating the FLE Financial Knowledge Graph
- Knowledge-based Question Answering for DIYers
- Exploring RDF/S KBs Using Summaries
- Combining Truth Discovery and RDF Knowledge Bases to their mutual advantage
- Content based Fake News Detection Using Knowledge Graphs
- Fine-grained Evaluation of Rule- and Embedding-based Systems for Knowledge Graph Completion
- KADE: Aligning Knowledge Base and Document Embedding Models using Regularized Multi-Task Learning
- Rule Learning from Knowledge Graphs Guided by Embedding Models
- Enriching Knowledge Bases with Counting Quantifiers
- That’s Interesting, Tell Me More! Finding Descriptive Support Passages for Explaining Knowledge Graph Relationships
- Reshaping the Knowledge Graph by connecting researchers, data and practices in ResearchSpace
- Debiasing Knowledge Graphs: Why Female Presidents are not like Female Popes
- L’Inking You To A Knowledge Graph
- Synthesizing Knowledge Graphs from web sources with the MINTE+ framework
- Explaining and predicting abnormal expenses at large scale using knowledge graph based reasoning
- Querying Large Knowledge Graphs over Triple Pattern Fragments: An Empirical Study
- Effective Searching of RDF Knowledge Graphs
- Getting the Most out of Wikidata: Semantic Technology Usage in Wikipedia’s Knowledge Graph
<ISWC2017>
- KGC: Constructing Domain-specific Knowledge Graphs
- Provenance Information in a Collaborative Knowledge Graph: an Evaluation of Wikidata External References
- Entity Comparison in RDF Graphs
- Meta Structures in Knowledge Graphs
- Business intelligence Using the Knowledge Graph Built over the Russian Legal Entities Registry
- VICKEY: Mining Conditional Keys on Knowledge Bases
- A Corpus for Complex Question Answering over Knowledge Graphs
- Attributed Description Logics: Ontologies for Knowledge Graphs
- Completeness-aware Rule Learning from Knowledge Graphs
- Knowledge Graph Refinement: A Survey of Approaches and Evaluation Methods
- PDD Graph: Bridging Electronic Medical Records and Biomedical Knowledge Graphs via Entity Linking
- Matching Web Tables with Knowledge Base Entities: From Entity Lookups to Entity Embeddings
- Automated Fine-grained Trust Assessment in Federated Knowledge Bases
<ISWC2016>
- Unsupervised Entity Resolution on Multi-type Graphs
- Ontologies for Knowledge Graphs: Breaking the Rules
- Exception-Enriched Rule Learning from Knowledge Graphs
- Knowledge Representation on the Web Revisited: The Case for Prototypes
<ISWC2015>
- Effective On line Knowledge Graph Fusion
- Adding DL-Lite TBoxes to Proper Knowledge Bases
- Content-Based Recommendations via DBpedia and Freebase: A Case Study in the Music Domain
- Explaining and Suggesting Relatedness in Knowledge Graphs
- Type-Constrained Representation Learning in Knowledge Graphs
- Publishing Without Publishers: A Decentralized Approach to Dissemination,Retrieval,and Archiving of Data
- Building and Using a Knowledge Graph to Combat Human Trafficking
<ISWC2014>
<ISWC2013>
コメント
[…] ナレッジグラフの概要と国際学会(ISWC)での関連発表のまとめ […]
[…] ナレッジグラフの概要と国際学会(ISWC)での関連発表のまとめ […]