LODについて(1) web上でのデータの共有

数学 機械学習技術 人工知能技術 プログラミング技術  アルゴリズム   データベース技術.  デジタルトランスフォーメーション ICT技術  セマンティックウェブ技術

LOD(Linked Open Data)は、ウェブ上でコンピューター処理に適したデータを公開・共有するための仕組みとなる。従来のウェブがHTML文書間のハイパーリンクによる人間のための情報空間の構築を目的としていたのに対して、LODでは構造化されたデータ同士をリンクさせることでコンピューターが利用可能な「データのウェブ」の構築を目指しており、セマンティックウェブの形成に重要な技術となっている。セマンティックウェブでのLODに関する4つの原則は以下のようになる。

  1. あらゆるデータの識別子としてURIを使用する。
  2. 識別子には(URNや他のスキームではなく)HTTP URIょ使用し、参照やアクセスを可能とする。
  3. URIにアクセスされた際には有用な情報を標準的なフォーマット(RDFなど)で提供する。
  4. データには他の情報源における関連情報へのリンクを含め、ウェブ上の情報発見を支援する。

これに対して、Open Knowledge Foundation(OKFN)の「Open Data Handbook」によるオープンの定義では、以下のようになっている。

A piece of content or data is open if anyone is free to use, reuse, and 
redistribute it — subject only, at most, to the requirement to attribute 
and/or share-alike.4

 (「一片のコンテンツもしくはデータは、誰もが自由に利用、再利用、再配布できる 場合にはオープンデ
ータとなる。ただし、属性や共有の面で制限があった場合には その限りではない」)

これを更にもう少し詳細に述べるとオープンデータとは「コスト負担が伴わないこと、形式は誰もが自由に利用・変形できること、利用方法や目的を制限しないこと」などの条件における「誰もが特定の制限なく自由に利用、再利用、再配布できる一片のコンテンツまたはデータ」であると定義することができる。

この定義ではオープンデータは現在、各国政府が主導していることとも絡め、公共性の高いデータであるとの解釈ができ、先述のセマンティックウェブの定義であるリンクしていれば良いというものの限定した解釈であることが確認される。

後者の政府系のオープンデータに関しては、目的としてはまず第一にあるのは情報公開「開かれた政府」を目指すための手段にある。これらは電子政府の概念とあいまって、欧米の政府や近年では日本政府でも促進されてきた。

政府系のオープンデータのもう一つの目的は、オープンデータを用いることで民間のビジネスを促進するというものにある。これは例えば米国のオープンデータプロジェクトであるPresidential Innovation Fellows(PIF)の中で以下のように述べられている。

Open Data Initiatives: Stimulating a rising tide of innovation and entrep-
reneurship that utilizes government data to create tools that help Ameri-
cans in numerous ways – e.g., apps and services that help people find the
 right health care provider, Identify the college that provides the best
 value for their money, save money on electricity bills through smarter 
shopping, or keep their families safe by knowing which products have been
 recalled. 

(オープンデータイニシアチブ: 政府のデータを利用して米国市民を様々な方法 で支援できるようなツー
ルを開発するというイノベーション、アントレプレヌアシッ プ(起業家精神)の出現を刺激する。具体的には、
米国市民が適切な医療サービ ス機関を見つけられるようなアプリケーションやサービス、学費に見合った
教育 が受けられる大学を見つけられるようなアプリケーションやサービス、スマートな 購買を通して電力
料金を節減できるようなアプリケーションやサービス、使用製品のリコール状況を確認でき家族の生命の
安全を守れるようなアプリケーションやサービス、の開発を促進させる)

このように情報開示という側面だけではなく、企業のデータと組み合わせたビジネスイノベーションを起こさせるという側面をもったオープンデータでは以下に示すような様々なビジネスが展開されている

  • BrightScope :ビジネス(金融)、確定拠出年金プランに関する各種情報を提供するWebサービス、連邦政府機関や業界組織が公開する関連データを活用
  • Zonability:ビジネス(不動産)、不動産会社や不動産購入者向けに特定不動産の用途地域情報を可視化するアプリケーション。各自治体が公開する空間データ、GISデータ、用途地域に関する登録情報などを活用。
  • Total Weather Insurance:ビジネス(保険)、農業向け作物被害をカバーする保険サービス。気象データ、作物収穫データ、土壌データなどを解析して作物被害リスクを割り出し、リアルタイムで保険商品を生成。
  • Melon:ビジネス(エネルギー)、商業ビルの管理者やオーナーが、自らのビルの電力効率を示す標準指標「Ebergy Star Scope(Energy Starのベンチマーク評価結果)」を確認できるサービス。
  • iTriage:ヘルスケア、患者が症状の治療に関して最適な医療機関を選択できるなど、医療サービスの利用時に適切な意思決定ができる機能を持つ情報アプリケーション。医療機関に関するオープンデータを利用。
  • Community Clash:ヘルスケア、都市対抗で健康状態を競い合うソーシャル型カードアプリケーション。全米各地域の各種健康関連のデータ指標を活用。
  • Mom Maps:コミュニティ、近隣の子供と利用しやすい公共施設を検索・確認できるモバイルアプリケーション。各自治体が公開する公共施設データを活用・
  • Routesy:コミュニティ、San Francisco市近郊のBay Area地域の主要な公共交通機関の運行状況をリアルタイムで確認できるアプリ。同市が公開する公共交通機関運行データをかつよう。
  • DataMasher:オープンデータ支援ツール、政府機関によるオープンデータへの取り組みを有効化できるよう、民間にオープンデータを利用してできることを伝えるという啓蒙的な目的を持った、オープンデータのマッシュアップ活用サービス。
  • Junar:オープンデータ支援ツール、政府機関が保有データをオープンデータとして公開する際のウェブベースのパブリッシングプラットフォームを提供する。
  • CrimeReport:コミュニティ、警察当局に代わり各地の発生犯罪状況などのデータをリアルタイムでマッピング表示し、民間が近隣の犯罪状況などを確認できるようにするアプリケーション。
  • FlyOnTime.us:米国の商用航空網のオンタイムパフォーマンス(定時運行性)情報を空港ベース、航空会社ベースで確認できるサービス。政府機関が公開する航空関連データ、気象データなどを活用。
  • PlantMaps:気象、農務省の植物耐寒性地域区分図データをインタラクティブにマップ表示する単純な可視化サービス。
  • Many Bills:政治、米国議会の法案文書を少しでもわかりやすく表示するという目的のもと、議会の法案内容をトピック化・可視化するWebサービス。
  • Congress API:政治、 New York Timesが主にオープンデータベースに蓄積した独自データベース内のデータのうち、国会議員や議会に関する各種情報をサードパーティに提供するためのAPI。

日本国内だと、最も著名な統計的データベースは、E-STATとなる。これは総務省が整備し、独立行政法人統計センターが作成したもので「国土・気象」「人口・世帯」「労働・賃金」「農林水産業」「鉱工業」「商業・サービス業」「企業・家計・経済」「住宅・土地・建設」「エネルギー・水」「運輸・観光」「情報通信・科学技術」「教育・文化・スポーツ・生活」「行財政」「司法・安全・環境」「社会保障・衛生」「国際」「その他」の17の項目からなる統計データが公開されている。

次回はこのESTATを使ったGISデータのハンドリングについて述べたいと思う。

コメント

  1. […] RDF(Resource Description Framework)は、以前LODでも述べた、ウェブ上にあるリソースのメタデータを技術する枠組みであり、W3Cにより1992年2月に規格化されたものとなる。 […]

  2. […] 前回、LODを実現するRDFデータのデータモデルと具体的なデータ構造について述べた。今回はそれらをハンドリングするデータベースであるRDFストアと、RDFストアからデータを抽出するクエリ体系であるSPARQLについて述べる。 […]

  3. […] Semantic Web技術とは「Webページの意味を扱うことを可能とする標準やツール群の開発によってワールド・ワイド・ウェブの利便性を向上させるプロジェクト」(出典Wikiペディア)であり「現在の「ドキュメントの網」から「データの網」(出典Wikiペディア)にWeb技術を進化させるモノでもある。 […]

  4. […] RDF(Resource Description Framework)は、以前LODでも述べた、ウェブ上にあるリソースのメタデータを技術する枠組みであり、W3Cにより1992年2月に規格化されたものとなる。 […]

タイトルとURLをコピーしました