オープンデータデイ2014 

 オープンデータデイin北九州に参加した。
 2012年7月に総務省のIT総合戦略本部で「電子行政オープンデータ戦略」が決定して以来、オープンデータについてウォッチし始め、2013年3月7日に福岡アジア都市研究所で開かれたセミナーにも参加したが、当時の日本における動向は、「データシティ」としていち早く名乗りを上げた福井県鯖江市()と、政令指定都市では横浜市()だけが先行して取り組んでいる観があった。
 しかし、この1年ほどで状況は大きく変わってきた。経産省はOpen DATA METIを立ち上げ、総務省は昨年12月にデータカタログサイトdata.go.jpのβ版を公開。地方の動きも、都道府県として初めてデータカタログサイトを公開した静岡県(⇒ふじのくにオープンデータカタログ)や室蘭市(⇒むろらんオープンデータライブラリ)、あるいは昨年初頭ビッグデータ・オープンデータ活用推進協議会を発足させた武雄市・千葉市・奈良市・福岡市でも具体的な活動が開始し、実際にサービスとして役立ちそうなアプリの開発例もいくつか登場するようになった。
 公共データを活用するアイデアソン、ハッカソン等をおこなうオープンデータデイも、2013年が8都市のみの参加だったのに対し、今年は33都市と一気に増加した。
 そこで、なぜいまオープンデータへの流れが起こっているのか、自分の理解のためにも以下の4つの文脈で整理しておこう。これらは相互に結びついている。

 ①公共機関の情報公開・透明化の動向
 ②行政と市民の協働への方向性
 ③ビッグデータの潮流
 ④セマンティックWEBの潮流

 ①については、すでに行政サイドは統計部署や広報部署を抱え、それぞれが統計データや広報紙等をネットで公開しているではないか、と思われる方も多いだろう。しかし、問題はデータへのアクセシビリティや機械可読性である。マイクロソフトのWinXPサポート終了問題でも明らかなように、一民間企業のデータフォーマットだけに依存することはリスクを抱えることである。少なくともデータはcsvで保存すべきで、理想を言えば、④にもからむがRDF形式やAPIでの提供が望ましい。
 それというのも、データスキーマの統一性という問題がある。たとえば鯖江市における取組では、鯖江トイレマップというアプリを開発したが、これが「いいね!」となって、カーナビで全国どこに行っても最も近い公衆トイレの位置が把握できるようなアプリにしようと思っても、ある自治体では便器の数の記載が男女別になっていなかったり、障がい者用トイレの記載を省略していたり、となると混乱のもとである。しかし、現状では管理する住民の「住所」一つとっても、例えばある自治体のある部署では、県名と市区町村名を分けて管理していたりしていなかったり、XX丁目○○番地と記載されたりハイフンで結ばれていたりする。こうした点の共通化については、共通語彙基盤プロジェクトが始動したが、全国の自治体からは「まーた国はメンドーな仕事増やしやがって!」という担当者の声が聞こえてきそうだ。細々したことをトップダウンで統制する試みはあまりうまくいった例は少ない。成功に導くには、担当者それぞれが「統制」の本質的意味を理解することが肝要である。とはいえ、始めなければ始まらない。まずは「住所」「イベント情報」「公共施設」について統一する方向であることが伺える。
 公共機関はなにも中央政府や地方自治体だけではない。たとえば、Wiredの記事によると、世界銀行は世界開発指標のほか、経済・貿易・貧困・保健・教育等の分野に関わる8,000件以上のデータを無料で利用可能にした。日本の公的金融機関や教育機関、通信事業者、輸送機関、電力・ガス会社、医療機関、報道機関も、公共の利益に資するデータを公開しなければならない。

 ②の「協働」は、行政単独、市民単独では解決できない地域の問題を、行政と地域住民が協力しあって課題解決に向けた取り組みをおこなう、という方向性だ。ここでは、それまで公開していなかったデータを開放し、既存データも加工しやすい形にすることで地域の問題解決を呼びかける、という意味合いで、ソーシャルビジネスにもデータジャーナリズムにも拡がる話だ。

 ③のビッグデータは、都会の大企業や先進的な企業に勤める者、大学生を含むある程度の教養層にはすでに周知の言葉だが、地方の小規模企業の経営者や専業主婦主夫、高齢者など、いわゆる「一般市民」を対象とすると、知名度はまだまだ高くない。池上彰の番組で街の人にインタビューしたところ、知名度はわずかだったように記憶している。その「一般市民」こそが、最も行政サービスに密接に関わる人びとだったりする。
 とはいえ、グーグルのチーフエコノミスト、ハル・ヴァリアンが「今後10年で最もセクシーな仕事は統計家」と発言したことや、西内啓の『統計学が最強の学問である』が30万部を超えるベストセラーを記録したことに見られるように、ビッグデータ/データマイニングのシーンはさらに盛り上がりを増している。統計学に由来する実験計画法は、実験心理学や実験経済学、工学分野ではすでに必要不可欠だが、さらには、回帰分析やクラスター分析、コンジョイント分析といった統計分析手法を用いたデータマイニングが、マーケティングからゲノム解析、ウェブのアクセスログ解析などさまざまな領域で盛んにおこなわれるようになってきた。
 また、ハーバート・ギンタスの『ゲーム理論による社会科学の統合 (叢書 制度を考える)』のように、主に経済学分野で研究されてきたゲーム理論や意思決定理論をベースとして、統計学、進化理論、認知科学等の最新の知見を取り込んで社会科学の統合をめざす試みも始まっている。それはアカデミズムの内部だけに関わることではない。ゲーム理論や意思決定理論は、「限定合理性」や行動経済学――カーネマンの『ファスト&スロー』が昨年初頭に話題になった――の洗礼を受けた上でもなお(否、だからこそなおいっそう)、実際のビジネスや教育・政策立案・司法・行政等の現場において、意思決定や理論武装、課題解決を支援するツールとして、期待が集まっている状況がある。
 いずれにせよ、公共セクターの各部署が率先してデータを公開することで、さまざまな課題を解決する糸口の発見や、ビジネスチャンスの拡大につながることが期待されている。オープンイノベーションにまでつながれば最高だろう。
 例えば、アメリカではThe Climate Corporationが、農務省の公表する過去60年にのぼる2平方マイル単位での土壌情報や収穫量データ、国立気象サービスが提供する地域ごとの気象データ等を解析し、地域毎・作物毎に収穫被害確率を導き出して農業保険商品を販売、大きな成功を収めている。当社は昨年11月、アグリビジネスの世界トップ企業、モンサントにおよそ11億ドルで買収された。

 ④のセマンティックWEBは、URLやHTTP、HTMLなどWWWの主要部分を設計したティム・バーナーズ=リーが10年以上前から提唱してきたものだ。現在のWEBで使用されているHTMLの大部分が"見映え"をタグでマークアップするのに対し、セマンティックWEBではXMLで"意味"をマークアップする。XMLはほとんど有効に使われていないよね、と言う人もいるが、それはオントロジーなどといったセマンティックWEBの実現に必要な諸条件が整備されていなかったせいでもある。
 オープンデータでは、初期段階では既存データをCKAN等を用いたデータカタログサイトにアップするという施策があるが、将来に向けてRDFやRDF Schema、OWLといった「標準」に則ったデータにすることが望ましい。全世界の公共セクターがオープンデータに取り組むことで、セマンティックWEB化を促進することにもなる。ウェブ技術者やプログラマーにとっても、オープンデータを用いたアプリを開発することで、将来的なセマンティックWEBの方向性に関わっていくというメリットがあるだろう。

 以上のことからうっすらと見えてくるのは、先端的なインターネットやシステム開発、より優れたプログラミング、数理的手法を推し進める世界的な「知的勢力」が思い描くテクノユートピアの姿だ。彼らはおもに、フランシス・ベーコンあたりからのイギリス経験論的伝統を継承し、コンピュータや人工知能を産んだフレーゲ―ラッセルらの数理・論理哲学の潮流を背景に生まれてきた人びとだ。
 各分野の膨大なデータがネット上に吸い上げられ、自動的に収集されたデータが数理的な手法で処理され、あらゆる紛争や社会問題が解決に導かれて人類の多くが「幸せ」になる世界。気象データなどから食物生産のあり方も決定され、人類すべてにとって少なくとも衣食住と基本的な「欲望」(全ての欲望というところまでは手に負えないにせよ)が満たされる世界。
 もちろん、それはあくまでもユートピアであって、実現には数多くのボトルネックが存在する。人間の感情はさまざまな課題を解決する上で最も大きなボトルネックの一つだろう。実際にそれが各国の紛争のもとになり、全体的な軍縮の妨げになっている。ただそれも長期的に見れば、各国の主導層が知的に啓蒙され、ゲーム理論の応用で積極的に解決しようという空気さえ醸造できれば、妥協点は見つけられるだろう。
 あとは他人との競争意識や「誇り」の問題など。労働する必要がなくなったとき、人はいかに長大な時間を前にして、自己破壊に陥らない健康的な「ヒマつぶし」ができるか。認知科学の進歩により人間の感情や行動が究明されれば、「小人閑居して不善をなす傾向」や「機械がすべてを解決することそれ自体への不安と恐怖」「問題が解決されればそれまでは些細なことでしかなかったことが「問題」化される傾向」だって数理的・医学的に解決されるかもしれない。「ユートピア」の認知的実現、という課題――。

 ということで、オープンデータデイに参加。最近はR言語の実行環境やRMecabをインストールして統計処理やテキストマイニングの真似事をして遊んでいるので、もう少し踏み込んだ話を期待したが、第1回ということもあり、幅広くメンバーを募ってのアイデアソン。たしかに、多くの市民を巻き込んで、優れたアイデアに立脚した「使える」アプリを開発することこそが、オープンデータの方向性を推し進める原動力になる。見知らぬ者同士がグループを組んでアイデアを出しあう経験は久しぶりのことで、なかなか面白かった。90年代初頭にテレビ朝日の深夜番組で『金曜プレステージ~東京ソフトウォーズ』という、波頭亮、坂井直樹、久保田達也を審査員としてプラニングバトルを行う番組があって、実はちょっと参加したことがあるのだが^^;その雰囲気を想いだしてしまった。
スポンサーサイト