2021年3月2日に開催した「滋賀データ活用LAB研究フォーラム」の一環で、「滋賀データ活用LABのこれまでとこれから」と題したパネルディスカッションを行いました。

登壇者

パネラー

  • 酒井道 滋賀県立大学 地域ひと・モノ・未来情報研究センター長
  • 下山紗代子 一般社団法人リンクデータ 代表理事
  • 宇野雄哉 内閣官房 まち・ひと・しごと創生本部事務局 参事官補佐
  • 伊藤祐聖 立命館守山高校

ファシリテーター

  • 蒲生仙治 滋賀データ活用LAB 座長

データ活用が広がっていくために

蒲生:2050年にカーボンニュートラル、2030年にはSDGsの実現、2025年には行政情報システムの標準化、近々にはデジタル庁の設置が実現し、Society5.0が進んでいくーー、そして現在においてもDX、デジタルイノベーションが叫ばれているなか、データ利活用は重要なテーマになると考えています。このような中、滋賀県地域情報化推進会議では平成30年度から「滋賀データ活用LAB」を立ち上げ、企業と行政機関それぞれが持ち寄る情報をデータ整備し、それを活用しあう環境づくりをしてまいりました。特に今年は「観光」「交通」というテーマで行いました。

そこで、この地域情報化推進会議の会長で、今年度の「滋賀データ活用LAB」の研究にも携わっていただいております酒井さんから、今年度の研究で得られた気づきや、課題で思われていることをお話いただけますでしょうか。

馴染みのある滋賀のデータを用いて、様々な分析手法があること、使えることを知ってもらう

酒井:多くの民間企業から普段拝見できないような種々のデータをご提供いただき、分析させていただいたのは、非常に貴重な経験になりました。何より学生が分析に参加したことで、次世代の若者にそういう生のデータを触れさせる経験ができたのは、我々大学教員としても非常に嬉しいと思っています。

今回私の研究室では、毎月の宿泊に関する滋賀県内6つの地域ごとのデータ3年分を、また県内3地域10台のタクシーに関する分単位のGPSデータ1か月分をいただきました。

(滋賀県立大学 発表資料)

宿泊データについては、例えばお正月のあたりに初詣の方で増加したり、5月の連休に観光客の方で増加するなど、滋賀県ではどの地域も季節ごと月ごとにデータがリンクしていたのですが、京都府の宿泊データも同様に分析してみたところ、いつ頃に宿泊客が増加するというデータが地域ごとにバラバラだったことがわかりました。そのような傾向を踏まえると、滋賀県と京都府とで観光施策の打ち方は全然変わることになると思うのです。

そのような傾向が、クラスター分析を行うことによって具体的に見えてきた。当たり前に見えることを分析してみたら隠れた意味が見えてくる。シンプルに見えるデータについて、いま一度分析手法を変えてみるということが重要だったのだなと思います。

また、タクシーのデータについては、統計的なものではなくタクシー一台一台がどう動いたかというものでした。そうすると今度はミクロな見方ができる。彦根地域であれば彦根駅を中心にタクシーが動きますし、病院へのタクシー利用もやはり多い。一方で滋賀は工業県でもありますので、朝夕は工場立地地域への流れが鮮明に見えるんですね。今回我々は非縁行列因子分解という数学的な手法を使ったのですけれども、その手法で客観的かつ自動的に分析できることもわかりました。

このような様々な分析手法について、馴染みのある滋賀のデータを用いて「こういうやり方もあるんだ」と気づいていただけるようご説明できたのかなと思いますし、今後も是非やっていきたいなと思っています。

データ分析の事例を公表しあう

下山:新しい情報は組み合わせてこそ得られ、そこに価値があると思っています。私ももともと生物学が専門だったのですが、生物学の分野はいち研究室で実験するだけでは新しい発見はありません。蓄積されているデータベースと研究結果と、それを比較できる環境があってこそ、はじめて研究は進められるものです。私は割と早くそのような経験をしていたところ、もう少し広い分野でみたときに全然データが共有されていない状況を知って愕然としたところもあり、オープンデータというものに携わるようになったという経緯がありました。

このようなデータ分析を、一般の企業や市民団体が自分たちの活動のために使っていける状況にするためには、まずはオープンデータが出てくることが重要です。しかしまだまだ質も量も確保できていないのが現状だと思います。

また、データ公開され、次に皆さんが困るのが「データはあるが何をすればよいかが分からない」という点です。その際、今回研究していただいたような分析事例自体をオープンに公開していただくのが良いと思います。いま政府でも「Data StaRt」という、初めて分析に取り組む自治体職員向けのデータ分析事例集が整備されています。そういった所にも今回の分析事例を公表していただくなど、より皆さんが見られるような場所にこういった分析事例を出していただけるといいなと思います。

データから議論を始める

宇野:「RESAS」は2015年にスタートして、もう6年が経ちます。私は2019年から広報担当者を中心に「RESASを使ってください」と言って啓発する仕事に携わっているのですが、自分ではRESASだけではなくデータ分析全般を普及させるつもりでやっています。

最近大事だと感じることは、例えば商工団体の方などが会員の方などに「V-RESAS」を見せて「この業界全体の状況に比べて、あなたのお店はこういう状況だから、こうした方がいいんじゃないですか」と、話の入口にデータを持ってくるということです。全然難しい分析でなくてもよいと思うので、データから議論を始めることが、議論の質を上げることに繋がるのではないか。簡単なことを当たり前にやっていくことが大事なのではないかと思っています。

あと、既に与えられたデータだけでは分析をするにも限界があると思っています。ですので、今回の「滋賀データアイデアチャレンジ」のように、まずデータを取りに行くという姿勢が大事なのかなと思います。

データは意思決定するために使うもの

伊藤:酒井さんが先ほど「普段いただけないデータを触らせてもらって面白かった」と仰いましたが、「普段いただけないデータになっていること」が既に勿体無い気がします。なぜ普段からいただけないのだろうと。普段からいただけるデータになっていれば、データの時系列が伸び、回帰分析できるようにもなります。しがらみがあることは感じつつも、それを受け入れてはいけないということは言っていきたいと思います。

あと、宇野さんが「議論の最初にデータを持ってくる」と仰ったことは自分もその通りだなと反省するところがあったのですが、「そもそも議論の最初にデータを使うのは何のためでしたっけ」ということも考えた方がよいと思います。何のデータを出し、使うのか、目的がないとよく分からなくなるからです。

データという語源は「議論・計算などの前提」というラテン語にあるそうで、つまり意思決定の材料です。論理的な意思決定にデータを使っているわけなので、どのように人間がデータを活用することで、議論になる議論を行っていくのかというところが大事だと思います。

蒲生:普段からデータを簡単に使いたいということですね。何となく大人の感覚で、データを閉じ込めすぎてしまっているということがあるのかもしれません。

下山:自治体職員や市民団体の方、市民のなかにもいろんな属性があります。それぞれ捉えている尺度が違うなかで、数字などの客観的な指標を用いることで、一度目線を合わせたうえで議論することが重要だと思うんですよね。

スペインのバルセロナ市では公害問題が大きくなっていたところ、人間中心社会にしていくという政策の舵きりがありました。そこで車が通れる道を制限していくという大胆な政策をとろうとしたところ、その合意形成を行うために、街中にあるセンサーのデータからシミュレーションを行い、この施策を行えばどれくらい課題が改善するかということを一つずつ数値として出していったという事例があります。日本でもそのような合意形成が進められるようにしたいなと強く思っています。

「健康」×「データ」

蒲生:来年度の滋賀データ活用LABは「健康」というテーマで進めようと思っています。滋賀県は環境問題に早くから取り組んでいて、環境と経済の両立を進めてきました。そんななか、国においては「人生100年時代」を、また滋賀県知事も「健康しが」を掲げています。身体と心の健康、豊かな人生を送るということについて、健康というテーマは非常に重要だと思っています。

健康というテーマでは特に様々なステークホルダーがデータを持ち寄ることになってきます。その際に考慮しておくことや成果の展開、また見えやすいようで見えにくい健康というデータの取扱いについて、皆さんからご意見を伺いたいと思います。

一次情報をオープンに、活用可能にしていく

下山:新型コロナウイルス感染症の情報については、オープンデータにするかどうかは自治体によって判断が分かれるところでした。これにはいくつか考え方があるんですが、陽性者の属性など、粗い情報ではありながらも個人を特定できる情報に繋がるという理由で慎重になる姿勢は確かにあると思います。また、センシティブな情報のため、オープンデータにするということは「誰でも自由に加工して、可視化したりサービスに使ったりできる」ということなので、そこで慎重になるということも感覚としてわかります。

ただ、あまり慎重になりすぎて公開しないという選択をしてしまうと、社会全体が成長する機会を奪っていることにもなると思っています。

もちろん間違った可視化をしたり、解釈を間違ってデータを使ってしまうケースは出てくると思います。ただ、公表されているグラフに対して間違った解釈で広めてしまう方がいても、きちんとデータが一次情報としてオープンになっていることで、「元データをちゃんと見るとこうでしたよ」と指摘する方が出てきます。行政側で一次情報がわかりやすい形で出ていること、検証可能になっていることがやはり重要だと思います。

なかなか行政側の観点を切り替えるのは困難だと思うのですけれども、社会全体がアップデートしていくためにも、オープンデータにして活用できるようにしていくという考えを持っていただきたい。すべてオープンにしろということではないのですが、どうやったら活用可能になるかという観点で考えていただくという点が重要かなと思います。

蒲生:あまり慎重になりすぎると事が進まないということなんですよね。

データを出すメリットとデメリットを伝え、合意形成していく

宇野:あくまで個人としての意見ですが、医療や健康に関するデータはセンシティブなものですので、そういうデータは一度問題になったら取り返しがつかないんですよね。データを提供する側にとってはすごく勇気のいることで、やはり慎重にやっていかざるを得ないのだろうなとは思っています。

その際、「こういう目的で使うから、こんないいことがあるよ」などと、データを出すメリットとデメリットを比較衡量して伝えて、慎重に社会の合意形成をしていくことが、今の日本では大事なんだろうなと思います。

蒲生:特に健康というデータ群になりますと、健康診断から運動、食事など、いろんな切り口があります。ステークホルダーが多岐にわたるため、そういう合意形成が重要で、何のためにやるのかということが求められている気がします。

使いやすいデータになっているか点検をする

伊藤:一方で滋賀県のデータを見にいくと、オープンデータのカタログページがあるのですが、そこのページが軒並みWordとかPDFとかになっていて、開発者にとって「やめてください」と思ってしまうデータがたくさんあって。「健康」をテーマにするのであれば、一度県が出しているデータの点検をする機会があればよいのではないかと思います。

僕らがアプリ開発をするとき、「こんなデータがあればいいな」と思って検索して出てきたものが、機械で判読しにくいものだと大変なのです。開発者の世界では、なるべくデータの更新などを自動で運用できるようにすることが持続可能で良いことだとされています。機械によって定期的にデータを更新するとか、更新されたら自動でデータを取りに行くとか、そういう機械どうしのインターフェースも含めて考えることが良いこととされています。そのような環境が整っていくことで、開発者側のモチベーションも上がり、より新しいものが出てくる可能性が高くなります。

つい先ほどツイッターで、天気予報のAPIを公開しているという情報が話題になっていて、僕のまわりの開発者たちがめちゃくちゃ喜んでいたので、恐らくもう暫くしたらそれを使った面白いものが出てくるのかなと思うんですけれども。そんな感じで開発者にとって使いやすいデータがあることが裾野を広げていくことになると思います。

蒲生:データでもサマライズされたものだと何も面白くなくて、IoTのようなセンサーの生データ群が大量にあれば、どう分析できるのかということに繋がっていきますし、多様なデータの掛け合わせが可能になると思うんですけれども、データの出し方も重要なことだと感じました。

他分野のデータと連携して使いやすくしておく

下山:多様なデータが組み合わせ可能になっているか、使える状態になっているかというのは、特にステークホルダーが多い健康のような分野においては、健康だけではない他分野のデータと繋げて使わなければいけない場面がたくさん出てくるはずです。

特に健康系のサービスで課題になるのは、健康に意識を持っていない方にどう意識を持ってもらえるかというところですが、そういった場合に他分野のデータと連携して使いやすくしておくという発想が必要になってきます。機械判読性を高めておくとか、他分野と繋がりやすいように予めデータモデルを設計しておくという観点が必要になってくると思います。

行政は縦割りで「ここの分野だけで」と考えてしまうところがあると思いますが、全体的に設計を統一しておくということがすごく重要な視点だと思います。

蒲生:例えば食材はスーパーマーケット等から買うわけですから、そういった店舗のデータまで扱うことになる可能性がありますよね。

酒井:民間企業を中心として経済が動く以上は、クローズドなデータは避けられません。秘密にすべきものは秘密にしましょう、でも可能であればまずは統計情報から出していきましょうというのでもよいと思うんですね。パーソナルデータが難しければまずは統計情報を出して、それをみんなで使ってみながら、「この部分をこう突っ込んでみたらこれだけ意味のあることが導けそうだ」ということを確認しあい、法律整備も含めて議論していくことを、時間はかかりますがやっていきたいと思います。

そんな議論を滋賀県でできるようになれば、夢のようですよね。是非ともそういう流れでいきたいなと夢見ております。