データ活用とその副作用

前回の記事では、いわゆるアドテクによって広告が最適化されてきており、それが一部メディアにおける質の悪い記事の大量生産という副作用ももたらしているということを書きました。(前回記事

今回はこの最適化のために用いられるデータに潜む課題と、いますべきことを書きたいと思います。

目次

はじめに

以前私は、DMP専業の国内ベンダーの代表を努めており、おかげさまで、いろいろな企業のいろいろな案件に関わらせていただいて、オンラインの広告はもちろん、アンケートやテレビ視聴率の分析、交通広告まで、ウェブの行動データと様々なデータを紐付けて、消費者、生活者の行動を可視化し、施策に繋げていくということを行っていました。

そして直近では個人情報を含むデータを活用することで、広告やメールマーケティングの最適化、自動化など、マーケティング活動の効率をあげていこうという、マーケティングオートメーションの会社を設立し、開発に取り組んできました。

データを活用することで、企業活動を効率化し、生活者に対しても有益な情報やサービスを提供していけるということに、私としては疑いの余地はありません。

それは、Google、Facebook、Amazon等の動向を見ていても明らかだと思っています。

しかし、それらのデータの取得や利用は、歪を生んでしまっているかもしれないと感じています。

データとは

まず、ここで言っているデータとは一体なんなのか。

オンライン広告やマーケティングオートメーションの文脈で言うと、そのほとんどがアクセスログです。

アクセスログは主にHTTPヘッダIPヘッダ、および、JavaScriptによって付加される情報を整理して出力されます。

このアクセスログをどのように設計して、出力し集計するか、というのはデータを取得しているサービスによって様々ですが、基本的には以下のものが含まれ、意味付けされます。

  • Cookie情報 = ブラウザを特定するIDセッション情報
  • アクセス日時 = 行動履歴滞在時間
  • アクセスしたウェブサイトのURL = 行動履歴JavaScriptによる付加情報
  • アクセスしたウェブサイトの直前URL = 流入経路(一部)検索キーワード
  • IPアドレス = 回線の種類アクセス元の組織地域等をIPデータベースから取得
  • ユーザーエージェント = ブラウザの種類OSの種類

ほとんどの広告配信やアクセス解析等のサービスは、これらの情報を利用しています。

JavaScriptによる付加情報 というのは少し特殊で、ブラウザ上でJavaScriptコードを実行することによって取得できるものは様々ですが、 Google Analyticsではこちらでその情報を開示しています。何やらたくさんあります。

これらの情報はGoogleだけが取得できるというわけではなく、情報を取得するためのJavaScriptタグをサイトに埋め込むことで、誰でも取得が可能です。

しかし、ここには性別や年齢、趣味嗜好の情報は直接含まれていません。

ではどこから取得しているのか。

GoogleやFacebookは、膨大な数の登録ユーザーがおり、ユーザーのIDと、広告用のCookieに書かれているIDは紐付けられて保存されています。

※ 誤解を招くかもしれないので、書いておきますと、GoogleAnalyticsのデータは初期状態においては広告用のIDとの紐付けは行われません

いいねボタン などのソーシャルプラグインも、単に いいね ができる便利ツールではなく、ボタンなどの表示アクセスログから誰が(正確にはどのブラウザが)どのサイトを訪れているかという情報を取得し、紐付けられています。

そして、これらの集められたデータを分析し、男性なのか女性なのか、何歳なのか、何に興味があるのかという情報を類推し、40代男性で車に興味のある人 といったターゲットを指定した広告配信が可能になっており、広告が興味のある人に届けられるようになっています。

GoogleやFacebookが広告媒体として強いのは、保有するデータ量と分析力に基づいた、ある程度の正しいデータと、ボリュームに加え、多くの人が訪れる掲載面を持っているからです。

では、こうしたデータを持っていない広告配信業者はどうやってデータを集めるのでしょうか。

そこで登場するのが DMP と呼ばれるものです。

DMPとは

DMP(データマネジメントプラットフォーム)は、Cookie等にかかれているブラウザを特定するIDと、その他のIDを紐付け、データを取り出して連携することができるものです。

一時期、DMPというものが取り沙汰され、バズワードのようになり、いまは落ち着いていますが、Cookie等にかかれているブラウザを特定するIDと、その他のIDを紐付け、データを取り出して連携するということは、オンラインでデータを活用する上で不可欠なため、広告配信システムやマーケティングオートメションなどいろいろなシステムに内包されています。

もはや、わざわざDMPと呼ぶ必要もないかもしれません。

広告配信業者やそれを利用する広告主は、DMPに情報取得タグからのアクセスログデータから導き出した趣味嗜好、顧客データベースから連携した、年齢、性別、ECサイトやカード会社からの購買履歴情報などなど、様々なデータを蓄積し、最適化を行っています。

そして、DMPがデータを連携する先は広告配信システムだけではなく、ABテストツールや、メール配信システム、顧客データベース等、様々です。

例えば、DMPのデータをメール配信システムに連携することで、メール配信システムには存在しない、性別の情報を付加し、女性だけにメールを送信する、といったことや、 顧客データベースにアクセスログを付加して、特定のページにアクセスがあったら担当営業が顧客に電話をする、ということを行っています。

※これらの蓄積したデータをDMP利用者が独占的に利用するものがプライベートDMP、非独占的に利用するものがパブリック(オープンDMP)と呼ばれていたりします。

課題

はじめに申し上げたようにデータを取得し、データを利用することで、企業や一般の生活者にとって有益な情報やサービスを提供できるようになる、ということに対しては疑いの余地を持っていませんが、

昨今のキュレーションメディアの問題と同じような構造で、 最適化に用いるデータを増やすために不正な手段でデータを収集する、不正確なデータを収集する。

ということが起きていないか、ということを危惧しています。

広告費のためにimpを増やす必要があり、impを増やすために正確ではない記事を量産する。ということと同じ構造です。

広告配信システムにデータを販売することを目的とした、DMPというものも存在します。 取得したデータをDMPに販売している広告配信システムも存在します。 DMPにデータを販売しているメディアもあります。

そして、これらはデータの流通には必要な存在ではあります。

しかし、それらは個人情報ではないという大義名分のもと、開示されないことがあります。 そして開示されないままデータとして利用されることがあります。

しかし本当に個人情報では無いのか、もっと本質的な部分でいうと、導入企業の利益に相反するものではないのか、プライバシーを侵害するものではないのか、という議論はもっとされるべきであると考えています。

そして一番の問題は、多くの企業で、導入したサービス(埋め込んだJavaScriptタグ)からデータを取得されていることに気付いていない、もしくは気付いていても、その事実を公開していないということです。

このままでは何かのきっかけに、社会問題化し、データの取得、利用自体が規制されてしまう事態になりかねません。

すべきこと

このような状況を改善するために、このような事態に陥らないために、まずは、広告主やメディアなどのサービス利用者が自社のウェブサイトで、どんなシステムにデータを送信しているか、どんなサービスを利用しているかということをきちんと把握する必要があると思っています。

そして、把握した上で、自分たちで必要なデータ送信かを選別し、また、一般の生活者にはデータを提供に関して選択の余地を与える必要があります。

しかし、一般の企業が、これを行うことは難しいと考えています。

JavaScriptタグを自分でウェブサイトに埋め込んでいる企業はまだよいのですが、そもそもウェブサイトの運用を外部に委託していたり、広告の運用は代理店に任せきりだったり、Tag Managerなどを設置し、代理店が運用していたりすると、自社で把握することは困難です。

自社のサイトにアクセスし、ブラウザの開発者ツールでどこに対してデータ送信が発生しているか確認し、そのデータ送信先が、どの企業のどのサービスかをひとつずつ確認するという作業が必要になります。

そこで、それを簡単に確認できるサービスをリリースしました。

DataSign For Enterprise

そしてデータの透明性確保やデータ保護、公正なデータ利用を推進する企業は、第三者の立場であることが必要であると考え、株式会社DataSignという会社も設立しました。

データが流通し、データを利用することによって、プライバシーが侵害されるのではなく、恩恵が受けられる世の中にしていくためには、まず、データ取得の透明性を確保することが絶対に必要だと確信しています。

そして、一般の生活者に対してはデータの提供に関して選択の余地を与えられる必要があり、提供することによって受けられる恩恵を明確にする必要があると感じています。

今後はIoTなどによって取得できるデータはますます増えていきます。この増えていくデータをしっかりと流通させ、データによる恩恵を誰もが受けられるようにし、安心してデータを利用できる、安心してデータを提供できる世の中にしていくことが、私達の使命だと思っています。

太田祐一

筑波大学卒業、マネックス証券入社、その後独立し、ニュースアグリゲーション事業を開始するも失敗、株式会社アドクラウドにて、日本初のDMPの開発に携わり、株式会社オウルデータの代表取締役社長に就任、サイバーエージェントへ売却。SATORI株式会社 Co-Founder。株式会社DataSign Founder 代表取締役社長。