本記事の対象者は以下を想定しています。

  • 事業会社のBizdev担当
  • 事業開発に近いデータサイエンティスト
  • 上記ポジションのヘッド
  • 事業開発コンサルタント

事業における価値創出の重要性

ビジネスにおけるAI・データサイエンス活用の肝はそれらを実現する技術の獲得だけではなく、活用した事業から価値創出を行う事です。AmazonやNetflixはユーザの購買履歴データより高精度なレコメンドを行い、ユーザ一人一人に対して最適な顧客体験を提供する事で価値創出を実現しています。また最近ではスマホのカメラでレシートや領収書を撮影しユーザが入力する手間を省くサービスなどがあり、これらは人間を付加価値の低い作業から解放することでそれを実現しています。一方でAI・データサイエンスで取り合えず何かを予測・分類してみただけでは当然の事ながら価値はほぼないです。優れた画像認識AIであっても猫・犬(別に何でもよいのですが例として)を高速大量に識別できる事のみでは価値がなく、それを用いて価値を創出する事ができなければ「それはすごいですね。でそれで?」と言われてしまうでしょう。このように技術獲得だけでは不十分でそれを活かした価値創出できるかが企業のAI・データサイエンス導入の成否を分けます。

価値創出効果の定量化が必要

一方で昨今の事例ではどのように活用しそれがどれくらいの価値を創出するかを十分に検討せずにPoCを行い案の定成果がみられないため(というか成果を数値で説明できない)経営陣がAIへの投資を見送るという事態を招いている現場もあると聞きます。

これには色々な理由があります。①技術的な話、そもそも当初考えていたほどの精度ではなかった②そもそもデータが足りていなかった③企画がダメ④①-③をクリアしたがその費用対効果を算出できないなどです。私は今日本の企業(特に大企業において)の課題は④であると考えます。何故ならば価値創出を行う事が肝要であると冒頭のべましたが、他方ではその価値自体を客観的に判断する指標(費用対効果)がないため評価する事ができないからです。同じような例として人事評価面談において達成目標は数値目標にしなさいと言われたかたも皆さんの中には多いと思います。これは定量的な数値でないと評価できないからそうしているのです(それが妥当な目標かはさておき)

余談ですが、経営者や担当役員(特に日本の大企業)はキャッシュフローベースの投資効果での説明に馴れています。例えば工場の拡張の場合では拡張後の操業稼働率と生産性からその費用対効果-すなわちROI-を算出しそれを元に意思決定の参考とします。当然経営者はAI・データサイエンスへの投資も同様に評価したいはずですがそれに該当する数値がない以上判断を保留せざるを得ません。

AI・データサイエンスROIを考える

ここで少し価値という言葉が持つ意味について軽く整理しておきます。価値は各人それぞれの解釈があると思いますが本稿ではビジネスの通念上経済的価値とし、それは測れるものであるとします。

通常の設備投資ではROIを計算することで意思決定の参考にします。ROIは様々な定義がありますが使った費用に対しての収益の割合とざっくり定義します。前節でも述べたようにAI・データサイエンスの活用に対しても同様にROIを考える事で④の課題に対応することが可能です。そのために収益と費用を予め算出します。費用は大きく人件費、ソフトウェア及びクラウド資源の費用そしてランニングコストに分けられます。多分もっと詳細に分けられるとは思いますが収益ほど抽象的ではないので大まかに整理しています。次に収益を考えます。収益はビジネスのパターンによって考え方が異なります。そのためにまずはAI・データサイエンス活用ビジネスを3つのパターンに分類します。

ビジネスの類型を3つに分ける

収益性の評価のためにざっくりですが3つのクラスに分けます。必ずしもMECEにはなっていません。(今後もう少し良い分類方法を考えたいです)

(筆者作成)
A型はシンプルです。一般的に聞くAIの事例の多くがこちらです、夢のある話である事と分かりやすいためよく事例として用いられます。B型はややレガシー感がある内容ですが、全てビジネス上の意思決定の根拠としてAI・データサイエンスを用いています。具体的には上から融資を行うかどうか、当該PVに広告を出すか、ユーザのアクセスにどの商品を出すか、内定を出すか、ある層に対して介入を行うかなどです。ビジネスによる意思決定は不確実性が伴えば大小は問わずリスクです。リスクテイク型は適切にリスクを取るためにそれらを活用していると言えます。

類型ごとに収益(創出価値)を測定するには

A-1型は既存の人員代替ですので単純にその人件費の削減分で計算できます。RPAと言われている分野は社内における付加価値の低い作業から従業員を解放しより生産性を向上させると期待されていますが、生産量/投下労働量とするとそれは当然の期待と思えます(但し分母を小さくして生産性を上げるのが良いか、分母一定で分子を上げるのが良いか時代の要請にもよると考えます。現代のように幸福が余暇の多さと考える人が増えれば前者が歓迎されるはずです)

A-2型はサービスの向上におけるプロダクトの単価、ユーザの増加またはその両方の増加が期待できます。医療僻地支援などの短期的な金銭では換算ができないバリューもあります。

私自身A型については多くの方がその価値を論じていますしあまり深く言及するつもりはないですが、B型については明確なヴァリエーションの方法を考えると意外に面白いので少し私の考えを述べます。

B型の価値創出の計算

比較的システマティック(?)に行います。なお以下の収益算定のための費用はAI・データサイエンス投下資本とは別の変動費です。

融資の貸倒の例

実際に銀行は保証会社にリスクを投げていたりするので本来はこの通りでは必ずしもないのですが融資収益は
融資収益:=(貸付金利-調達金利-貸倒率)*融資残高
となります、仮にとても良い貸倒率の予測モデルができたとして、それが従来の貸倒率を1%改善したとします。融資残高が100億円であればおよそ年間で1億円の融資収益の改善になります。このようにB型は明確に収益計算ができます。さらにその収益の改善はモデルの改善に依存しこの例ですと融資残高が大きければ大きいほどこの効果が絶大です。

インターネット広告によるクリック率やコンバージョン率の予測

広告を出稿する企業にとって広告によって獲得したユーザの収益は
収益:=imp数*ctr*cvr*LTV-imp数*(imp単価)
となります。従ってクリック率やコンバージョン率を予測し、一定以下の場合impをしないとする事で全体平均のctr/cvrを上げる事で収益を向上させることが可能となります。これも先ほどと同様でimp数を多く買い付けることができる企業ほどその効果の恩恵を受けることができます(また別のところで述べたいのですが、このctr/cvrを予測したのが誰かによって価値の配分が異なるようにできます。ctr/cvrが高いimpを算出したのが媒体社や広告会社であるならば、それをimp単価に上乗せできます。この時の上乗せの限界を簡単に計算できます)
次どんどん行きます

ECにおけるレコメンド

これは先ほどの広告の例とほぼ同じです、
収益 = ユーザ訪問回数*ユーザ購入率*単価
です費用部分がないのはオウンドメディアなので機会損失以外発生していないと考えるからです。一見すると何がリスクテイクしているのか分かりにくいのですがユーザ訪問一回に対しどのコンテンツを表示するかは小さいながらも意思決定です、このとき機会を逸するリスクを取っていると考えられます。一方でユーザビリティとのトレードオフも考えることができるので、もう少し踏み込んでユーザ訪問回数を予測するモデルを作成するとより精緻になるでしょう。

内定辞退率

先月ある有名な就職プラットホームが退職予測データを企業に販売していた事で大炎上したのは記憶に新しいと思います。問題となったのは個人情報保護法が定めた外部提供の本人同意を取得せずに外部へ販売した事、また同意を取得していた場合でもその説明に不備があり意図しない同意をした学生が多かった事などです。
当然個人情報保護の観点から自らが預かり知らぬところで個人情報が使用されるのは許される事ではありません。しかしその経済的便益があるからこそ購入しようとする企業がいた訳で、それを計算することは本案件の善悪とは別だと思いますので、同じように考えて計算してみます。
さっきまでと少し変わります。問題を簡単にするためにある企業は面接1回で内定を決めオファーを出します。オファーには一定の人件費などのコストがかかるとします。n人採用予定の企業の費用は
費用=n人採用するまでにオファーをだす人数*オファーコスト
です。内定辞退率というパラメータが上には出てきませんが、n人採用するまでにオファーをだす人数は実は負の二項分布に従い、その平均はn/(1-辞退率)で求まります。
従って採用活動のコストは
費用=(n/(1-辞退率)*オファーコスト
です。辞退率を予測しその値が低い申込者のみに内定を出すことで費用を抑えることができ、そしてそれが実際にいくらの効果があったかを算出することができます。オファーの申し出は辞退リスクを伴います。nが大きい大企業ほど効果の程度が大きいことは言うまでもありません(実際に購入した企業の一部は自らその事実を公表していましたが大企業ばかりでした)。
次最後です。

webサービスにおいて離脱率、そして介入効果を予測する

応用問題です。
まず離脱予防における収益構造を確認します。
収益 := 介入対象者*(介入前離脱率-介入離脱率)*介入後LTV-介入コスト*介入対象者

これが応用問題であるのは加入し離脱率が減少する打ち手がすでにあるというのが前提であるからです。介入効果層の判別をまず行い介入コストと効果を試算します。推定するモデルが複数であるため応用問題となっています。補足ですが上の収益は介入を行わない場合と比べての収益です。ワンパターンですが介入対象者とLTVが大きいほど改善のインパクトが大きいです。

B型の特徴

  • いずれもその企業のスケールの大きさに比例する
  • パラメータの予測精度が収益の改善にダイレクトに作用する
  • 定量的な数値で算出されるため客観的である
  • また定量的であるためデータ/モデル作成/運用のバリューチェンの付加価値案文を検討できる。(これから情報銀行が本格的に営業を開始する場合、バリュチェーンの一番はじめに来るはずである、その時値付けのロジックを持つことは大変重要である)

少し勢いで書いたため、読みづらいですがB型のこの考えをベースにすると新規事業のアイデアは浮かんで来ると思います。自社でリスクテイクしているものは何か?それを支配するパラメータは何か?そのパラメータは推定できるか?そしてそれは制約付の最適化問題として解けるか?などを考えながら行うことが重要です。

個人的な考え

将来的にこのバリュエーションがより精緻になればAI投資におけるNPVが算出できて、それを元にしたファイナンスが可能になるかもしれません。
因みにこれはかなり金融機関の考え方を応用しています。
スケールメリットが大きいので公衆衛生などにも応用ができるかと思います。

データビジネス開発支援のコンサルティングご依頼については
株式会社Crosstabまでご連絡いただければと思います。