2019年もよろしくお願いします。平成も残す所3か月となりました。2018年までのデータサイエンティストの振り返りとこの言葉の意味することについて改めて考えてみたいと思います。

ここ数年色々なデータサイエンティストの方とお会いしたり彼らのインタビュー記事を拝見する度に違和感を覚えることがありました。

  • 分析よりもコードを書いている時間が長い
  • データクリーニングにあまり時間を書けない(もしくはしない)
  • ポジションを取らない(ポジションを取るとは出てきた結果からビジネスに資する”自分の意見”を述べること)

など彼らのWork Styleが私の考えているデータサイエンティスト像とは異なるもののように感じたのです。それから偶然この記事

https://analytics-and-intelligence.net/archives/3578?fbclid=IwAR01Ndsizq2PlIkdz1dyBTrv1HUN8F4KrZnx0jwVR3O6n2kNUuPj8nw0jkw

拝見して自身の違和感が言語化されすっきりしました。私からみた「彼ら」はAIエンジニア(若しくは機械学習エンジニア)であって私はデータ・アナリストだったのです。(今更気付いたのか?)アメリカのフットボールとヨーロッパのそれ、アマレスとプロレス、和也と達也、これらの関係のように2つは似て非なるものなのです。

(参考)データ分析とインテリジェンス https://analytics-and-intelligence.net

機械学習エンジニアとデータ・アナリストの違い

ミッションの違い

https://analytics-and-intelligence.net/archives/174をご参考頂ければと思います。概ね私の感覚と一致します。

スキルの違い

機械学習エンジニア
  • プログラミングの知識
  • 統計学/機械学習/AIの知識
  • それをサービスに実装できるスキル
データ・アナリスト
  • プログラミングの知識
  • 統計学/機械学習/AIの知識
  • ビジネスを遂行するための以下のスキル
    • 課題整理/仮説立案
    • プレゼンテーション能力
    • プロジェクトマネジメント

スキルはかなり重複しています。これはミッションさえ適切に与えれば一人の人間が双方の役割を担うことが可能である事を示唆しています。

自分の話になりますが私は元々データ・アナリストとして仕事をしていましたが2013年に事業会社に移って最初の仕事は自社プロダクトへの機械学習モデルの実装でした。プロダクト周りのエンジニアの方の協力もありましたが、多少手こずったはものの無事モデルを実装しました。

どっちのミッションも対応できる、これこそがまさに私が考えるデータサイエンティスト像です。

章まとめ

AIエンジニアとデータ・アナリストの違いはミッションの違いである。スキル的にはその両者の違いは認識されていなかった。

分化の過程

いつから分化したのか?

2013年私が分析コンサルから始めて事業会社に来た時にはまだ機械学習エンジニアという職種はなかったと記憶しています。古くからあるデータ解析のキャリアを持つ方がweb系を中心としてプロダクトを実装したりしていました。全くエビデンス無しで申し上げて恐縮なのですが、その2年後くらいから機械学習エンジニアみたいな人が増えてきた印象です。要因としては関連本が多数出版されたり勉強会が各地で開催されるなどTechGeekな人たちを中心に技術の伝播が行われたからと思われます。

何故分化したのか?

データサイエンティストは稼げるなど少々吹聴された情報が出回っていた時期があります。その真偽は置いておくとして、とりあえず「セクシーな職業」だとか「何とか学は最強の学問」だとか色々、華やかでクールなイメージが先行したのです。先ほどTechGeekな人たちを中心に技術の伝播が行われたと述べました、彼らはとても勉強が好きです。プログラミングや数学にも抵抗はありません。当然データサイエンティストになろうと思う人間がいても不思議ではありません。大好きなプログラミングと数学を勉強してその先に高給?が待っているならばーーと考えることは十分理解できます。

結論から申し上げると彼らが2013年以降の機械学習エンジニアとなったのです。分化したのではなくデータサイエンティストは純増したのです。現在アナリストと機械学習エンジニアの割合は体感1:9くらいだと思います。1は2013年以前も以後も多少の変動はあれど一定数ですが、9は今後もっと増える可能性があります。業界の先駆者が少数派となり駆逐されるのは盛者必衰の理をあらわすのでしょうか。(盛者であったことはない気がするのですが)

章まとめ

データサイエンティストは分化したのではなく、従来のデータアナリストに機械学習エンジニアが加わった。それは2013-15年あたりから目に見えるようにTechGeekな人たちを中心に起こった。今後も機械学習エンジニアが増え続ける、データ・アナリストは少数派となる。

では何故アナリストが増えないのか?

需要供給双方に原因があると考えます。まず需要者がその必要性を認識していないというのがあります。一方で機械学習エンジニアについても需要者は同じように明確に必要性を認識していないのですが、周りが必要といっているため必要というロジックにより一定数の人材を自社に置いておくために(青田買い)相応の需要が断続的に存在しています。また実際にPythonとかでコードを書いているのでサービス業の無形性がクリアされ、仕事をしている感が伝わりやすいというのもあります。

次に供給者ですがまず誤解を恐れずにいうならば機械学習エンジニアになるだけならば圧倒的にデータ・アナリストより簡単です。理由はある程度のレベルであれば市販の教科書やオンライン学習サービスで十分勉強できること、そしてある程度のレベルでもごまかしが効くことです。巷の広告で「3ヶ月ブートキャンプを行い未経験から機械学習エンジニアへ」みたいなものをよく見かけることもこの主張を支持します。

ここからは憶測ですがプログラミング講習と請負先を探す業者が最近増えてきました。彼らにとって機械学習エンジニアという商材は非常に実入りの良いものだと考えられます。3ヶ月缶詰である程度のレベルに仕上げて、比較的他言語プログラマより給与相場が高い人材市場に売り込みその鞘を得られるからです。需要/供給そして供給者育成者各々の要因が重なり機械学習エンジニアは増えたのです。

データアナリストが増えない理由はこの逆と考えて間違いないでしょう。

  • サービスが分かりにくいため需要喚起を積極的に行うスキルがないと仕事がない
  • 勉強しようにも教材がない(OJTが一番なのですが)
  • 対顧客であるため厳しい要望を受ける。ある程度レベルではごまかせない
  • 育成のノウハウがないため育成事業や講座事業を行う事業者がない

一方でデータアナリストにも希望があるはずです。

次回は希望について

 

 

投稿者プロフィール

株式会社Crosstab 代表 漆畑充
株式会社Crosstab 代表 漆畑充
当ブログは【アナリティクスやデータの総合的な活用を通じて「未知の知」の獲得に貢献する】株式会社Crosstabが作成しています。

筆者について
2007年より金融機関向けデータ分析業務に従事。与信及びカードローンのマーケテイングに関する数理モデルを作成。その後大手ネット広告会社にてアドテクノロジーに関するデータ解析を行う。またクライアントに対してデータ分析支援及び提言/コンサルティング業務を行う。
統計モデルの作成及び特にビジネスアウトプットを重視した分析が得意領域である。
お問い合わせは株式会社Crosstabまでお願いいたします。