日々のあれこれφ(..)

もっぱら壁打ち

『データ分析人材になる』を読んだ

1週間くらいで読むつもりだったのですが、GWを挟んだのと、旅先で別の本に浮気したのもあって結局2週間後読み終わりました😇

読書ログもブログに付けていくことを検討しているのでお試しで。

データ分析に限らず、システム開発や人とやり取りする他の仕事にも応用できそうなことがたくさん書いてありました。

この本に書いてあること

  • 7割がデータ分析を成功させるための思考法のフレームワーク
    • 教科書的な方法論ではなく、筆者が今まで体験した失敗例や成功例も合わせて載っており、実践に取り込みやすそうだった
  • 残り3割が上記を応用したデータ分析人材育成論
    • これも筆者の業務経験ベースで、教育フローだけでなくツールや環境を整備したり、能力を身につけ成果を出した人は市場に沿った給料を与えるようにする、と言ったことまで触れられていた
  • データ分析の具体的な手法に付いては書かれていない
  • 想定読者:データサイエンスの領域に踏み込まざるを得ないビジネスマン(文理問わず)

筆者について

  • 三井住友海上火災保険会社のデジタル戦略部の社員4人が共著したもの
  • 内二人は元々営業で、データサイエンスは独学で勉強して30歳くらいにデータサイエンティストとして働くようになったような人もいる

読んだきっかけ

とある技術ブログで紹介されているのを見て、なんとなく興味を持ったからなのですが、もう少し言語化するとしたら以下なのだと思います。

  • 私自身ひょんな事からデータ分析基盤の開発運用チームで仕事をするようになり、業務を通して必要なことは都度キャッチアップしていったのですが一方で、そもそもデータ分析基盤について体系的な知識*1を持っていないという課題感があった
  • それとは別にワークマンのエクセル経営みたいなものに興味があって、タスク管理面など普段の自分の仕事にも考え方を取り入れて実践できないか悩んでいて、本に書いてある内容に興味を持った

読書ログ

(斜体) になっているのは個人の感想です。

  • 5Dフレームワーク:データ分析を成功させるための思考法のフレームワーク

    • Demand:依頼元の要求を聞く
    • Design:設計。期間や予算を踏まえ、やることやアウトプットを定める
    • Data:データを集める
    • Develop:開発。集めたデータを分析する
    • Deploy:結果を依頼元に共有し、次の行動に繋げてもらう
  • p26 多くの企業が直面している課題(8):データ分析に対する組織の認識や文化の差

    • (ちょうどここに書いてあるのと同じ問題を前職で見たことあったのを思い出した。(人事系の部署が「簡単な集計をデータ分析」と考えていて「データ分析はこっちでやっています」と言っていて、データサイエンティストが「違うんだけど、どうしたら伝わるんだろう...」と頭を抱えているような))
  • Demand:分析の価値は意思決定の背中を押す

    • (同じことを以前私も指摘されたことがあった。レポート画面の設計をしていて、レビューした先輩から「そのレポートを見て、見た人は次にどんなアクションに繋げられるの?」と。)
  • Design:目的、仮説、データ、手段を整理する

  • p92 有意差:誤差を超えた、意味のある差のこと

  • p92 モデリング:構造化すること。予測するロジックを作ること

    • 例:タピオカ屋の場合、性別・年代別の来店期間を予測するロジックを作ること
  • p101 適切なサンプリングをしていれば少ないデータ量でも意味のある結果を得ることは可能

    • (こういうのもっと知りたい。統計学とかになるんだろうけど、果たして手を伸ばせるか...?)
  • p133 AIが役に立つケース:要因が分からなくても予測できればいいというケース。例えば、体の動きだけで不審者を特定する、離脱しそうな会員を特定する、など

  • p135 データ分析会社に依頼する際の注意事項

    • 課題が不明点であることなど、多くの場合は発注側に問題がある
    • いきなり外部に依頼せず、まずは自分で5Dフレームワークを一通り実践してみて、できない部分のみを依頼するようにする
    • 課題感を明確に伝え、渡せる情報は共有し、具体的な提案を求める
    • スケジュールと役割分担を明確にする
  • p148 データ分析の方向性には二つパターンがある

    • マイニング:金脈の意味。意思決定に繋がる重要な要素を見つける
    • モデリング:さまざまなパターンから将来を予測すること。AIはこちらに使われる
  • p158 より良い予測アルゴリズムを作る工程

  • p189 ひとくくりにデータサイエンティストと言っても本人の希望分野がAIアルゴリズムの開発であるのに対して、企業側がデータマーケター的要素を求めていた場合ミスマッチが発生し得る

    • (ちょうど弊社でもデータサイエンティストの採用が始まったので、そうならないといいな...と思ったり)
  • p190 リカレント教育の限界

    • 「流行っているから勉強して来い」というぼやっとした理由で外部講習に行かされ、「業務命令が出たから」となんとなく参加し、知見が職場で生かされない
    • また生かそうにもデータにアクセスできない、PCのスペックが足りないなどの物理的な制約がある場合もある
    • (前者の講座に関してはありそうだなぁと思ったり)
  • p199 データ分析人材の様々なタイプ

    • データエンジニア
    • データアナリスト
    • データサイエンティスト
    • AIエンジニア
    • データマーケター
    • マーケティングテクノロジスト
  • p199 データサイエンティスト協会が定義している、データサイエンティストに求められる力三つ

    • ビジネス力:とりわけドメイン知識や人間関係が効いてくる部分
    • データサイエンス力
    • データエンジニアリング力
    • この三つ全てを兼ね備えている人材はなかなかおらず、人によって得意不得意領域が存在する
  • p209 色々なデータ分析ツールの紹介が載っていた

    • BIツール:Tableauなど
    • 加工・集計・モデリングIBM SPSSなど
    • 自動分析(AutoML):DataRobotなど
  • p213 文系からデータ分析人材を育成するフロー

    • ツールを触りながら集計を行いつつ、座学(統計学の基礎など)を並行する形
    • (自分がいつか勉強したくなった時の参考にしよう...)
  • p236 データサイエンティストと現場の間に、ビジネストランスレーターがいないと結局うまくいきにくい

    • ビジネストランスレーター:橋渡し。データ分析者ほどではなくてもデータ分析の基礎やツールの使い方を理解しており、業務の経験があって企画が得意な人
    • 一度文系の社内の人材にデータ分析を学ばせ、「やっぱ向いていないや」となった人がいるケースがあり得るが、そういう人が現場に戻ったときにビジネストランスレーターとして振る舞ってくれたりするので、教育コストもあながち無駄にはならない
  • p239 三井住友海上のデジタライゼーション

    • 営業現場の課長がExcel VBAを使って手作業していたものを自動化したら楽だろうなと独自で実装した「1クリックツール」なるものが便利だったため全社プロジェクトに普及した話とか
    • 他にも執筆メンバーが所属しているデジタル戦略部の取り組みとして、火災保険のデータを使ってどのような場所で自然災害の被害が多くなるかの予測精度を上げる取り組みなどが紹介されていた
    • (会社の事例の話が面白くてこれってもしかして採用本だったのと一瞬疑ってしまった。(そういう効果も狙ってはいるだろうが、きっかけは講演の依頼だったのでおそらく違う))

おわりに

ビジネスとシステムどちらにも知見がある人の書く本はやっぱり面白いです。

ちなみにこういう本を読んでいるからといってデータサイエンティストになりたい訳ではなく、考え方を知って自分の仕事や日常生活に応用したいと言った心持ち。

*1:この本で紹介されていた、データサイエンティスト協会が定義している「データサイエンティストにとって必要な3つの能力」でいうところの「ビジネス力」「データエンジニアリング力」「データサイエンス力」の内、ビジネスとデータサイエンスの部分がよく分かっていない状態でした。