インタビュー企画① [松本 健太郎さん]
- データサイエンス ラボ
- 2018年11月3日
- 読了時間: 7分
松本健太郎 さん
<紹介>
データサイエンティスト。1984年生まれ。2007年より株式会社ロックオンにおいて、マーケティングのための人工知能プログラム開発に携わる。そのかたわら、多摩大学大学院で統計学・データサイエンスを研究。2018年からは株式会社デコムにおいて、インサイトと呼ばれる消費者の隠れた心理を分析する業務に従事。
(News pickより引用)
<著書紹介>
データサイエンス「超」入門 嘘をウソと見抜けなければ、データを扱うのは難しい
https://www.amazon.co.jp/データサイエンス「超」入門-嘘をウソと見抜けなければ、データを扱うのは難しい-松本-健太郎/dp/4620325414/ref=asap_bc?ie=UTF8
<インタビュー>
Q1. データサイエンスを始めたきっかけ、をはじめにお聞きしてもよろしいでしょうか?
新卒採用の時、営業として入社したんですけどあまり合わず、エンジニア職に転職して、そこから8年間エンジニアを続けました。その時、社内でデータサイエンスの仕事に当たり、大学時代は政治学専攻だったので数学面を補強するため社会人大学院に入学しました。大学院では、純粋なデータサイエンスを学びました。
Q2.データサイエンティストを目指す上で、大学の専攻は関係ないでしょうか?
しっかりとコーディングを学べればできる。次に当たる壁として、大学基礎数学(線形代数/微積分)をしっかりと勉強できるか、ですかね。
Q3,数学の勉強はやはり必要?
“ある程度”の分析を行って行く上で、知識・基礎として必要だと思います。
Q4.実際にビジネスでは、どの程度の技術を使っているんでしょうか?
ビジネス面で言えば、Excelの分析タグのみでも十分な結果は得られますね。
また、検定などの詳細をこと細かに一つ一つ説明することはあまりないですね。伝わらなければ仕方がないので(笑い)
Q5. 20代の方々に、コーディング・数学以外で身につけて欲しいスキルは?
データサイエンスという幅広い分野の中で、どういった領域で活躍したいのかを見極めて欲しい。例えば、大企業で分業制が強いられており、データが大量に用意されている場合は、Kaggleなどで分析の精度を高めることに注力するなど。
ただし、多くの企業ではそこまで徹底した分業制を敷いてないので、”前処理”や”ビジネス的プロセスと流れ”をしっかりと理解するのが良い。
Q6.データ分析を学んで行く上で、様々な学問的分野(心理学や経済学など)が活きると思います。これは重要だと思う分野などはありますか?
結局、リベラルアーツが重要と考えますね。古代ローマのリベラルアーツを簡単に分けると、国語(論理性)と数学(事実を深める)と言いますね。
世の中の物事の現象を理解できるか、その手前で終わるかの違いは大きいと思います。
例えば、月の満ち欠けひとつでも、ただ月が光っている、見えなくなる。だけでおわるのではなく、どのように月が満ちて行くのかの原理までしっかりと考えられていることだと思います。
データサイエンスにおいて、数学的要素は欠かせません。ただ、それと同じくらい国語力が必要と考えています。データだけ見せても、それはただの数字ですから、そこにどんな意味があるのか、どういう筋のデータなのか、をしっかりと理解できることがリベラルアーツだと考えています。
Q7. “リベラルアーツ”というと学ぶことが難しく感じますが、どのように学びましたか?
とにかくジャンルを問わず読書すること。ではないでしょうか。
Q8, 松本さんはよく本を読まれるのでしょうか?
年間通じて、学生時代から50~60冊以上の本を読みますね。
興味がある本から、通勤時間やお風呂で読みますね。
Q9.今読まれている本は?
自然言語処理系の本メインに進めていますね。興味と必要性の2点からです。
Q10. 松本さんは、文理どちらにも分かりやすく読めるデータサイエンスの本を出されていますね。松本さんが著書を出し始めたきっかけは何かあったのでしょうか?
去年の中頃から、ご縁があって描き始めました。
Q11.文系的な観点で読める本を書けるのは非常に面白いですね。
ぜひ、広めてください(笑い)
Q12.大まかな質問ですが、今後分析が技術の発展にともなって扱いやすくなっていく中で、データサイエンティストの需要は増えて行くと思いますか?
2軸あると考えています。専門領域と汎用性ですね。
メルカリであれば、非常に専門的な画像認識を要していますね。これらはデータサイエンティストが進めていくべき内容だと思いますし、需要は増えていくと思います。
Excelですむような部分は今後ビジネススキルとしては(誰にでも)必須かなと思います。
Q13.少し質問を戻しまして、松本さんが考えるデータサイエンスで”活躍できる人”と”できない人”との違いは?
ビジネスという点に限れば、“売り上げを上げる”,”役に立たせる”ことができなければ仕方がないです。So-Whatをしっかりと突き詰められているか、は重要。その分析結果で、”何がしたいの?” と言われないように。
Q14.エンジニアやコンサルタントなど、データサイエンスと一口に言っても様々な職種がありますが、今後データサイエンスを始めていく人はどのように専門を決めたら良いでしょうか?
自分自身の方向性を大事に、次は会社の方針で決めて行けば良いのではないでしょうか。他のキャリアとあまり変わらないと思いますね。
Q15,データサイエンスの実務スキルは、どのように伸びるのでしょうか?
課題を解決することによってのみ、実力は伸びる。手法は後から付いてくるんじゃないんですかね。自分で勉強する際は、好きなことからどんどん学んでいけ良いと思います。
僕の場合は野球でしたね。野球で行われている分析を色々眺めました。
“課題の解決・発見”は簡単に聞こえますが、問題意識がなければ課題は見えてこないと思います。好きなことであれば、視野も広く真剣に取り組めるので自然に課題が見えてくるのではないでしょうか。というのが僕の考え方です。
Q16.野球では最初どのような分析を行ったのでしょうか?
2016年の広島カープが優勝することを当てました。
その時は、特別珍しい手法を使ってはいないですね。
Q17.マーケティングや実務に携わらなければ勉強できない部分はどう学びましたか?
仕事を通じてしっかりと学ぶべき。これらのシチュエーションを全て網羅した本はあまりない。汎用性を多く網羅している本はあるが、やはりそれだけでは自身に降りかかる全てのパターンに対応できないと思います。
Q18. 分析で詰まったり、良い結果が得られなかった時はどうしてますか?
2つあります。1つは試行錯誤。例えば視点を変えて分析してみるなど。
もう一つは、しっかりとクライアントと話しあうことだと思いますね。
ビジネスにおける分析の説明力は、実際のところ50%程度と考えています。”他企業のマーケティングによる影響”と”自社マーケティング努力”が25%, “計測できていないデータ不足”、もしくは”完全に不規則なもの”が25%と考えています。
ただし、それらの可能性や精度をしっかりと説明できる必要はあります。
Q19. そうなると、分析結果を見て例えば”データ分析って、この程度の精度の結果しか得られないのか!” などと言われてしまうことも多他ありそうですね・・・。
ありますね。ただ、その時はしっかりと自分自身で反省します。
Q20.場合によっては、相手が悪かったことなどもあるのでは?
“相手がわかっていないこと”を認識不足であった自分が悪いのかな、と考えます。
Q21.一緒に仕事していきたいデータサイエンティストの性格や能力などはありますか?
性格は特にありません。能力としては、しっかりと裏を取れること。だと思いますね。データがそもそも欠けている、揃っていないことは本当に多いので、”データが揃っている”と言われても、一概にはあまり信じられません。
データの生まれるプロセスをしっかりと考えて、そのデータから何が考えられるか、他のデータはないのかなどの裏取りはしっかりとできる方が良いですね。
データサイエンティストらしく、非常に論理的かつ分かりやすく質問に答えていただきました。30分程お時間をいただきましたが、とても密度の濃いインタビューでした!
松本さん、ありがとうございました!!
インタビュー日時: 2018/10/8
[編集: 松川]
Comments