役立つ資格やキャリアパスもご紹介
データサイエンティストとは?仕事内容やフリーランス事情を解説

  • このエントリーをはてなブックマークに追加

メイン画像

「データサイエンティスト」という仕事に皆さんはどのような印象をもたれているでしょうか。「名前ぐらいは知っている」という人もいれば「そもそも、そんな仕事が存在するのか?」と驚かれる方もいることだと思います。

データサイエンティストという仕事は分かりやすくいえば「ビッグデータ解析の専門家」。近年のAIやIoTといった新しい分野の技術の発展とともに注目を浴びている新しい仕事です。

そういわれると「面白そうだ、自分もやってみたい」と思われる方も多いでしょう。しかし、その実情というのはあまり世の中では知られていません。そのためここではデータサイエンティストがどのような仕事か、なるために必要なスキルなどについて解説をします。
 


本記事の執筆者
ITコンサルタント 亀田 健司(かめだけんじ)

ソフトウェア開発・IT研修講座の講義・研修プログラムの開発・プロデュース業務を行う。大手WebメディアなどにIT技術・人工知能・プログラミング・セキュリティ・IoT関連技術に関する専門記事を執筆。

「自分のスキルの相場をしりたい」と思う方へ

簡単4ステップ!スキルや経験年数をポチポチ選ぶだけで、あなたのフリーランスとしての単価相場を算出します!

※相場算出に個人情報の取得はおこないません。

0. 目次

1. データサイエンティストの仕事内容
2. データサイエンティストに必要なスキル
3. データサイエンティストに役立つ資格
4. データサイエンティストとしてのキャリアパス
5. フリーランスのデータサイエンティストとして働く場合

1. データサイエンティストの仕事内容

データサイエンティストとはどういう仕事か、そしてどうしたらなれるのかについて説明する前に、前提となる「ビッグデータとはなにか」を解説します。

ビッグデータとはなにか

ビッグデータとは、これまで記録や管理すらできなかったような巨大なデータ群のことで、単に量が多いだけでなく、さまざまな種類や形式が含まれているデータを指します。

たとえば、私たちがコンビニで買い物をするときに貯めているポイントカードのデータやSNSへの投稿データもビッグデータの1つといえるでしょう。

更新されて増えていくビッグデータの解析や分析を行うことで、社会やビジネスに貢献するような発見を得ていくのが、データサイエンティストの仕事の1つです。

ビッグデータ活用の成功例

ビッグデータ活用の成功例として、回転寿司チェーン店のスシローがよく知られています。

スシローでは、2012年から寿司皿にICチップを取りつけ、毎年10億件以上の寿司ネタの売れ行きデータを蓄積・解析しています。

このシステムを導入して、ネタごとにどのタイミングでお皿が取られるのか分析した結果、たとえば期間限定の極上大トロはレーンを回り始めて10分で、全体の50%以上を売り上げたのに対し、サーモンは36%にとどまるという傾向が見られました。ところが、30分以上経過すると大トロは10%にまで落ちるのに対し、サーモンは20%以上を維持していることもわかりました。

サーモンは大トロと比較して初速が穏やかだが、コンスタントに売れる商品である、というような商品ごとの売れ行きの傾向が見えてきました。

このような多くのデータ蓄積と地道な分析を行った結果、スシローはシステム導入前に比べてなんと約75%もの食品廃棄を減らすことに成功したのです。食品ロスが大きな損失の原因となっている食品関連企業にとって、これは画期的なことです。

現在では分析したデータと店長の勘・経験を合わせてタイムリーに食べたい握り寿司を提供しているといわれています。

スシローの事例のように、ビッグデータの中から企業の経営に役に立つ情報を見つけ出し分析・提言することがデータサイエンティストの仕事です。

※参考 : 食欲を15分後まで予測、あきんどスシロー | 日経 xTECH(クロステック)

2. データサイエンティストに必要なスキル

では、具体的にデータサイエンティストには、どのようなスキルが求められるのでしょうか。データサイエンティストになるための特別な資格は存在しません。

ただ、以下のスキルはデータサイエンティスト一般に求められる最低限のスキルであるとして知られています。

•BIツールを活用する能力
•Python言語/R言語のプログラミング能力
•統計学に関する知識
•機械学習に関する知識
•Oracle,MySQLなどのデータベースに関する知識

現在、一般的にビッグデータの解析はBIツールを用いるか、Python言語やR言語と機械学習を用いるかのいずれかの方法で行われています。

BIツールを活用する能力

BIツールを用いれば簡単にデータをグラフ化したり、将来予測のシミュレーションなどを行ったりすることが可能になります。BIツールで有名なものとしてはPower BIやTableauがあげられます。これらのツールはExcelだけでは処理しきれない大量のデータの処理と分析を行うことができます。

Python言語/R言語のプログラミング能力

Python言語は機械学習や統計学などのライブラリが充実しており、しかも無料で利用できるので、BIツールと並んでデータサイエンティストには必須のアイテムです。また、統計処理を行う上では、Python言語よりもR言語を用いた方がスムーズなケースもあるため、こちらも押さえておきたいスキルです。

機械学習・統計学に関する知識

機械学習とはコンピュータに自律的に学習させるための手法全般を指す言葉であり、回帰分析やSVMなどのさまざまな手法が存在します。

オンラインショッピングのレコメンデーション機能はこの機械学習によって実現されている技術です。また、自動運転技術や顔認証技術などで注目を浴びている深層学習と呼ばれる技術もこの機械学習に分類されます。

一般にこれら機械学習の手法の多くは統計学の理論を応用したものが多く、機械学習は統計学とセットで学習する必要があります。

Oracle,MySQLなどのデータベースに関する知識

また、得られたビッグデータは一般に「生のデータ」という意味でローデータ(raw data)と呼ばれています。ローデータはノイズやエラー、欠損などが存在しそのままではデータ分析を行うことができません。

そのためデータを解析する前にこれらの情報を削除したり補ったりするなどのデータ加工を行う「前処理」と呼ばれる作業が必要とされます。

一般にローデータはデータベースに保存されているケースが多いので、OracleやMySQLなどを始めとするデータベースを活用する能力も必須です。

これ以外にも、データベースへの不正アクセスを防ぐための基本的なセキュリティに関する知識などICTスキルも必要であることはいうまでもありません。

データサイエンティスト=プログラマーではない

ここまでくると、要するにデータサイエンティストとはプログラマーなのか……という解釈をされる方もいるかもしれませんが、それは大きな誤解です。データサイエンティストにはこういった技術のほかにビジネススキルも同時に必要とされます。

どんなにデータを活用する手法や技術を身に着けていても、そのデータがどのようにすればビジネスに活かされるのかを知らなければ意味がないのです。

データサイエンティストは、ビッグデータを活用・分析しそれをマーケティングなどに活かしてビジネスに価値を生み出すプロフェッショナルです。そのためプログラミングといったITスキルばかりでなく、財務やマーケティングなどのビジネススキル、統計学、心理学など、幅広い分野の知識が必要とされます。

Yahoo!、日本アイ・ビー・エム、野村総合研究所なども会員であるデータサイエンティスト協会とスキル定義委員会は、データサイエンティストに必要な素養を以下のように定義しています。

(1)ビジネス力
課題背景を理解した上で、ビジネス課題を整理・解決する力
(2)データサイエンス力
情報処理・人工知能・統計学などの情報科学系の知恵を理解し使う力
(3)データエンジニアリング力

データサイエンスを意味のある形に使えるようにし、実装・運用できるようにする力
これら3つの力のどれかが欠けていてもデータサイエンティストとしては不十分であると考えられています。

参考:一般社団法人 データサイエンティスト協会

そのため、データサイエンティストとなる人は必ずしもプログラマーや技術者ばかりではなく、マーケティングや経理、人事などさまざまな領域の人材がデータサイエンティストとして活躍しています。データサイエンティストになるためには必ずしも技術出身である必要はないのです。

それより求められるのは自らの専門分野(会計・人事・技術など)のしっかりとしたバックボーンをデータサイエンスの領域に活かせる能力なのです。

3. データサイエンティストに役立つ資格

データサイエンティストに役立つ資格としては統計学検定や、データ分析試験、データベースの資格であるオラクルマスターなどがあげられます。これらはいずれも基礎的な技術力を示すための試験及び資格です。

4. データサイエンティストとしてのキャリアパス

データサイエンティストという仕事は他のIT系の仕事に比べて歴史が浅く、人数自体がそもそもあまり多くはありません。そういったこともあり、現在はデータサイエンティストの需要に対して供給が圧倒的に不足しているのが現状です。

企業としても、データサイエンティストに育成するための特別研修プログラムを設けるなどして数を補おうと必死です。

現在はそういった研修を受けた社員が社内データサイエンティストとして業務の改善や新サービス開発などのさまざまな業務に携わっています。

こういった経験を活かし、データサイエンティストは将来的にはデータに基づいた企業の業務改善のアドバイスやマーケティングなどの分野で活躍する人材としていくものと思われます。

5. フリーランスのデータサイエンティストとして働く場合

フリーランスのデータサイエンティストの需要は旺盛です。

現在、特に募集が多い案件は、TableauのようなBIツールの導入などビッグデータ解析やAI導入のためのデータ基盤導入案件です。こういった業務は経験や実績のある人材が限られており、「ビッグデータ解析以前にそもそもそのデータ基盤を導入しなければ話にならない」と思っている企業も多く、引く手あまたとなっています。

そのためまずはデータ基盤導入業務から手掛け、クライアントの信頼を勝ち取るというのが一番スタートを切りやすいパターンといえるでしょう。

データサイエンティストとしての真の実力を身に着ける

とはいえ、長期的にデータサイエンティスト不足の状態がずっと続くということはないと断言しても良いでしょう。

すでに説明した通り、企業では自前で社員のデータサイエンティストを育成することに熱心になっていますし、AI技術者やデータサイエンティストを育成するコースを設けている大学の数も増え続けているので、今後は企業で学んだ人材によって徐々にではあるものの人材の不足が補われていく可能性があるからです。

将来的にはフリーランスとして活動するのであれば、データサイエンティストとしての「本当の実力」が問われる時代がやってきます。

そうした時代では、たとえば公認会計士や中小企業診断士などのように企業経営や分析に直結するような資格を取得したり、データサイエンティスト以外にもその周辺技術であるAIやIoTなどについての造詣を深めたりするような努力も必要になるでしょう。

また、総務省統計研究研修所が主催する統計研修に参加し、より高度な統計学や経済・経営分析の技量を身に着ける方法もアピールポイントになります。

フリーのITエンジニアの主な業務内容は、社員だけでは不可能な業務を補うことが主な目的となっています。それはデータサイエンティストに関しても同様で、どこかの企業の仕事を請け負う場合には「社員にはできないこと」をいかにしてできるようにするかがカギとなります。

くわえて、クライアント企業に「次もあの人に仕事を頼みたい」「長期的にわが社のパートナーとしてのお付き合いをして欲しい」といわれる人材になるための努力を継続して行うことが大事です。
業務以外の点でいえばデータサイエンティストのネットワークを構築する努力をするのもとても大事なことです。

データサイエンティスト協会の委員会や部会での調査、研究など、活動状況に関する情報を入手することにくわえて、協会に所属する企業をはじめとするテックカンパニーでは独自のセミナーや共同の勉強会も多く開催されています。
 



フリーのデータサイエンティストとして活躍するためには、技術やスキルを磨くほかにも、新しい情報を定期にとりに行ったり、セミナーや勉強会を有効に活用して活動の幅を広げていく必要があるといえるでしょう。

ここではデータサイエンティストとはどのような仕事かということから、必要なスキルやキャリアパスまでの基礎知識をまとめてきました。データサイエンティストは今後も需要が増えていくことが予想されます。

しかし、どんな仕事でも本当に必要とされるのは実力のある「本物」だけです。データサイエンティストにこれからなろうと考えている方も、もうすでに活躍をされている方も、それを肝に銘じて常に学び続ける姿勢が求められているのです。

最後に

簡単4ステップ!スキルや経験年数をポチポチ選ぶだけで、あなたのフリーランスとしての単価相場を算出します!

※相場算出に個人情報の取得はおこないません。

  • このエントリーをはてなブックマークに追加
いきなり相談するのは不安な方へ フリーランスになった時にどんな案件を提案されるのかメールでわかる! 詳しくはこちらから

関連記事

関連案件

もっと案件を見る

プライバシーマーク

© 2014-2019 Levtech Co., Ltd.

はじめまして、フリーランスに
興味が少しでもあれば、
無料相談してみませんか?