DBAからビッグデータDBAへ

DBAスキルをビッグデータ・スキルに変える

P R O F I L E

ミシェル・マリカー
Michelle Malcher
IOUGプレジデント。データベース開発、セキュリティ、設計、および管理の分野で15年以上の経験を積んだOracle ACE Director。『Oracle Database 12c: Install, Configure & Maintain Like a Professional』(Oracle Press、2013年)、および『Securing Oracle Database 12c: A Technical Primer』(Oracle Press、2013年)の共著者でもある。

 大規模なデータベースを扱っているデータベース管理者(DBA)であれば、すでにビッグデータを扱っていると考えているかもしれません。確かに、何年にもわたってペタバイト(PB)規模のデータベースを管理しているDBAもいるでしょう。しかしビッグデータとは、かならずしもデータベースやデータのサイズのことだけを指すわけではありません。

 ビッグデータとは、構造化データ、非構造化データを問わず、大量で、しかも高速で集まることが多い情報のことです。企業の経営者は、どのようなデータが価値のあるものかを判断する必要があります。DBAがそうした判断をするのは難しいですが、データの入手や、さまざまなデータソースへの接続をサポートすることはできるでしょう。

 ビッグデータが意味することや、近い将来ビッグデータが企業にとってどれほど重要なものになり得るか(おそらくビジネスにおける標準的な要素にさえなるでしょう)を考えると、DBAが現在の役割から踏み出し、データベース管理のスキルを、ビッグデータ管理を包含したスキルへと広げる機会はあると思います。データストレージの管理や、データアクセス、セキュリティ、データの読み込みや統合のためのネットワーク・トラフィックといった管理に関するスキルを身につけているということは、DBAには、ビッグデータの分野で重要な役割を果たすための、確固たる基盤がすでにあるということです。

「企業の経営者は、どのようなデータが価値のあるものかを判断する必要があります。DBAがそうした判断をするのは難しいですが、データの入手や、さまざまなデータソースへの接続をサポートすることはできるでしょう」

 ビッグデータの分野では、数多くの新しいスキル領域が求められるようになっています。そうした領域のいくつかは、現在のDBAのスキルを活かせるものであり、ビッグデータDBAになるために最初に注力すべきスキルでもあります。

■Apache Hadoop

 Hadoopは、複数ノードでのデータ処理で使用されるフレームワークです。高度な並列処理技術により、大量のデータをきわめて高速に処理するための、スケーラビリティの高いプラットフォームになり得ます。 

 実質的なテーブルや構造がないため、データをさまざまな形式でインポートできるだけでなく、複数の方法でOracleデータベースと接続することができます。

 Hadoopでのデータ処理方法や既存のデータソースとの統合方法を理解することは、ビッグデータDBAとしてのスキルを伸ばすのに有効です。

■R

 Rのすべてのスクリプトを理解し、実際のデータ・ソリューションのデータで実行可能な、Rによる高度な分析のすべてを理解できれば申し分ありませんが、R自体については専門家やデータ・サイエンティストに委ねるのが得策でしょう。

 ただし、Rを実行する環境を準備する方法を学ぶことは、ビッグデータDBAが管理において注力すべき領域の1つになるでしょう。

 また、Oracleデータベース環境で統計処理や高度な分析用のRスクリプトを実行できるようにするためには、環境を準備し設定をおこなう必要があるため、DBAはRのバックエンド環境の管理から、Rスクリプト記述へスキルを広げることができます。

■統合

 データ統合はすでにDBAの重要なスキルですが、これにビッグデータが加われば、データや、何をもって価値ある情報とするのかについて理解してもらうための対話の機会が増えるでしょう。ビッグデータに関する新しいスキルが、企業のチームとのコミュニケーションにつながる可能性もあります。

 さまざまなデータソースに日常的に接していない場合は、ほかのデータソースからデータを取り出すことから始めるとよいでしょう。各種データソースを利用するサービスを開発することは、ビッグデータ・プロジェクトにとって貴重なリソースになるはずです。

 データソースの統合だけでなく、ビッグデータ・コネクタに取り組むことも検討すべきでしょう。Oracle Big Data Connectorsは、HadoopとOracleデータベースを接続し、HadoopでXQueryやSQLを使用できるようにします。現在のDBAスキルに加え、コネクタに関する知識を習得中であれば、統合は、DBAがビッグデータに携わるうえで重要な領域になります。

■レポートと視覚化

 企業は、ビッグデータを、活用や分析が可能な目に見える成果にすることを求めてきます。こうしたレポートに関する課題を支援するために、ビッグデータDBAはビッグデータ分析用のレポートツールやサーバーの管理について学ぶ必要があります。身につけるべきもう1つのスキルが、レポートに必要なデータ構造を構築するスキルです。

「データに関する問合せや利用できるデータが増えることは、すべてのDBAにとってビッグデータに関するスキルを身につける新たな機会になります」

 現実的なパフォーマンスを得るために、一部のレポートツールでは、マテリアライズド・ビューや、個別のレポート用データベースの作成が必要になる場合があります。

 レポート作成のためのクエリのチューニングはDBAの代表的なスキルであり、さまざまなグラフや視覚化ツールのチューニングにおけるニーズを理解することが、ビッグデータでは重要になります。

 データに関する問合せや利用できるデータが増えることは、すべてのDBAにとって、ビッグデータに関するスキルを身につける新たな機会になります。

 筆者は今年、信頼できる情報とユーザーグループの専門家を通じて、HadoopとRのスキルセットを強化したいと考えています。

ページの先頭へ