Komunitas Cloud Indonesia

Apakah Big Data itu?

Penulis :   |   May 9, 2012

image

Malam ini pukul 11 malam WIB, Microsoft Corp Redmond akan menyelenggarakan online session untuk menjelaskan proposisi Microsoft dalam memecahkan tantangan Big Data di dalam enterprise.

Untuk mempersiapkan hadir di acara tersebut, mari kita bahas apakah Big Data itu?

Big … Data

Sesuai dengan namanya, Big Data didefinisikan sebagai sebuah problem domain di mana teknologi tradisional seperti relational database tidak mampu lagi untuk melayani. Definisi Big di sini adalah volume, velositas dan variasi datanya. Peningkatan volum, velositas dan variasi data banyak diakibatkan oleh adopsi internet. Setiap individu memproduksi konten atau paling tidak meninggalkan sidik jari digital yang berpotensial untuk digunakan untuk hal-hal baru; dari audiens targetting, rekomendasi ataupun penggunaan yang lebih tak terduga seperti Google Translate yang menggunakan machine learning di atas Big Data yang Google punya untuk translasi bahasa.

Big Data bukan saja BI 2.0

Untuk Enterprise, Big Data sering dikotakkan ke dalam Business Intelligence. Miskonsepsi ini disebabkan keduanya menawarkan insight di atas data yang ada. Perbedaan yang mendasar adalah bagaimana konsep Big Data dan Business Intelligence memproses data.

Untuk menghadapi volume yang tinggi, prinsip Business Intelligence mengajak kita untuk membersihkan data yang ada. Proses pembersihan ini akan membuang residu yang dianggap tidak penting. Sedangkan prinsip Big Data adalah untuk tidak membuang data apapun karena residu tersebut mungkin akan menjadi penting sejalannya waktu.

Untuk menghadapi velositas yang tinggi, prinsip Business Intelligence mengajak kita untuk melakukan operasi batch secara teratur. Operasi ini akan medorong data dari sistem transaksi ke data warehouse untuk diproses selanjutnya. Sedangkan prinsip Big Data adalah real-time processing.

Untuk menghadapi variasi data yang tinggi, prinsip Business Intelligence mengajak kita untuk menciptakan struktur melalui  ekstraksi, transformasi dan membuang residu yang tersisa. Big Data memiliki pendekatan yang serupa namun tanpa harus membuang data mentah yang kita miliki. Misalnya dari sebuah unstructured data kita bisa melakukan entity resolution untuk mengekstrak konteks sebuah kata (contoh: Apple adalah perusahaan atau label rekaman atau buah). Kalkulasi ini biasanya dilakukan secara real time.

Hadoop

Apache Hadoop menawarkan fitur MapReduce  yang memungkinkan kita melakukan prinsip-prinsip yang disebut di atas. Hadoop banyak dipakai oleh perusahaan web dan Startup yang kita kenal sekarang seperti Yahoo, Facebook, Foursquare dsb.

Begitu pula di sisi enterprise, vendor-vendor solusi enterprise merangkul Hadoop untuk mengatasi masalah Big Data di dalam enterprise. Microsoft (Windows Azure Hadoop), Oracle (Big Data Appliance yang mencakup solusi Hadoop dari Cloudera), SAP (Hana), EMC (GreenPlum Hadoop) adalah beberapa contoh solusi di space ini.

Ingin tahu lebih lanjut tentang offering dari Microsoft di Big Data? Register untuk acara Big Data Windows Azure di Eventbrite

 

Selain rekomendasi dan audiens profiling, menurut kamu apa yang bisa kita dapatkan dari Big Data? Tinggalkan komen kamu di bawah.

  1. Jakarta Cloud Computing Meetup 09.2016
  2. Big Data dengan Google Cloud
  3. Cloud Computing dan Big Data : Sebuah Kombinasi Ideal
  4. Keynote CEO Oracle mengenai Transformasi Cloud Computing
  5. Cloud Computing sebagai Skill yang Paling Dicari di Dunia Kerja

Penulis :

Ronald Widha is a passionate programmer and believes in occam razor. Ronald hosts an IT podcast in Bahasa Indonesia at temanmacet.com.Currently working as a Solution Architect in a US company based out of Dubai, United Arab Emirates focusing on emerging technologies. A cloud enthusiast and a member of Microsoft Windows Azure Insider.

Komentar

6 thoughts on “Apakah Big Data itu?
    1. Ronald Widha Post author

      konon dari sisi volume: RDBMS giga to terabytes. BigData peta hexa
      yang menarik adalah statistik ini, untuk rdbms, 1dba bisa mengadmin sekitar 40 nodes. sedangkan di Hadoop 1 dba bisa mengadmin 30,000 nodes

      Reply
  1. wibisono gumulya

    Thanks RW for sharing big data information…all the best GBU

    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *