Big data

BAB 1
PENDAHULUAN

1.1  Latar Belakang
Pada era digital ini, tentunya informasi menjadi suatu hal yang sangat vital dalam menunjang digitalisasi tersebut karena informasi sudah banyak digunakan di berbagai bidang untuk memudahkan pekerjaan setiap pemakainya (user) dan membantu jalannya proses yang ada menjadi lebih cepat, Meskipun informasi sangat membantu kegiatan operasional dan kegiatan strategis namun semua informasi tersebut harus disimpan, dikelola, dan dilindungan informasi lebih dapat dimaksimalkan manfaatnya. Sudah banyak sekali kejadian yang merugikan perusahaan karena tidak memanfaatkan infromasi yang ada atau bahkan membuang informasi yang didapat, hal seperti itu sangat merugikan perusahaan karena tidak dapat memaksimalkan fungsi dari informasi yang ada untuk mempermudah proses pengambilan keputusan, perencanan strategis, dan perencanaan operasional. Hal seperti ini harus dapat dicegah dengan penanganan yang baik serta perhatian yang ekstra agar informasi tersebut dapat berguna maksimal bagi perusahaan.
Saat ini sudah banyak perusahaan yang menyadari pentingnya pengelolaan data dengan cara memanfaatkan big data, big data sendiri adalah “media penyimpanan data yang menawarkan ruang tak terbatas, serta kemampuan untuk mengakodasi dan memproses berbagai jenis data dengan sangat cepat”, hal ini jelas sangat membantu perusahaan dalam mengelola informasi yang dimiliki perusahaan

1.2 Ruang Lingkup
Dalam penulisan yang bertemakan Big data ini penulis menentukan beberapa poin penting untuk dijadikan ruang lingkup penelitian. Ada pun beberapa ruang lingkup tersebut adalah:

1.      Sejarah Big data
·         Di dalam ruang lingkup ini penulis akan membahas tentang sejarah perkembangan dari Big data.

2.      Definisi atau pengertian dari Big Data
·         Pada pembahasan ini penulis akan menjelaskan berbagai macam pengertian dari Big data menurut para ahli.

3.      Pembahasan Lanjut Mengenai BIG DATA
·         Penulis akan membahas lebih lanjut tentang Big data sehingga diharapkan pembaca dapat lebih memahami isi paper yang penulis buat.

4.      Karakteristik Big Data
·         Pada lingkup ini penulis akan menjelaskan secara detil tentang karakteristik dari Big data.

5.      Kesadaran akan pentingnya kemampuan untuk memproses Big Data
·         Dalam lingkup ini penulis ingin menunjukan kehebatan dari Big data dengan mengambil contoh perusahaan yang sudah sukses memanfaatkan big data.

6.      Beberapa Contoh Big Data
·         Penulis akan memberikan beberapa contoh big data diberbagai bidang agar pembaca menjadi lebih paham tentang Big data.

7.      Permasalahan mengenai Big Data
·         pada lingkup ini penulis ingin memberi pengetahuan untuk pembaca jika ingin memberdayakan big data maka ada beberapa permasalahan yang harus dihadapi.

8.      Analisa Solusi Big Data
·         pada lingkup sebelumnya penulis membahas tentang permasalahan saat ini penulis akan membahas tentang solusi untuk mengatasi masalah pemberdayaan big data.

 
1.2  Tujuan dan Manfaat

Tujuan dari Penelitian adalah:
·      Menjelaskan definisi dan karakteristik dari big data.
·      Menjelaskan pentingnya pemberdayaan big data pada perusahaan terutama perusahaan besar yang kegiatan operasional sehari-harinya merupakan kegiatan yang krusial dari perusahaan tersebut.
·      Menjelaskan tentang permasalahan, dan solusi pemberdayaan Big data.

Manfaat yang akan diperoleh:
·      Perusahaan dapat mengetahui apa itu big data dan apa manfaatnya bagi perusahaan.
·      Perusahaan dapat menerapkan pemberdayaan big data dengan cara yang baik dan benar.
·      Perusahaan dapat mengetahui karakteristik, permasalahan dan solusi dari pemberdayaan Big data.







1.3  Metodologi Penelitian
Dalam pembuatan karya ilmiah ini penulis menggunakan studi pustaka sebagai metode pengumpulan data yang penulis butuhkan untuk memperkuat hipotesa yang penulis sertakan dalam penulisan karya ilmiah ini. Studi pustaka yang kami lakukan adalah mengumpulkan data yang kami butuhkan dari buku, majalah, dan jurnal-jurnal online yang tersedia di internet.

1.4  Sistematika Penulisan                         
Penulisan karya ilmiah ini dijabarkan dalam empat bab yang terdiri dari:
BAB 1 : PENDAHULUAN
Bab pertama ini menguraikan latar belakang penulisan paper, ruang lingkup yang berisi batasan pembahasan yang terdapat di dalam topik ini, tujuan dari penulisan dan manfaat apa saja yang diharapkan, metodologi pembuatan paper, dan sistematika penulisan yang digunakan yang penulis gunakan.


BAB 2 : LANDASAN TEORI
Bab kedua menguraikan mengenai pembahasan konsep dan landasan teori yang terbagi dalam teori-teori umum dan teori-teori khusus yang berhubungan dengan topik yang dibahas sebagai landasan dalam penulisan paper Big data  ini.
Teori-teori umum yang dibahas meliputi sistem, informasi, sistem informasi, dan big data.




BAB 3 : PEMBAHASAN
Bab ketiga menguraikan mengenai pembahasan topik yang kami sajikan, di bab ketiga ini juga kami menjelaskan hasil penelitian kami secara detail agar bisa dimengerti oleh pembaca.

BAB 4 : KESIMPULAN DAN SARAN
Bab keempat merupakan bab penutup yang berisi kesimpulan yang telah diperoleh penulis dari hasil penelitian sesuai dengan topik yang diangkat, serta berisi saran-saran terhadap pihak yang terkait agar dapat memanfaatkan paper ini dengan baik.















2.1       Teori Umum

Sistem memiliki banyak pengertian, tetapi pada dasarnya pengertian tersebut memiliki maksud yang sama. Dalam analisis dan perancangan sistem informasi penulis harus memahami terlebih dahulu pengertian sistem informasi agar dapat melakukannya.
Berikut adalah pengertian sistem informasi secara umum:

2.1.1    Pengertian Sistem
Menurut Satzinger, Jackson dan Burd (2005:6) sistem adalah sekumpulan komponen yang saling berhubungan yang berfungsi bersama-sama untuk menghasilkan suatu hasil.
Sistem sendiri memiliki tiga komponen utama, agar sistem tersebut dapat berfungsi atau berinteraksi dengan baik:
1.   Input melibatkan penangkapan dan perakitan berbagai elemen yang memasuki sistem untuk di proses.
2.   Process merupakan proses pengolahan ataupun transformasi yang mengubah input menjadi output.
3. Output melibatkan proses pemindahan elemen yang telah diproses melalui tahapan transformasi, sehingga menghasilkan tujuan yang diinginkan.


2.1.2      Informasi

Menurut Ladjamudin (2005:8) dalam bukunya yang berjudul “Analisis dan Desain Sistem Informasi” informasi adalah data yang telah diolah menjadi bentuk yang lebih berarti dan berguna bagi penerimanya untuk mengambil keputusan masa kini maupun yang akan datang.

            2.1.3    Sistem Informasi
Menurut Satzinger, Jackson dan Burd (2005:7) sistem informasi adalah sekumpulan komponen yang saling berhubungan yang saling mengumpulkan, memproses, menyimpan dan menyediakan informasi yang dibutuhkan untuk menyelesaikan tugas bisnis sebagai output.

2.2       Teori Khusus
Teori khusus yang akan dibahas meliputi pembahasan-pembahasan yang telah penguji batasi sebagai objek penelitian. Berikut adalah masing-masing pengertian tersebut:

2.2.1    Big Data
            Big Data bukan teknologi tunggal namun kombinasi dari teknologi lama dan baru yang membantu perusahaan mendapatkan tindakan yang mampu menambah wawasan. Oleh karena itu, big Data adalah kemampuan untuk mengelola data dengan volume besar yang berbeda dengan kecepatan yang tepat, dan dalam dalam kerangka waktu yang tepat memungkinkan analisis dan reaksi secara langsung.



2.2.2    Business Intelligence
            Menurut Brannon business intelligence adalah sebuah kategori umum yang sering digunakan  untuk aplikasi dan teknologi untuk mengumpulkan, menyimpan, dan menyediakan akses pada data agar dapat membantu pengguna dari kalangan perusahaan agar dapat mengambil keputusan dengan lebih baik dan tepat. Pada umumnya solusi yang disediakan oleh BI berupa sumber-sumber data dimana data yang sifatnya transaksional dikumpulkan, data warehouse/data marts, reporting dan alat visualisasi.
           


 















BAB III
PEMBAHASAN MASALAH

3.1    Sejarah Big Data
                     Sebelum mempelajari suatu hal tentu diperlukan untuk memahami asal muasal atau sejarah dari hal yang ingin dipelajari tersebut, ada pun tentang topic kali ini penulis akan memperkenalkan sejarah big data. Berikut urutannya;

1944    - Fremont Rider, Pustakawan universitas Wesleyan. Dia memperkirakan bahwa
              Perpustakana yang ada di amerika serikat ukurannya meningkat dua kali lipat
  setiap 16 tahun
1961    - Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah dengan
  cara melihat jumlah pertumbuhan jurnal ilmiah dan makalah
1967    - B.A. Marron dan P.A.D. De Maine menerbitkan "Automatic data compression"
dalam Komunikasi dari ACM, yang menyatakan bahwa "ledakan informasi”
tercatat dalam beberapa tahun terakhir membuatnya penting bahwa persyaratan
penyimpanan untuk semua informasi harus dijaga agar tetap minimum.
1971    - Arthur Miller Menulis dalam “The Assault on Privacy” menyatakan, "Terlalu
  banyak informasi. pengurus tampaknya mengukur seorang pria seimbang
  dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi."
1975    - Departemen Pos dan Telekomunikasi di Jepang mulai melakukan Arus
  Informasi Sensus, pelacakan volume informasi yang beredar di Jepang (ide
  pertama kali diusulkan dalam makalah 1969)




1980    - I.A. Tjomsland memberikan ceramah berjudul "Where do we go from here?"
  Di IEEE Keempat Symposium on Mass Storage Systems, dia mengatakan
  "Mereka yang terkait dengan perangkat penyimpanan lama menyadari bahwa
  Hukum parkinson Pertama dapat diparafrasekan untuk menggambarkan
  Industry kami 'Data mengembang untuk mengisi ruang yang tersedia'.
1981    - Kantor Pusat statistic hungaria memulai proyek penelitian untuk menjelaskan
   informasi indsutri negara, termasuk mengukur Volume informasi dalam bit.
1983    - Ithiel de Sola Pool menerbitkan "Pelacakan Arus Informasi" di Science.
  Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977, ia
  menyimpulkan bahwa "kata-kata yang tersedia untuk Amerika (di atas usia 10)
  melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata benar
  benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per tahun, Pada
  periode pengamatan, sebagian besar pertumbuhan arus informasi adalah karena
  pertumbuhan penyiaran, Tapi menjelang akhir periode [1977] situasi berubah:
  media point-to-point yang tumbuh lebih cepat dari penyiaran."
3.2    Definisi atau pengertian Big Data

Akhir-akhir ini, istilah 'big data' menjadi topik yang dominan dan sangat sering dibahas dalam industri IT. Banyak pihak yang mungkin heran kenapa topik ini baru menjadi pusat perhatian padahal ledakan informasi telah terjadi secara berkelangsungan sejak dimulainya era informasi. Perkembangan volume dan jenis data yang terus meningkat secara berlipat-lipat dalam dunia maya Internet semenjak kelahirannya adalah fakta yang tak dapat dipungkiri. Mulai data yang hanya berupa teks, gambar atau foto, lalu data berupa video hingga data yang berasal system pengindraan. Lalu kenapa baru sekarang orang ramai-ramai membahas istilah big data? Apa sebenarnya 'big data' itu?

Hingga saat ini, definisi resmi dari istilah big data belum ada. Namun demikian, latar belakang dari munculnya istilah ini adalah fakta yang menunjukkan bahwa pertumbuhan data yang terus berlipat ganda dari waktu ke waktu telah melampaui batas kemampuan media penyimpanan maupun sistem database yang ada saat ini.


3.3    Pembahasan Lanjut Mengenai BIG DATA
Big Data adalah teknologi baru pengelolaan informasi. Saat ini kita mengenal relational data store dan warehouse yang digunakan banyak perusahaan untuk mendapatkan informasi, melakukan analisis, dan prediksi dari data-data yang mereka miliki. Lalu apakah BIG DATA akan menggantikan teknologi data relasional?
Dalam pembahasan mengenai topic big data saat ini kelompok kami kurang setuju dengan pengertian yang di utarakan oleh beberapa ahli, karena dari apa yang di pelajari yang termasuk ke dalam “BIG DATA” adalah semua data yang tidak dapat diolah atau dianalisis menggunakan proses dan tools yang umum digunakan saat ini. Disadari atau tidak saat ini individu maupun organisasi apapun memiliki akses yang luas sekali terhadap informasi dengan adanya internet tapi hanya sedikit dari mereka yang mampu mendapatkan value dari informasi tersebut karena kebanyakan informasi itu tersedia dalam bentuk “mentah”, tidak terstruktur atau semi-terstruktur. Oleh karena keterbatasan pemahaman akan informasi itulah yang pada akhirnya menyebabkan mereka tidak tahu apakah informasi yang ada itu berharga untuk mereka atau tidak. Dapat di analogikan ke dalam perkembangan internet saat ini seperti bumi kita yang tercinta, maka BIG DATA adalah batu bara di jaman batu, mudah ditemukan tetapi sedikit yang tahu kegunaannya.

3.4    Karakteristik Big Data
Sebuah informasi atau data dapat didefinisikan sebagai Big Data jika memiliki satu atau lebih dari tiga karakteristik berikut :
13869860611272852265


Gambar 3.1 menggambarkan 3 karakteristik Big Data. Gabungan dari ketiga karakteristik ini menghasilkan data yang terlalu kompleks untuk ditangani dengan sistem konvensional.
1.       Volume
Seberapa besar data yang bisa anda olah saat ini? Apakah dengan jumlah data yang anda miliki anda sudah lebih baik dibanding kompetitor? Data yang ada saat ini berukuran sangat besar. Di tahun 2000 saja tercatat 800,000 petabyte data tersimpan di seluruh dunia dan angka ini diperkirakan akan mencapai 35 zettabyte di tahun 2020 atau bahkan lebih. Bayangkan jika anda membutuhkan analisis terhadap 1 persen saja dari seluruh data untuk mendapatkan keuntungan dibandingkan kompetitor anda, apakah teknologi yang anda miliki sekarang mampu melakukannya?
  1. Variety
Selain data relasional, data apa saja yang umum dianalisis? Dengan meledaknya jumlah sensor, dan perangkat pintar , dan juga teknologi social networking yang menghasilkan data-data yang akan sulit jika harus disimpan di dalam relasional database. Kita tidak akan pernah tahu jika kita tidak menyimpan semua data yang tidak terstruktur ini seperti halaman web, web log, search index, forum social media, email, dokumen, data sensor, dll. Data-data seperti inilah yang mungkin akan memberikan keuntungan jika kita mampu mengolahnya.
  1. Velocity
Seberapa cepat kita dapat memproses data yang ada? Mungkin hal itu yang pertama ada dalam benak anda ketika anda membaca ini. Namun sebenarnya velocity di sini kita lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil analisis terhadap aliran data yang terus mengalir di saat yang hampir bersamaan dengan datangnya data tersebut. Bayangkan jika kita memiliki sistem yang mampu mendeteksi buronan yang tertangkap kamera cctv, ataumendeteksi dini titik kritis seorang bayi dari suhu tubuh, tekanan darah, denyut jantung, kecepatan bernafas bayi tersebut, melakukan sensor terhadap kata kasar atau kata yang tidak seharusnya diucapkan yang diucapkan pada siaran langsung di tv atau pada percakapan telepon customer service sebuah perusahaan.
Big Data adalah kesempatan bukan pengganti teknologi pengelolaan data yang ada saat ini. Sekarang bayangkan kemampuan untuk menganalisis BIG DATA digabungkan dengan teknologi basis data relasional dan warehousing yang ada saat ini untuk mendapatkan keuntungan.
3.5    Kesadaran akan pentingnya kemampuan untuk memproses Big Data

Dari segi teknologi, dipublikasikannya GoogleBigtable pada 2006 telah menjadi moment muncul dan meluasnya kesadaran akan pentingnya kemampuan untuk memproses ‘big data’. Berbagai layanan yang disediakan Google, yang melibatkan pengolahan data dalam skala besar termasuk search engine-nya, dapat beroperasi secara optimal berkat adanya Bigtable yang merupakan sistem database berskala besar dan cepat. Semenjak itu, teknik akses dan penyimpanan data KVS (Key-Value Store) dan teknik komputasi paralel yang disebut MapReduce mulai menyedot banyak perhatian.

 Lalu, terinspirasi oleh konsep dalamGoogleFile System dan MapReduce yang menjadi pondasi Google Bigtable, seorang karyawan Yahoo! bernama Doug Cutting kemudian mengembangkan software untuk komputasi paralel terdistribusi (distributed paralel computing) yang ditulis dengan menggunakan Java dan diberi nama Hadoop. Saat ini Hadoop telah menjadi project open source-nya Apache Software. Salah satu pengguna Hadoop adalah Facebook, SNS (Social Network Service) terbesar dunia dengan jumlah pengguna yang mencapai 800 juta lebih. Facebook menggunakan Hadoop dalam memproses big data seperti halnya content sharing, analisa access log, layanan message / pesan dan layanan lainnya yang melibatkan pemrosesan big data.

BigdataDefinition

Gambar 3.2
big data infographic


Jadi, yang dimaksud dengan ‘big data’ bukanlah semata-mata hanya soal ukuran, bukan hanya tentang data yang berukuran raksasa. Big data adalah data berukuran raksasa yang volumenya terus bertambah, terdiri dari berbagai jenis atau varietas data, terbentuk secara terus menerus dengan kecepatan tertentu dan harus diproses dengan kecepatan tertentu pula. Momen awal ketenaran istilah ‘big data’ adalah kesuksesan Google dalam memberdayakan ‘big data’ dengan menggunakan teknologi canggihnya yang disebut Bigtable beserta teknologi-teknologi pendukungnya.

3.6    Beberapa Contoh Big Data

1.      Contoh  di Sektor  Swasta

Perusahaan eBay.com menggunakan dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop klaster 40PB untuk pencarian, rekomendasi, konsumen, dan merchandising . Di dalam eBay 90PB data warehouse. Amazon.com menangani jutaan operasi back-end setiap hari, serta pertanyaan dari lebih dari setengah juta penjual pihak ketiga . Teknologi inti yang membuat Amazon berjalan adalah berbasis Linux dan pada 2005 mereka memiliki tiga database Linux terbesar di dunia , dengan kapasitas 7,8 TB , 18,5 TB , dan 24,7 TB .
Walmart menangani lebih dari 1 juta transaksi nasabah setiap jam , yang diimpor ke database diperkirakan mengandung lebih dari 2,5 petabyte ( 2.560 terabyte ) data - . Setara dengan 167 kali informasi yang terdapat dalam semua buku di Perpustakaan Kongres AS.
FICO Falcon Penipuan Kartu Kredit Detection System melindungi 2,1 miliar akun aktif di seluruh dunia .
Volume data bisnis di seluruh dunia , di semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut perkiraan. Windermere Real Estate menggunakan sinyal GPS anonim dari hampir 100 juta driver untuk membantu pembeli rumah baru menentukan waktu berkendara khas mereka ke dan dari tempat kerja di berbagai kali dalam sehari .

2.      Contoh di Bidang Arsitektur

Pada tahun 2004 , Google menerbitkan sebuah makalah tentang proses yang disebut MapReduce yang menggunakan arsitektur tersebut . MapReduce framework menyediakan model pemrosesan paralel dan implementasi terkait untuk memproses sejumlah besar data . Dengan MapReduce , query dibagi dan didistribusikan di seluruh node paralel dan diproses secara . Hasilnya kemudian dikumpulkan dan disampaikan. Kerangka itu sangat sukses sehingga orang lain ingin meniru algoritma . Oleh karena itu , sebuah implementasi dari kerangka MapReduce diadopsi oleh sebuah proyek open source Apache Hadoop bernama
Teknologi Topological Program Analisis Data DARPA.

3.      Contoh di Bidang Pasar

" Big Data " telah meningkatkan permintaan spesialis manajemen informasi dalam Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan Dell telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 , industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10 persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak secara keseluruhan .
Negara maju membuat meningkatnya penggunaan teknologi data-intensif Ada 4,6 miliar langganan ponsel di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang mengakses internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di seluruh dunia memasuki kelas menengah yang berarti semakin banyak orang yang memperoleh uang akan menjadi melek lagi yang pada gilirannya menyebabkan pertumbuhan informasi . Kapasitas yang efektif di dunia untuk bertukar informasi melalui jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 , 471 petabyte pada tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada tahun 2007 dan diperkirakan bahwa jumlah lalu lintas yang mengalir melalui internet akan mencapai 667 exabytes per tahun pada tahun 2013.



3.7            Permasalahan mengenai Big Data

3.7.1        Bukan Hanya Masalah Ukuran, Tapi Lebih pada Ragam

Kini jelas bahwa Big Data bukan hanya masalah ukuran yang besar, terlebih yang menjadi ciri khasnya adalah jenis datanya yang sangat beragam dan laju pertumbuhan maupun frekwensi perubahannya yang tinggi. Dalam hal ragam data, Big Data tidak hanya terdiri dari data berstruktur seperti halnya data angka-angka maupun deretan huruf-huruf yang berasal dari sistem database mendasar seperti halnya sistem database keuangan, tetapi juga terdiri atas data multimedia seperti data teks, data suara dan video yang dikenal dengan istilah data tak berstruktur. Terlebih lagi, Big Data juga mencakup data setengah berstruktur seperti halnya data e-mail maupun XML. Dalam hal kecepatan pertumbuhan maupun frekwensi perubahannya, Big Data mencakup data-data yang berasal dari berbagai jenis sensor, mesin-mesin, maupun data log komunikasi yang terus menerus mengalir. Bahkan, juga mencakup data-data yang tak hanya data yang berada di internal perusahaan, tetapi juga data-data di luar perusahaan seperti data-data di Internet. Begitu beragamnya jenis data yang dicakup dalam Big Data inilah yang kiranya dapat dijadikan patokan untuk membedakan Big Data dengan sistem manajemen data pada umumnya.

3.7.2          Fokus pada Trend per-Individu, Kecepatan Lebih Utama daripada Ketepatan
Hingga saat ini, pendayagunaan Big Data didominasi oleh perusahaan-perusahaan jasa berbasis Internet seperti halnya Google dan Facebook. Data yang mereka berdayakan pun bukanlah data-data internal perusahaan seperti halnya data-data penjualan maupun data pelanggan, lebih menitik beratkan pada pengolahan data-data teks dan gambar yang berada di Internet. Bila kita melihat gaya pemberdayaan data yang dilakukan oleh perusahaan-perusahaan pada umumnya, yang dicari adalah trend yang didapat dari pengolahan data secara keseluruhan. Misalnya, dari data konsumen akan didapat informasi tentang trendkonsumen dengan memproses data konsumen secara keseluruhan, bukan memproses data per-konsumen untuk mendapatkan trend per-konsumen. Dilain pihak, perusahaan-perusahaan jasa berbasis Internet yang memanfaatkan Big Data justru memfokuskan pemberdayaan data untuk mendapatkan informasi trendper-konsumen dengan memanfaatkan atribut-atribut yang melekat pada pribadi tiap konsumen. Sebut saja toko online Amazon yang memanfaatkan informasi maupun atribut yang melekat pada diri per-konsumen, untuk memberikan rekomendasi yang sesuai kepada tiap konsumen. Satu lagi, pemberdayaan data alaBig Data ini dapat dikatakan lebih berfokus pada kecepatan ketimbang ketepatan.

3.7    Analisa Solusi Big Data

Sejumlah vendor di pasar saat ini mendukung solusi data yang besar . Berikut ini adalah daftar beberapa solusi diantaranya adalah :

1.      IBM ( www.ibm.com ) mengambil pendekatan perusahaan untuk data yang besar dan mengintegrasikan seluruh platform termasuk embedding / bundling nya analisis . Produknya termasuk gudang ( warehouse InfoSphere ) yang memiliki built -in data-mining sendiri dan cubing kemampuan . ini baru PureData Systems ( kemasan teknologi analisis canggih ke dalam platform sistem terintegrasi ) mencakup banyak dikemas analitis integrasi . Produk InfoSphere Streaming Its terintegrasi dengan Paket perangkat lunak statistik statistik untuk Ilmu Sosial ( SPSS ) untuk mendukung real-time analisis prediktif , termasuk kemampuan untuk dinamis memperbarui model berdasarkan data real-time . Hal ini bundling terbatas penggunaan lisensi Cognos Business Intelligence dengan data kunci besar yang kemampuan platform ( kelas enterprise Hadoop , komputasi aliran , dan solusi gudang ) .

2.      SAS ( www.sas.com ) memberikan beberapa pendekatan untuk menganalisis data besar via infrastrukturnya analisis kinerja tinggi dan yang statistic software . SAS menyediakan beberapa pilihan pemrosesan terdistribusi . ini termasuk dalam database analytics , in- memory analytics , dan komputasi grid . Penyebaran bisa di tempat atau di awan .

3.      Tableau ( www.tableausoftware.com ) , sebuah business analytics dan data perusahaan perangkat lunak visualisasi , menawarkan kemampuan visualisasi untuk berjalan di atas peralatan dan infrastruktur lain yang ditawarkan oleh  berbagai besar mitra data, termasuk Cirro , EMC Greenplum , Karmasphere , Teradata / Aster, HP Vertica , Hortonworks , ParAccel , IBM Netezza , dan sejumlah lain .

4.      Oracle ( www.oracle.com ) menawarkan berbagai alat untuk melengkapi yang besar platform data disebut Oracle Exadata . Ini termasuk analisis canggih melalui bahasa pemrograman R , serta database in- memory pilihan dengan Oracle Exalytics di memori mesin dan data Oracle gudang . Exadata terintegrasi dengan platform perangkat keras nya .

5.      Pentaho ( www.pentaho.com ) menyediakan analisis bisnis open source melalui edisi komunitas dan perusahaan. Pentaho mendukung terkemuka Distribusi Hadoop - based dan mendukung kemampuan asli, seperti NFS kinerja tinggi sistem file mountable MapR itu .













BAB 4

PENUTUP
4.1  Simpulan
           
Berdasarkan hasil Studi pustaka kami tentang big data, maka ditarik simpulan sebagai berikut:

1.      Big Data adalah kemampuan untuk mengelola data dengan volume besar yang berbeda dengan kecepatan yang tepat, dan dalam dalam kerangka waktu yang tepat memungkinkan analisis dan reaksi secara langsung. bukan hanya tentang data yang berukuran raksasa. Big Data juga dapat didefinisikan sebagai data berukuran raksasa yang volumenya terus bertambah, terdiri dari berbagai jenis atau varietas data, terbentuk secara terus menerus dengan kecepatan tertentu dan harus diproses dengan kecepatan tertentu pula.
2.      Banyak sekali perusahaan yang memiliki kumpulan data yang menumpuk, karena terlalu banyaknya data tersebut, terkadang perusahaan tidak mengetahui tindakan apa yang harusnya dapat dilakukan terhadap kumpulan data tersebut.
3.      Sebuah informasi atau data dapat disebut sebagai Big Data apabila memiliki 1 (satu) dari 3 (tiga) karakteristik yang terdiri dari Volume (jumlah data yang dapat diolah oleh sebuah perusahaan), Variety (variasi data yang dapat diolah dan dianalisis lebih lanjut oleh perusahaan), dan Velocity (kecepatan sebuah perusahaan di dalam melakukan pemrosesan data).
4.      Banyak perusahaan yang menganggap Big Data adalah kumpulan data dalam ukuran besar padahal Big Data bukan hanya sekedar ukuran, namun juga terdapat keragaman di dalamnya. Hal inilah yang membedakan Big Data dengan sistem manajemen data lainnya.




4.2  Saran

Untuk perusahaan yang memiliki kumpulan data yang sangat banyak, disarankan untuk menerapkan Big Data dan bukan hanya sekedar sistem manajemen data yang biasa saja seperti database. Kumpulan data tersebut dapat diolah dan dianalisis menjadi sebuah data atau informasi yang sangat berguna bagi orang lain, seperti halnya yang dilakukan oleh Google pada mesin pencarian miliknya, dengan pengguna memasukan kata kunci pada mesin pencarian tersebut, pengguna akan mendapatkan data atau informasi yang dibutuhkan pengguna lewat bantuan Big Data yang dimiliki oleh Google.

Begitu pula dengan Amazon atau eBay yang menganalisa kebiasaan belanja setiap penggunanya dan dapat memberikan rekomendasi barang berdasarkan data atau informasi yang dimilikinya dari Big Data milik mereka. Kecepatan dan ketepatan juga sangat krusial dalam penerapan Big Data mengingat akan pentingnya sebuah data atau informasi bagi pengguna dan hal-hal tersebutlah yang nantinya akan memberikan keuntungan bagi perusahaan itu sendiri.

Meningkatkan kemampuan teknologi di dalam perusahaan seperti media penyimpanan data karena data yang disimpan ke dalam Big Data tidak tergolong sedikit, melainkan sangat banyak sehingga membutuhkan tempat penyimpanan yang memadai serta dukungan jaringan yang juga sangat baik untuk memindahkan ataupun mengirimkan kumpulan data tersebut.


Memanfaatkan data atau informasi tersebut agar dapat diubah menjadi sebuah teknologi baru yang bisa saja berupa sebuah aplikasi atau perangkat lunak dapat juga dilakukan dalam penerapan Big Data. Semua tergantung bagaimana sebuah perusahaan menyikapi kumpulan data yang dimiliki oleh perusahaan tersebut, bagaimana manajemen dari perusahaan tersebut memikirkan ide-ide brilian terhadap kumpulan data tersebut. Apakah dukungan IT dari perusahaan dapat membantu? Apakah dukungan karyawan dari perusahaan dapat membantu? Hal-hal tersebut juga harus diperhatikan oleh perusahaan dalam menerapkan Big Data.

0 Response to "Big data"

Posting Komentar