Big data

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Jump to navigation Jump to search
Visualisasi suntingan harian di Wikipedia yang dibuat oleh IBM. Teks dan gambar yang ada di Wikipedia hingga beberapa terabita adalah contoh sederhana mahadata.

Mahadata, lebih dikenal dengan istilah bahasa Inggris big data, adalah istilah umum untuk segala himpunan data (data set) dalam jumlah yang sangat besar, rumit dan tak terstruktur sehingga menjadikannya sukar ditangani apabila hanya menggunakan perkakas manajemen basis data biasa atau aplikasi pemroses data tradisional belaka. Mahadata juga dapat diartikan sebagai pertumbuhan data dan informasi yang eksponensial dengan kecepatan dalam pertambahannya dan memiliki data yang bervariasi sehingga menyebabkan tantangan baru dalam pengolahan sejumlah data besar yang heterogen dan mengetahui bagaimana cara memahami semua data tersebut.[1]

Pada dasarnya big data memiliki tiga karakteristik diantaranya[2]:

  • Volume, big data memiliki jumlah data yang sangat besar sehingga dalam proses pengolahan data dibutuhkan suatu penyimpanan yang besar dan dibutuhkan analisis yang lebih spesifik.
  • Velocity, big data memiliki aliran data yang yang cepat dan real time.
  • Variety, big data memiliki bentuk format data yang beragam baik terstruktur ataupun tidak terstruktur dan bergantung pada banyaknya sumber data.

Big data dapat diterapkan di semua aspek yang ada misalnya pada bidang bisnis, kesehatan, pariwisata, pemerintahan, kejahatan, dan lainnya. Dengan menggunakan tools untuk pengambilan ataupun pengolahan datanya misalnya dengan menggunakan software Gephi, Python, Netlytics, NiFi, dan Tableau. Dengan memahami bahwa big data itu penting, maka suatu organisasi akan dengan mudah mengolah dan menganalisis sekumpulan data atau suatu permasalahan yang sedang dihadapi baik dari internal maupun eskternal organisasinya. Organisasi tersebut dapat menghemat biaya, mengehamat waktu, dan menciptakan sebuah keputusan yang tepat [3].

Virtualisasi data[sunting | sunting sumber]

Virtualisasi data adalah pendekatan untuk menyatukan data dari berbagai sumber dalam satu lapisan sehingga aplikasi, alat pelaporan, dan pengguna akhir dapat mengakses data tanpa memerlukan detail tentang sumber asli, lokasi, dan struktur data.[4]

Tools Big Data[sunting | sunting sumber]

Gephi[sunting | sunting sumber]

Gephi merupakan perangkat lunak open-source yang dapat digunakan untuk visualisasi dan analisis jaringan. Gephi dapat digunakan untuk membantu analis data untuk mengungkapkan pola dan tren, menyoroti secara spesifik mengenai outliers (orang ataupun suatu hal yang terpisah dari badan atau sistem utama) dan menceritakan mengenai data mereka[5]. Gephi dapat menggunakan render engine 3D untuk menampilkan grafik real-time skala besar dan dapat digunakan untuk memperluas eksplorasi visualisasi dan analisis data. Gephi memiliki kapabilitas karena terdiri dari gabungan arsitektur yang fungsional dan fkleksibel yang dapat di kustomisasi dan disesuaikan sesuai kebutuhan dengan segala tipe jaringan yang ada untuk:

  • Eksplor
  • Analisis
  • Visualisasi
  • Spatialize
  • Filter
  • Cluster
  • Manipulasi
  • Export

Gephi adalah hasil visualisasi dan manipulasi paradigma yang memperbolehkan user untuk menemukan jaringan dan properti-properti data. Terlebih lagi, Gephi memang didesain untuk mengikuti dan menyesuaikan rantai dan alur dari sebuah dataset studi kasus yang memang memiliki banyak atribut. Gephi merupakan perangkat lunak yang dapat diakses bebas yang dapat didistribusikan dibawah GPL 3 (“GNU General Public License”). Paket atribut yang tersedia di Gephi dijalankan menggunakan Java pada NetBeans platform.

Python[sunting | sunting sumber]

Python merupakan bahasa pemrograman multiguna yang bersifat interpreter, berorientasi pada obyek dan dapat dioperasikan pada semua sistem operasi seperti Linux, Windows, Mac, dan lainnya[6]. Python dibuat oleh seorang keturunan Belanda yang bernama Guido van Rossum. Tujuan utama python adalah lebih memusatkan pada keterbacaan kode dalam memahami sintaks, dimana sintaks tersebut berfungsi untuk mempermudah dan mempercepat pemrogram dalam proses pengkodeannya dibandingkan Java atau C++[7].

Pada pengaplikasian python, terdapat banyak fungsi built-in (bawaan). Misalnya pada python 3.6 yang memiliki 68 fungsi built-in seperti abs(), all(), any(), ascii(), bin(), dan lainnya yang dapat memudahkan penggunanya dalam menyelesaikan suatu pekerjaan[8].

Dengan menggunakan python, para pengguna dapat melakukan pemuatan kembali secara dinamis seperti merubah, mengkontruksi, dan memodifikasi tanpa menghentikan modul python, dapat melakukan kompilasi untuk portable kode byte yang berdampak pada peningkatan kecepatan eksekusi dan menjaga kode sumber, dan juga dapat mengatur memori otomatis yaitu kumpulan memori yang kotor sehingga dapat mencegah pencacatan kode[7].

Netlytic[sunting | sunting sumber]

Netlytic adalah sebuah aplikasi berbasis web penganalisa teks berbasis cloud dan visualisasi jaringan sosial. Netlytic secara otomatis dapat meringkas volume teks yang besar dan menemukan serta memvisualisasikan jaringan sosial dari percakapan pada situs media sosial seperti Twitter, Youtube, komentar blog, forum online, dan obrolan. Netlytic dirancang untuk membantu peneliti dan yang lainnya memahami operasi grup online, dan menemukan bagaimana informasi mengalir dalam jaringan[9].

NiFi[sunting | sunting sumber]

Apache NiFi yang merupakan kepanjangan dari NiagaraFiles adalah sebuah proyek perangkat lunak dari Apache Software Foundation. Program ini di rancang untuk mengotomatisasi aliran data antara sistem perangkat lunak. Aliran data yang dimaksud disini yaitu aliran informasi otomatis yang terkelola antar sistem. Pola masalah ini sudah ada sejak perusahaan memiliki beberapa sistem, dimana ada sistem yang mengambil data dan ada sistem yang menggunakan data. Masalah dan pola solusi ini telah di diskusikan dan diartikulasikan menjadi sebuah bentuk yang komprehensif dan mudah dikonsumsi dalam Pola Integrasi Perusahaan (Enterprise Integration Patterns)[10].

Tableau[sunting | sunting sumber]

Software Tableau merupakan alat yang mendukung Business Intelligent yang dapat digunakan untuk membantu mengumpulkan, menyimpan, mengatur dan menganalisis data mentah sehingga menjadi sebuah informasi yang bernilai. Software Tableau terdiri dari beberapa versi yaitu Tableau Desktop, Tableau Server, Tableau Online, Tableau Reader, dan Tableau Public[11]. Secara umum, tableu digunakan untuk menganalisis data secara visual.

Tableu merupakan sebuah solusi untuk menangani semua kebutuhan bisnis, seperti:

  • Tampilan Dashboard
  • Penemuan Data
  • Laporan Hasil Analisis Analyst Level Reporting
  • Laporan dengan “Pixel Perfect” untuk percetakan
  • Laporan Operasional
  • Kemampuan menangani Big Data
  • Self Service
  • Embedded Analytics
  • Pengolahan dan pelaporan OLAP (Online Analytical Analysis)
  • Peramalan dan prediksi analisis

Dalam fenomena Big Data, software ini membantu dalam menerjemahkan data dengan skala besar ke dalam bentuk yang lebih mudah dipahami seperti grafik dan bagan yang unik. Mengingat pertumbuhan berbagai bentuk data yang terlalu banyak untuk ditangani dengan cara konvensional[12], sehingga memerlukan sebuah cara agar dapat mengolah data yang banyak tadi menjadi sebuah informasi dengan cepat dan mudah dipahami. Selain itu, Tableu juga dapat menyederhanakan data yang kompleks dan berantakan sehingga data tersebut dapat menghasilkan pola – pola yang mengandung wawasan yang mendukung analisa pada data. Dengan data yang dimiliki, dapat dilihat pola dari suatu trend dimana hal tersebut sangat membantu para analis khususnya dalam bidang bisnis[13]. Selain grafik dan bagan, Tableau juga dapat menghasilkan bentuk visualisasi berupa geocoding atau peta[13].

Implementasi Big Data[sunting | sunting sumber]

Bidang Bisnis[sunting | sunting sumber]

Salah satu kelebihan dari Gephi sebagai pengananalisa jaringan sosial adalah kemudahan dalam penggunaannya. Tidak perlu kemampuan khusus untuk mengoperasikannya. Anda hanya perlu memasukkan data jaringan sosial ke Gephi dan menggunakan beberapa algoritma yang telah disediakan dalam Gephi. Anda dapat melihat jaringan yang terhubung dengan pengelompokkannya dalam bentuk visual untuk kemudian dianalisa agar mendapatkan beberapa implikasi bisnis penting.

Saat ini sosial media merupakan sebuah tempat yang sangat powerful untuk mempromosikan sebuah brand atau produk. Hampir setiap brand hadir dalam media sosial terutama pada Facebook, Twitter, dan Instagram. Karena situs media sosial tersebut memiliki sangat banyak pengguna yang akan menganalisa performa brand yang hadir pada media sosial. Melalui Gephi, seseorang dapat menganalisa koneksinya di media sosial dan dapat dengan mudah menemukan implikasi bisnis seperti targeting, posisitioning, dan lain-lain berdasarkan kluster yang terbentuk pada Gephi[14].

Salah satu impikasi pemasaran yang paling penting dari visualisasi jaringan Gephi adalah targeting. Anda akan dengat sangat mudah menemukan demografi masyarakat atau kelompok dan kemudian mengambil keputusan targeting dan positioning dari sebuah brand[15].

Bidang Kesehatan[sunting | sunting sumber]

Mengetahui bahwa perkembangan penggunaan Big Data sudah sangat pesat dan kesadaran masyarakat dunia terhadap efektivitas penggunakan big data dalam aktifitasnya sehari hari juga merambah pada dunia kesehatan, yaitu dunia kedokteran. Dalam industri kesehatan digital, big data menggunakan teknik data science untuk menangkap dan menganalisis data yang sangat besar dan kompleks untuk memberikan dampak positif bagi hasil perawatan pasien dan mengoptimalkan proses bisnis.

Meskipun istilah big data merujuk pada volume data, itu bukanlah permasalahan utama karena big data juga dapat merujuk pada tingkat teknologi yang dibutuhkan organisasi untuk menangani dan fasilitas yang dibutuhkan untuk menyimpannya. Industri kesehatan menghasilkan data klinis, finansial, administratif dan genom yang sangat besar sehingga memerlukan teknik big data untuk membantu mengorganisirnya.

Pada tahun 2009, terdapat sebuah penelitian big data pada bidang kesehatan yaitu mengenai interaksi jaringan protein dalam melakukan prediksi kanker payudara menggunakan metode Dynamic Network Analysis[16]. Pada penelitian dijelaskan bagaimana evolusi kelas-kelas yang terbentuk dari interaksi antar cell dalam tubuh sehingga bisa mendapatkan polarisasi pembentukan sel kanker payudara. Perangkat lunak Gephi dapat dimanfaatkan untuk menganalisis hal yang serupa dengan visualisasi yang bisa ditampilkan menggunakan perangkat lunak tersebut.

Secara umum, penggunaan big data dalam bidang kesehatan akan mengarah kepada 6 kategori informasi, yaitu:

  1. Data web dan media sosial: seperti data interaksi yang didapatkan dari Facebook, Twitter, LinkedIn, blogs, health plan websites dan aplikasi dari smartphone.
  2. Machine-to-machine data: Seperti informasi dalam sensor, meter dan perangkat lain.
  3. Data Transaksi: seperti klaim layanan kesehatan dan catatan penagihan dalam format semi-terstruktur dan tidak terstruktur
  4. Data Biometrik: seperti data sidik jari, genetika, tulis tangan, pemindaian retina, sinar X dan gambar medis lainnya.
  5. Human-generated data: seperti data rekam medis elektronik (Electronic Medical Records/EMRs), catatan dokter, email, dan dokumen kertas lain.
  6. Data Litbang Farmasi: terkait dengan mekanisme tindakan obat, perilaku target ditubuh manusia dan efek samping dari segala tindak farmasi.

Bidang Pariwisata[sunting | sunting sumber]

Big data saat ini merupakan alat perang terbaik untuk terus menjadi nomor satu di podium industri pariwisata baik secara lokal maupun internasional, dengan peningkatan layanan dan ditunjang dengan kemampuan beradaptasi secara maksimum untuk kebutuhan para pengunjung tempat pariwisata yang ada. Jejaring sosial dan portal pariwisata baru yang mengandalkan kolaborasi pengguna telah menjadi salah satu referensi utama ketika mengavaluasi atau merencanakan perjalanan. Big Data dapat menjadi sumber inovasi bagi organisasi pariwisata dan industri pada umumnya. Potensi yang dimiliki dalam industri pariwisata sangat besar dan perusahaan tidak boleh meremehkan pentingnya big data.

Dengan pendekatan yang tepat, industri pariwisata dapat belajar banyak tentang preferensi konsumen dan menggunakan informasi dan wawasan ini untuk membangun hubungan dengan pelancong pada waktu yang tepat sangatlah penting. Tanpa informasi yang tepat dan pendekatan penargetan yang sangat baik, iklan tidakakan menghasilkan konversi apapun dan tidak akan ada ROI. Perjalanan adalah industri yang serba cepat, yang benar benar mendorong kebutuhan untuk analisis data yang cepat dan keputusan cepat. Di bidang pariwisata, tuntutan apapun perlu ditangani secara instan agar tetap relevan bagi wisatawan, yang membuat big data menjadi sangat penting.

Jejaring sosial dan portal pariwisata baru yang mengandalkan kolaborasi pengguna telah menjadi salah satu referensi utama ketika mengevaluasi atau merencanakan perjalanan. Sangat penting untuk memantau semua pendapat dan pengalaman yang ditinggalkan wisatawan seperti sidik jari digital, dan karena itu, alat yang tepat diperlukan. Tidak ada keraguan tentang pentingnya menganalisis reputasi yang dibuat secara spontan di jejaring sosial atau di portal pariwisata tertentu karena disamping itu, pendapat pengguna dikondisikan oleh orang lain dan terlebih lagi, pengguna memiliki pengaruh sosial atau bertindak dalam lingkungan yang dekat.

Teknik analisis sentiman adalah salah satu tugas khas pemrosesan bahasa alami (Natural Language Processing/NLP), yang mengelola deteksi komentar positif, negatif dan netral yang ditulis dalam bahasa alami dengan tingkat keandalan yang tinggi. Emosi, opini dan perasaan ini diekstraksi dari konten yang dituangkan oleh pengunjung dan pengguna ke jaringan sosial dan platform analisis wisata. Prosedur ini dilakukan secara otomatis melalui mesin analisis sentimen. Pada dasarnya, ada dua model NLP: Linguistik, berdasarkan grammar, dan probabilitas, berdasarkan data. Dalam model linguistik, ada tingkat kedalaman yang berbeda. Dalam analisis leksikal, mesin mencapai tingkat yang lebih dangkal, mengklasifikasikan sebagai positif atau negatif sesuai dengan kata-kata umum seperti hebat, mengerikan, dll. Ada analisis yang lebih mendalam dalam memahami arti kata-kata menggunakan morfologi, sintaksis atau kontekstual informasi.

Dalam analisis yang lebih kompleks ini, dapat mengambil data melalui media sosial seperti instagram, twitter, dll dengan mengambil konten tulisan opini yang telah dibuat oleh pengguna, menggunakan analisis ini mesin akan mengolah model yang dapat mengenali struktur teks positif dengan kata-kata negatif atau mengenali penggunaan idiomatik dan kata-kata berbentuk sarkasme. Analisis lebih mendalam ini, tanpa diragukan lagi, merupakan revolusi bagi industri pariwisata, berkat ini diproses informasi, dapat memberdayakan dan meningkatkan layanannya secara maksimal karena mengetahui bagaimana persepsi dan opini masyarakat akan suatu hal, sudah sesuai ekspektasi dan perencanaan pemasaran atau masih dianggap belum memuaskan.

Pada tahun 2016, sudah tahun ketujuh berturut-turut hasil analisa data wisata di Amerika menunjukan bahwa jumlah kedatangan wisatawan internasional (pengunjung satu malam) tumbuh sebesar 3,9% dan mencapai total 1.235 juta di seluruh dunia. Data ini menyoroti dampak industri pariwisata terhadap ekonomi global[17].

Perusahaan di sektor pariwisata sudah banyak yang sadar akan peran big data jika ingin menjadi pemimpin di pasar, banyak yang sudah menjadi perusahan dengan ideologi data-driven. Itulah mengapa mereka mengakui Big Data sebagai senjata terbaik untuk terus berada di garis depan pariwisata internasional.

Referensi[sunting | sunting sumber]

  1. ^ Narendra, Albertus Pramukti (2015). "Data Besar, Data Analisis, dan Pengembangan Kompetensi Pustakawan". Record and Library Journal. Vol. 1 No. 2. 
  2. ^ Blasiak, Kevin (2014). "Big Data; A Management Revolution". 
  3. ^ Permana, Yana. "Mengenal Big Data - CodePolitan.com". www.codepolitan.com (dalam bahasa Inggris). Diakses tanggal 2018-06-26. 
  4. ^ "Data Virtualization – dataWerks". www.datawerks.com (dalam bahasa Inggris). Diakses tanggal 2018-04-10. 
  5. ^ "About". gephi.org. Diakses tanggal 2018-06-26. 
  6. ^ Rosmala, Dewi; L., Gadya Dwipa (2012). "Pembangunan Website Content Monitoring System Menggunakan Difflib Python". Jurnal Informatika. Vol. 2 No. 3. 
  7. ^ a b Solutions, Mindfire (2017-04-24). "Advantages and Disadvantages of Python Programming Language". Medium. Diakses tanggal 2018-06-26. 
  8. ^ "Fungsi Built-in Python – Pythonindo". www.pythonindo.com (dalam bahasa Inggris). Diakses tanggal 2018-06-26. 
  9. ^ "Netlytic - social media text and social networks analyzer". netlytic.org. Diakses tanggal 2018-06-26. 
  10. ^ "Apache NiFi". nifi.apache.org (dalam bahasa Inggris). Diakses tanggal 2018-06-26. 
  11. ^ "Products". Tableau Software (dalam bahasa Inggris). Diakses tanggal 2018-06-26. 
  12. ^ "Big Data". Tableau Software (dalam bahasa Inggris). Diakses tanggal 2018-06-26. 
  13. ^ a b "Tableau 10.5 Features". Tableau Software (dalam bahasa Inggris). Diakses tanggal 2018-06-26. 
  14. ^ Rawat, Shubham (2013-11-07). "ANALYTICS BLOG: GEPHI and its implication in MARKETING". ANALYTICS BLOG. Diakses tanggal 2018-06-26. 
  15. ^ "Visualize a network data in Gephi step by step - Artificial Intelligence Marketing Lab". Artificial Intelligence Marketing Lab (dalam bahasa Inggris). 2017-08-27. Diakses tanggal 2018-06-26. 
  16. ^ "5 Contoh Penerapan Big Data dalam Bidang Kesehatan - idBigData". idBigData (dalam bahasa Inggris). 2017-08-28. Diakses tanggal 2018-06-26. 
  17. ^ Larry.Brain@tourism-review.com, Larry Brain,. "SOLO TRAVELING MEANS PAYING THROUGH THE NOSE. OR NOT? | .TR" (dalam bahasa Inggris). Diakses tanggal 2018-06-26.