Analisis data

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Loncat ke navigasi Loncat ke pencarian

Analisis data adalah proses inspeksi, pembersihan dan pemodelan data dengan tujuan menemukan informasi yang berguna, menginformasikan kesimpulan dan mendukung pengambilan keputusan. Analisis data memiliki banyak sisi dan pendekatan, mencakup beragam teknik dengan berbagai nama, dan digunakan dalam berbagai bidang bisnis, ilmu pengetahuan, dan ilmu sosial. Dalam dunia bisnis saat ini, analisis data berperan dalam membuat keputusan lebih ilmiah dan membantu bisnis beroperasi lebih efektif.[1]

Penggalian data adalah teknik analisis data tertentu yang berfokus pada pemodelan statistik dan penemuan pengetahuan untuk tujuan prediksi dan bukan murni deskriptif, sedangkan intelijen bisnis mencakup analisis data yang sangat bergantung pada agregasi, dengan fokus utama pada informasi bisnis.[2]

Proses analisis data[sunting | sunting sumber]

Diagram alur proses ilmu data dari Doing Data Science, oleh Schutt & O'Neil (2013)

Analisis, mengacu pada membagi keseluruhan menjadi komponen-komponen yang terpisah untuk pemeriksaan individu.[3] Analisis data, adalah proses untuk memperoleh data mentah, dan selanjutnya mengubahnya menjadi informasi yang berguna untuk pengambilan keputusan oleh pengguna.[4] Data, dikumpulkan dan dianalisis untuk menjawab pertanyaan, menguji hipotesis, atau menyangkal teori.[5]

Ahli statistik John Tukey, mendefinisikan analisis data pada tahun 1961, sebagai:

“Prosedur untuk menganalisis data, teknik untuk menafsirkan hasil dari prosedur tersebut, cara merencanakan pengumpulan data untuk membuat analisisnya lebih mudah, lebih tepat atau lebih akurat, dan semua mesin dan hasil statistik (matematis) yang berlaku untuk menganalisis data."[6]

Ada beberapa fase yang dapat dibedakan, dijelaskan di bawah ini. Fase-fase tersebut berulang, di mana umpan balik dari fase selanjutnya dapat menghasilkan pekerjaan tambahan di fase sebelumnya.[7] Kerangka kerja CRISP, yang digunakan dalam penambangan data, memiliki langkah serupa.

Persyaratan data[sunting | sunting sumber]

Data diperlukan sebagai masukan untuk analisis, yang ditentukan berdasarkan kebutuhan mereka yang mengarahkan analisis atau pelanggan (yang akan menggunakan produk akhir analisis).[8][9] Jenis umum entitas di mana data akan dikumpulkan disebut sebagai unit eksperimen (misalnya, orang atau populasi orang). Variabel khusus mengenai populasi (misalnya, usia dan pendapatan) dapat ditentukan dan diperoleh. Data mungkin numerik atau kategorikal (yaitu, label teks untuk angka).[7]

Pengumpulan data[sunting | sunting sumber]

Data dikumpulkan dari berbagai sumber.[10][11] Persyaratan dapat dikomunikasikan oleh analis kepada penjaga data; seperti, personel Teknologi Informasi dalam suatu organisasi.[12] Data juga dapat dikumpulkan dari sensor di lingkungan, termasuk kamera lalu lintas, satelit, alat perekam, dll. Data juga dapat diperoleh melalui wawancara, unduhan dari sumber online, atau membaca dokumentasi.[7]

Pengolahan data[sunting | sunting sumber]

Fase siklus kecerdasan yang digunakan untuk mengubah informasi mentah menjadi kecerdasan atau pengetahuan yang dapat ditindaklanjuti secara konseptual mirip dengan fase dalam analisis data. Data, ketika awalnya diperoleh, harus diproses atau diatur untuk analisis.[13][14] Misalnya, ini mungkin melibatkan penempatan data ke dalam baris dan kolom dalam format tabel (dikenal sebagai data terstruktur) untuk analisis lebih lanjut, seringkali melalui penggunaan spreadsheet atau perangkat lunak statistik.[7]

Pembersihan data[sunting | sunting sumber]

Analisis data terkait[sunting | sunting sumber]

Pemodelan dan algoritma[sunting | sunting sumber]

Produk data[sunting | sunting sumber]

Komunikasi[sunting | sunting sumber]

Referensi[sunting | sunting sumber]

  1. ^ Xia, B. S., & Gong, P. (2015). Review of business intelligence through data analysis. Benchmarking, 21(2), 300-311. doi:10.1108/BIJ-08-2012-0050
  2. ^ Exploring Data Analysis
  3. ^ Field, John (2009), "Dividing listening into its components", Listening in the Language Classroom, Cambridge: Cambridge University Press, hlm. 96–109, doi:10.1017/cbo9780511575945.008, ISBN 978-0-511-57594-5, diakses tanggal 2021-05-29 
  4. ^ "Transforming Unstructured Data into Useful Information", Big Data, Mining, and Analytics, Auerbach Publications, hlm. 227–246, 2014-03-12, doi:10.1201/b16666-14, ISBN 978-0-429-09529-0, diakses tanggal 2021-05-29 
  5. ^ Judd, Charles and, McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0. 
  6. ^ John Tukey-The Future of Data Analysis-July 1961
  7. ^ a b c d Schutt, Rachel; O'Neil, Cathy (2013). Doing Data Science. O'Reilly Media. ISBN 978-1-449-35865-5. 
  8. ^ "USE OF THE DATA", Handbook of Petroleum Product Analysis, Hoboken, NJ: John Wiley & Sons, Inc, hlm. 296–303, 2015-02-06, doi:10.1002/9781118986370.ch18, ISBN 978-1-118-98637-0, diakses tanggal 2021-05-29 
  9. ^ author., Ainsworth, Penne (20 May 2019). Introduction to accounting : an integrated approach. ISBN 978-1-119-60014-5. OCLC 1097366032. 
  10. ^ 1954-, Margo, Robert A. (Robert Andrew) (2000). Wages and labor markets in the United States, 1820-1860. University of Chicago Press. ISBN 0-226-50507-3. OCLC 41285104. 
  11. ^ Olusola, Johnson Adedeji; Shote, Adebola Adekunle; Ouigmane, Abdellah; Isaifan, Rima J. (7 May 2021). "Table 1: Data type and sources of data collected for this research". PeerJ. 9: e11387. doi:10.7717/peerj.11387/table-1. Diakses tanggal 2021-05-29. 
  12. ^ MacPherson, Derek (2019-10-16), "Information Technology Analysts' Perspectives", Data Strategy in Colleges and Universities, Routledge, hlm. 168–183, doi:10.4324/9780429437564-12, ISBN 978-0-429-43756-4, diakses tanggal 2021-05-29 
  13. ^ 1959-, Nelson, Stephen L. (2014). Excel data analysis for dummies. Wiley. ISBN 978-1-118-89810-9. OCLC 877772392. 
  14. ^ "Figure 3—source data 1. Raw and processed values obtained through qPCR". dx.doi.org. 30 August 2017. doi:10.7554/elife.28468.029. Diakses tanggal 2021-05-29. 

Bacaan lebih lanjut[sunting | sunting sumber]

  • Adèr, H.J. & Mellenbergh, G.J. (with contributions by D.J. Hand) (2008). Advising on Research Methods: A Consultant's Companion. Huizen, the Netherlands: Johannes van Kessel Publishing.
  • Chambers, John M.; Cleveland, William S.; Kleiner, Beat; Tukey, Paul A. (1983). Graphical Methods for Data Analysis, Wadsworth/Duxbury Press. ISBN 0-534-98052-X
  • Fandango, Armando (2008). Python Data Analysis, 2nd Edition. Packt Publishers.
  • Juran, Joseph M.; Godfrey, A. Blanton (1999). Juran's Quality Handbook, 5th Edition. New York: McGraw Hill. ISBN 0-07-034003-X
  • Lewis-Beck, Michael S. (1995). Data Analysis: an Introduction, Sage Publications Inc, ISBN 0-8039-5772-6