Komputasi paralel

Komputasi paralel atau komputasi sejajar adalah salah satu teknik melakukan komputasi secara bersamaan dengan memanfaatkan beberapa komputer independen secara bersamaan. Ini umumnya diperlukan saat daya tampung yang diperlukan sangat besar, baik karena harus mengolah data dalam jumlah besar (di industri keuangan, bioinformatika, dll.) maupun karena tuntutan proses komputasi yang banyak. Kasus kedua umum ditemui di kalkulasi numerik untuk menyelesaikan persamaan matematis di bidang fisika (fisika komputasi), kimia (kimia komputasi) dll.

Mesin Paralel

Untuk melakukan aneka jenis komputasi paralel ini diperlukan infrastruktur mesin paralel yang terdiri dari banyak komputer yang dihubungkan dengan jejaringan dan mampu bekerja secara sejajar untuk menyelesaikan satu masalah. Untuk itu diperlukan aneka perangkat lunak pendukung yang biasa disebut sebagai middleware yang berperan untuk mengatur distribusi pekerjaan antarnode dalam satu mesin paralel. Selanjutnya pemakai harus membuat penataolahan sejajar untuk merealisasikan komputasi. Tidak berarti dengan mesin paralel semua program yang dijalankan di atasnya otomatis akan diolah secara paralel.

Salah satu middleware orisinal yang dikembangkan di Indonesia adalah openPC^[1] yang digawangi oleh GFTK LIPI dan telah diimplementasikan dengan di LIPI Public Cluster.

GRID

GRID merupakan pengembangan teknologi mesin paralel dengan memanfaatkan jejaringan pita lebar pada era digital. Dengan adanya jejaringan pita lebar, paralelisasi atau penyejajaran tidak hanya dilakukan antarkomputer dalam satu jaringan, tetapi juga antar mesin paralel yang terpisah secara geografis.

Pemrograman Paralel

Pemrograman paralel adalah teknik pemrograman komputer yang memungkinkan eksekusi perintah/operasi secara bersamaan (komputasi paralel), baik dalam komputer dengan satu (prosesor tunggal) ataupun banyak (prosesor ganda dengan mesin paralel) CPU. Bila komputer yang digunakan secara bersamaan tersebut dilakukan oleh komputer-komputer terpisah yang terhubung dalam suatu jaringan komputer lebih sering istilah yang digunakan adalah sistem terdistribusi (distributed computing).

Motivasi

Tujuan utama dari penataolahan sejajar (parallel programing) adalah untuk meningkatkan kinerja komputasi. Semakin banyak hal yang bisa dilakukan secara bersamaan (dalam waktu yang sama), semakin banyak pekerjaan yang bisa diselesaikan. Analogi yang paling gampang adalah, bila anda dapat merebus air sambil memotong-motong bawang saat anda akan memasak, waktu yang anda butuhkan akan lebih sedikit dibandingkan bila anda mengerjakan hal tersebut secara berurutan (serial). Atau waktu yg anda butuhkan memotong bawang akan lebih sedikit jika anda kerjakan berdua.

Kinerja dalam pemrograman paralel diukur dari berapa banyak peningkatan kecepatan (speed up) yang diperoleh dalam menggunakan tehnik paralel. Secara informal, bila anda memotong bawang sendirian membutuhkan waktu 1 jam dan dengan bantuan teman, berdua anda bisa melakukannya dalam 1/2 jam maka anda memperoleh peningkatan kecepatan sebanyak 2 kali.

Peningkatan Kecepatan

Peningkatan kecepatan dapat diformulasikan dalam persamaan berikut ini

$S={\frac {T_{1}}{T_{j}}}$

Dimana $T_{1}$ adalah waktu yang dibutuhkan untuk menyelesaikan pekerjaan (program komputer) bila dijalankan dalam satu komputer. Dan $T_{j}$ adalah waktu yang dibutuhkan jika pekerjaan dikerjakan bersamaan oleh beberapa komputer.

Ada limitasi dalam usaha membuat suatu program komputer berjalan lebih efisien melalui peningkatan kecepatan, hukum yang menetapkan batasan ini dikenal sebagai Hukum Amdahl. Ide dari hukum amdahl ini adalah bahwa anda hanya akan bisa meningkatkan efisiensi program komputer anda, sebatas pada bagian tertentu dari program tersebut yang dapat di paralelkan. Sementara bagian yang memang harus dilaksanakan secara berurutan, akan menjadi penentu kinerja akhir.

Kembali ke analogi memasak tadi, bila anda harus menggunakan sarung tangan sebelum menyalakan kompor ataupun memotong bawang, maka waktu yang anda butuhkan untuk memakai sarung tangan ini adalah waktu serial, yang tidak dapat dihindari. Sementara waktu untuk memasak dan memotong bawang tadi adalah bagian yang bisa diparalelkan.

Hukum Amdahl

Telah dijelaskan bahwa dari $T_{1}$ (waktu yg dibutuhkan menjalankan pekerjaan dalam satu komputer) tadi, ada sebagian yg tidak bisa diparalelkan. Untuk menyatakan ini kita gunakan notasi $\alpha$ dimana $0\leq \alpha \leq 1$ menunjukkan berapa bagian dari $T_{1}$ yang tidak bisa dijadikan paralel (atau bagian serial dari program ini).

Maka kita ketahui $\alpha *T_{1}$ adalah waktu yg tidak akan terpengaruh oleh bertambahnya komputer yg digunakan (a).

Sisanya $(1-\alpha )*T_{1}$ adalah waktu yang akan berkurang menjadi ${\frac {(1-\alpha )*T_{1}}{N}}$ bila kita menggunakan N komputer tambahan {b) .

Sehingga waktu total yang dibutuhkan untuk menjalankan pekerjaan dalam N komputer adalah (a) + (b) alias:

T_{N}=\alpha *T_{1}+{\frac {(1-\alpha )*T_{1}}{N}}

Peningkatan kecepatan yang kita peroleh dari persamaan ini adalah:

S_{N}={\frac {T_{1}}{\alpha *T_{1}+{\frac {(1-\alpha )*T_{1}}{N}}}}

Mungkin anda akan mendapati persamaan speed up yang terlihat berbeda tetapi pada dasarnya sama. Persamaan dibawah, bisa didapat dari persamaan di atas, dengan mengeliminasi komponen $T_{1}$ (pada bagian atas dan bawah persamaan), lalu mengatur N dan $\alpha$

S_{N}={\frac {N}{1+\alpha (N-1)}}

Bila anda cermati persamaan di atas, bisa dilihat bahwa jika kita menggunakan komputer yang amat banyak ( $N\rightarrow \infty$ ) komponen (b) akan dapat diabaikan, menyisakan persamaan:

S_{N}={\frac {1}{\alpha }}

Inilah batas maksimum peningkatan kecepatan yang bisa dicapai menurut hukum Amdahl yaitu perbandingan terbalik dari seberapa banyak bagian serial dari suatu pekerjaan.

Dalam sistem terdistribusi dimana anda berusaha menggunakan lebih banyak prosesor untuk menyelesaikan masalah, akan ada imbal balik. Menggunakan komputer tambahan dari lokasi yang berbeda memberikan anda sumber komputasi baru, tetapi juga melibatkan biaya komunikasi tambahan, saat anda harus memberikan pekerjaan tersebut pada komputer yg terpisah.

Bahasa populer dalam Pemrograman Paralel

MPI Message Passing Interface, bahasa pemrograman dengan basis pertukaran pesan.
PVM Parallel Virtual machine.

Istilah-istilah dalam pemrograman paralel

Embarasingly Parallel adalah pemrograman paralel yang digunakan pada masalah-masalah yang bisa diparalelkan tanpa membutuhkan komunikasi satu sama lain. Sebenarnya pemrograman ini bisa dibilang sebagai pemrograman paralel yang ideal, karena tanpa biaya komunikasi, lebih banyak peningkatan kecepatan yang bisa dicapai.
Taksonomi dari model pemrosesan paralel dibuat berdasarkan alur instruksi dan alur data yang digunakan:
- SISD - Single Instruction Single Datapath, ini prosesor tunggal, yang bukan paralel.
- SIMD - Single Instruction Multiple Datapath, alur instruksi yang sama dijalankan terhadap banyak alur data yang berbeda. Alur instruksi di sini kalau tidak salah maksudnya ya program komputer itu. trus datapath itu paling ya inputnya, jadi inputnya lain-lain tetapi program yang digunakan sama.
- MIMD - Multiple Instruction Multiple Datapath, alur instruksinya banyak, alur datanya juga banyak, tetapi masing-masing bisa berinteraksi.
- MISD - Multiple Instruction Single Datapath, alur instruksinya banyak tetapi beroperasi pada data yang sama.

Perkembangan di Indonesia

Di Indonesia, usaha untuk membangun infrastruktur mesin paralel sudah dimulai sejak era 90-an, meski belum pada tahap serius dan permanen. Namun untuk pemrograman paralel sudah sejak awal menjadi satu mata-kuliah wajib di banyak perguruan tinggi terkait. Baru pada tahun 2005 dimulai pembuatan infrastruktur mesin paralel permanen, misalnya yang dikembangkan oleh Grup Fisika Teoritik dan Komputasi di P2 Fisika LIPI. Didorong oleh perkembangan pemrograman paralel yang lambat, terutama terkait dengan sumber daya manusia (SDM) yang menguasainya, mesin paralel LIPI ini kemudian dibuka untuk publik secara cuma-cuma dalam bentuk LIPI Public Cluster (LPC).^[2] Saat ini LPC telah dikembangkan lebih jauh menjadi gerbang komputasi GRID di Indonesia dengan kerjasama global menjadi IndoGRID.

Pada tahun berikutnya, dengan dukungan dana dari proyek Inherent Dikti, Fasilkom UI juga membangun mesin paralel.^[3] Sementara itu pada tahun 2009, ITB membuat kluster hibrid CPU dan GPU yang pertama di Indonesia dengan kemampuan hingga 60 inti CPU dan 1920 inti GPU.

Referensi

^ openPC - tool-set untuk cluster publik
^ LIPI Public Cluster Diarsipkan 2008-07-04 di Wayback Machine.
^ "InGRID". Diarsipkan dari versi asli tanggal 2007-12-28. Diakses tanggal 2021-05-09.

[1] PC - tool-set untuk cluster publik

[2] LIPI Public Cluster Diarsipkan 2008-07-04 di Wayback Machine.

[3] "InGRID". Diarsipkan dari versi asli tanggal 2007-12-28. Diakses tanggal 2021-05-09.

[1]

[2]

[3]

l b s Komputasi paralel
Umum	Komputasi awan Komputasi kinerja-tinggi Komputasi gugusan Komputasi terdistribusi Komputasi grid
Tingkatan	Bit Instruksi Data Tugas
Thread	Superthreading Hyperthreading
Teori	Hukum Amdahl Hukum Gustafson Efisiensi biaya Metrik Karp–Flatt Kemunduran Percepatan
Elemen	Proses Thread Serat PRAM Jendela instruksi
Koordinasi	Multiproses Multithreading (arsitektur komputer) Koherensi memori Koherensi cache Invalidasi cache Barrier Sinkronisasi Pemeriksaan aplikasi
Pemrograman	Model Pararelisme implisit Paralelisme eksplisit Konkurensi Taksonomi Flynn SISD SIMD MISD MIMD SPMD Thread (ilmu komputer) Algoritma non-blok
Perangkat keras	Multiprosesor Simetris Asimetris Memoro NUMA COMA Terdistribusi Berbagi Berbagi terdistribusi SMT MPP Superskalar Prosesor vektor Superkomputer Beowulf
API	Ateji PX POSIX Threads OpenMP OpenHMPP PVM MPI UPC Intel Threading Building Blocks Boost.Thread Global Arrays Charm++ Cilk Co-array Fortran OpenCL CUDA Dryad
Masalah	Paralel memalukan Grand Challenge Software lockout Skalabilitas Kondisi jarak Deadlock Livelock Algoritma deterministik Kemunduran paralel
Kategori Commons

Pengawasan otoritas
Perpustakaan nasional	Prancis (data) Amerika Serikat
Lain-lain	Microsoft Academic 2