Tuesday, July 30, 2013

Tutorial AWK di Linux / Unix


Pada artikel sebelumnya mengenai awk saya sudah sedikit menjelaskan apa itu awk. Perlu diketahui lagi, dari beberapa referensi yang saya dapat bahwa AWK itu ternyata sebuah singkatan dari pembuat algoritma pengurai ini. AWK diambil dari inisial ketiga pembuatnya yaitu “Aho, Weinberger, and Kernighan”. Awk paling sering digunakan untuk me-scan dan mem-proses sebuah pola. Pencarian pada sebuah file yang cocok dengan pola yang dibuat lalu menyaring pencarian tersebut kedalam sebuah file baru.

Berikut ini adalah fitur-fitur yang dimiliki Awk :
  • Awk menjadikan text file sebagai records dan fields
  • Seperti bahasa pemrograman lainnya, Awk mengandung variabel, kondisi, dan looping
  • Awk mempunyai operator aritmatika dan string
  • Awk bisa digenerate menjadi laporan yang berformat

Awk membaca dari sebuah file atau dari input standard, dan menjadikannya output standard. Awk tidak bisa digunakan pada file yang tidak mengandung text.

syntax :
awk '/search pattern1/ {action}
     /search pattern2/ {action}' file
 

Dari syntax awk diatas, artinya :
  • Pencarian pola adalah merupakan regular expression
  • Action - statements atau keputusan yang akan diambil
  • Awk bisa memungkinkan kita untuk membuat banyak pola dan banyak action

Cara kerja Awk 
  • Awk membaca baris dalam sebuah file.
  • Untuk beberapa baris, ini dicocokkan dengan pola yang dibuat. Jika polanya cocok maka keputusan selanjutnya bisa dilakukan, seperti print misalnya.
  • Jika tidak ada pola yang cocok, maka tidak ada action/keputusan yang akan diambil.
  • Memberikan pola atau action tidak diharuskan.
  • Jika tidak ada pola yang dibuat, maka output default nya adalah setiap baris dari file yang anda pakai.
  • Jika tidak ada action/keputusan yang dibuat, maka output default nya adalah memunculkan hasil pencarian pada layar anda.
  • Kurung kurawal tanpa action itu artinya tidak ada keputusan, tapi tidak akan memunculkan output default tadi.
  • Setiap statemen dalam action harus di pisahkan dengan tanda titik koma (;) 

Mari kita praktekan, meskipun algoritma awk ini ada pada linux maupun unix, saya menggunakan Ubuntu 12.04. Pertama, kita buat file yang berisi seperti ini :

root@laborate:/home/apocalypsix/awk# cat pegawai.txt
1000001 Deri    Manager         Sales           Rp.2.000.000
1000002 Pepi    Developer       IT              Rp.3.000.000
1000003 Desi    Sysadmin        IT              Rp.5.000.000
1000004 Anisa   Manager         Marketing       Rp.6.000.000
1000005 Rendi   DBA             IT              Rp.7.000.000

Contoh 1 : Metode default pada awk



Secara default awk mencetak setiap baris dalam sebuah file.

root@laborate:/home/apocalypsix/awk# awk '{print;}' pegawai.txt
1000001 Deri    Manager         Sales           Rp.2.000.000
1000002 Pepi    Developer       IT              Rp.3.000.000
1000003 Desi    Sysadmin        IT              Rp.5.000.000
1000004 Anisa   Manager         Marketing       Rp.6.000.000
1000005 Rendi   DBA             IT              Rp.7.000.000

Pada contoh diatas kita tidak membuat sebuah pola, jadi action ini berlaku untuk semua baris tanpa penyaringan. Action print tanpa argumen akan mencetak semua baris juga secara default, jadi ini mencetak semua baris dari file tersebut. Statement action harus berada dalam kurung kurawal seperti contoh diatas.


Contoh 2 : Print baris-baris tertentu yang cocok dengan pola



root@laborate:/home/apocalypsix/awk# awk '/Deri/
> /Anisa/' pegawai.txt
1000001 Deri    Manager         Sales           Rp.2.000.000
1000004 Anisa   Manager         Marketing       Rp.6.000.000


Dari contoh diatas awk mencetak baris-baris tertentu yang memiliki kecocokan dengan pola. Pola yang kita buat adalah “Deri” dan “Anisa”. Awk mencari baris yang mengandung “Deri” maupun “Anisa” pada baris manapun dalam file tersebut.


Contoh 3 : Hanya mencetak field tertentu secara spesifik.



Algoritma memiliki angka dari variable yang dibangun. Untuk setiap record pada baris dalam sebuah file, ini di pecah oleh pemisah karakter blank space atau whitespace secara default dan tersimpan dalam variabel $n. Jika pada baris hanya memiliki 4 kata, maka akan tersimpan sebagai $1, $2, $3, $4. $0 mewakili semua baris. NF yang dibuat dalam variabel yang mewakili jumlah field dalam record.

root@laborate:/home/apocalypsix/awk# awk '{print $2,$5;}' pegawai.txt
Deri Rp.2.000.000
Pepi Rp.3.000.000
Desi Rp.5.000.000
Anisa Rp.6.000.000
Rendi Rp.7.000.000
root@laborate:/home/apocalypsix/awk# awk '{print $2,$NF;}' pegawai.txt
Deri Rp.2.000.000
Pepi Rp.3.000.000
Desi Rp.5.000.000
Anisa Rp.6.000.000
Rendi Rp.7.000.000

Dari contoh diatas $2 dan $5 mewakili Nama dan Gaji. Kita bias mendapatkan gaji menggunakan $NF juga, dimana $NF mewakili field terakhir.


 Contoh 4 : Inisialisasi dan Final Action



Awk memiliki 2 pola penting yang dibuat spesifik berdasarkan kata kunci yang disebut BEGIN dan END.

Syntax:

BEGIN { Actions}
{ACTION} # Action for everyline in a file
END { Actions }

# is for comments in Awk

Action yang spesifik pada bagian BEGIN akan meng-eksekusi sebelum memulai pembacaan baris file dari input. Action END akan melakukannya setelah selesai membaca dan memproses baris dalam input.

root@laborate:/home/apocalypsix/awk# awk 'BEGIN {print "Nama\tPosisi\tDivisi\tGaji";}
> {print $2,"\t",$3,"\t",$4,"\t",$NF;}
> END {print "Report Generated\n-------------";
> }' pegawai.txt
Nama     Posisi          Divisi          Gaji
Deri     Manager         Sales   Rp.2.000.000
Pepi     Developer       IT      Rp.3.000.000
Desi     Sysadmin        IT      Rp.5.000.000
Anisa    Manager         Marketing       Rp.6.000.000
Rendi    DBA     IT      Rp.7.000.000
Report Generated
-------------

Dari contoh diatas, awk mencetak semua headline dan baris terakhir untuk laporan.


Contoh 5 : Mencari pegawai yang memiliki ID lebih besar dari 1000002



root@laborate:/home/apocalypsix/awk# awk '$1 >1000002' pegawai.txt
Nip     Nama    Posisi          Divisi          Gaji
1000003 Desi    Sysadmin        IT              Rp.5.000.000
1000004 Anisa   Manager         Marketing       Rp.6.000.000
1000005 Rendi   DBA             IT              Rp.7.000.000

Dari contoh diatas, pertama field $1 adalah ID karyawan. Jadi jika $1 lebih besar dari 1000002, maka lakukan action default print untuk mencetak semua baris.


Contoh 6 : Cetak list dari karyawan dari Divisi IT



Nama divisi berada pada field ke-4. Jadi perlu di cek jika $4 cocok dengan string “IT”, jika ya print baris nya.

root@laborate:/home/apocalypsix/awk# awk '$4 ~/IT/' pegawai.txt
1000002 Pepi    Developer       IT              Rp.3.000.000
1000003 Desi    Sysadmin        IT              Rp.5.000.000
1000005 Rendi   DBA             IT              Rp.7.000.000

Operator ~ adalah untuk pembanding regular expression. Jika cocok action default (Print semua baris akan dilakukan)


Contoh 7 : Print jumlah pegawai yang berada di Divisi IT



Contoh dibawah ini, lakukan cek jika divisi nya IT. Jika ya, pada action, hanya menghitung jumlah variabel, dimana telah diinisialisasi dengan 0 pada bagian BEGIN.

root@laborate:/home/apocalypsix/awk# awk 'BEGIN {count=0;}
> $4 ~ /IT/ { count++; }
> END { print "Jumlah karyawan divisi IT =",count;}' pegawai.txt
Jumlah karyawan divisi IT = 3

Lalu dibagian akhir dari proses, hanya lakukan pencetakan isi dari variabel count yang kita buat untuk menghitung karyawan yang berada di divisi IT.

Sekian dulu tutorial awk di linux/unix ini. jika anda mengalami kesulitan jangan sungkan untuk bertanya, saya dengan senang hati akan membantu.

Semoga bermanfaat.
Salam penguin! :)

No comments:

Post a Comment