10 September 2014

Konsep dan Notasi Bahasa-Teknik Kompilasi - Materi 2

Untuk dapat menyelami proses kompilasi diperlukan waktu yang lebih guna mengamati perilaku kompilasi.
Terdapat bahasa-bahasa pemrograman yang berbeda macam dan bahkan platform, untuk itu perlu ada keseragaman.

Konsep dan Notasi Bahasa
Teori Bahasa
Bahasa adalah kumpulan kalimat. Kalimat adalah rangkaian kata. Kata adalah komponen terkecil kalimat yang tidak bisa dipisahkan lagi.
Contoh : Si Kucing kecil menendang bola besar ----------->     Bhs Indonesia
               The little cat  kicks a big ball                 ----------->     Bhs Inggris
               for i := start to finish do A[i] := B[i]*sin(i*pi/16.0) -->  Bhs Pascal
Dalam bahasa pemrograman, kalimat dikenal sebagai ekspresi, dan kata sebagai token. Kata terdiri atas beberapa karakter. Kelompok karakter yang membentuk sebuah token dinamakam lexeme untuk token tersebut. Setiap token yang dihasilkan, disimpan dalam tabel simbol.
Derivasi adalah sebuah proses dimana suatu himpunan produksi akan diturunkan / dipilah-pilah dengan melakukan sedertan produksi sehingga membentuk untai terminal.

Grammar dan bahasa

Pengertian dasar
  1. Setiap anggota alfabet, dinamakan sebagai simbol terminal atau token.
  2. Himpunan simbol terminal dinyatakan sebagai VT, sedangkan himpunan simbol non terminal dinyatakan sebagai VN.
  3. Simbol-simbol berikut adalah simbol terminal :
  • Huruf kecil awal alfabet, misal x, y, z.
  • Simbol operator, misal +, -, dan x
  • Simbol tanda baca, misal (,), dan ;
  • String yang tercetak tebal, misal, if, then, dan else
     4.  Simbol-simbol berikut adalah simbol non terminal :
  • Huruf besar awal alfabet, misal X, Y, Z.
  • Huruf S sebagai simbol awal.
  • String yang tercetak miring, misal expr dan stmt.
     5.    Huruf besar akhir alfabet melambangkan simbol terminal atau non terminal, misal X, Y, Z

6. Huruf kecil akhir alfabet melambangkan string yang tersusun atas symbol-simbol terminal, misalnya : x, y, z.

7. Sebuah produksi dilambangkan sebagai a®b, artinya : dalam sebuah derivasi dapat dilakukan penggantian simbol a dengan simbol b.
8. Simbol a dalam produksi berbentuk a®b disebut ruas kiri produksi sedangkan simbol b  disebut ruas kanan produksi.
9. Pengertian terminal berasal dari kata terminate (berakhir), maksudnya derivasi  berakhir jika sentensial yang dihasilkan adalah sebuah kalimat (yang tersusun atas  simbol-simbol terminal itu).

10.  Pengertian nonterminal berasal dari kata not terminate (belum/tidak berakhir), maksudnya derivasi belum/ tidak berakhir jika sentensial  yang dihasilkan mengandung simbol non terminal.

11. String adalah deretan terbatas (finite) simbol-simbol. Sebagai contoh, jika a, b dan c adalah tiga buah simbol maka abcb adalah sebuah string yang dibangun dari ketiga symbol tersebut.
12. Jika adalah sebuah string maka panjang string dinyatakan sebagai ïwï dan didefinisikan sebagai cacahan (banyaknya) simbol yang menyusun string tersebut.  Sebagai contoh, jika abcb maka ïwï= 4.

13. String hampa adalah sebuah string dengan nol buah symbol.  String hampa dinyatakan dengan simbol e (atau ^) sehingga ïeï= 0.  String hampa dapat dipandang sebagai simbol hampa karena keduanya tersusun dari nol buah simbol.

Grammar dan Klasifikasi Chomsky
Grammar G didefinisikan sebagai pasangan 4 tupel : VN, VT, S, dan Q, dan dituliskan sebagai G(VN, VT, S, Q), dimana :
VT           : himpunan  simbol-simbol  terminal  (atau  himpunan  token -token, atau alfabet)
VN           : himpunan simbol-simbol non terminal
S Î V     : simbol awal (atau simbol start)
Q             : himpunan produksi

Aturan produksi dinyatakan sebagai a ® b, artinya a menurunkan b 
Berdasarkan komposisi bentuk ruas kiri dan ruas kanan produksinya (a ® b), Noam Chomsky mengklasifikasikan 4 tipe grammar :
  1. Grammar tipe ke-0 : Unrestricted Grammar (UG)
Ciri : a, b Î (VT½VN)*, ïaï> 0
  1. Grammar tipe ke-1 : Context Sensitive Grammar (CSG)
Ciri : a, b Î (VT½VN)*, 0 < ïaï £ ïbï
  1. Grammar tipe ke-2 : Context Free Grammar (CFG)
Ciri : a Î V, b Î (VT½VN)*
  1. Grammar tipe ke-3 : Regular Grammar (RG)
Ciri : a Î V, b Î {V, VTVN} atau a Î V, b Î {VT, VNVT}
               
Ciri-ciri RG sering dituliskan sebagai :
a Î V, b Î {a, bC} atau a Î V, b Î {a, Bc}



Kelas Grammar

Tabel 1. Mesin pengenal Bahasa
Kelas Bahasa
Mesin Pengenal Bahasa
Unrestricted Grammar (UG)
Mesin Turing (Turing Machine), TM
Context Sensitive Grammar (CSG)
Linear Bounded Automaton, LBA
Context Free Gammar (CFG)
Automata Pushdown (Pushdown Automata), PDA
Regular Grammar, RG
Automata Hingga (Finite Automata)

 
Gambar 1. Hirarki Chomsky
Notasi BNF
Aturan-aturan produksi dapat dinyatakan dalam bentuk BNF ( Backus Naur Form)
Beberapa simbol yang dipakai dalam notasi BNF dapat dilihat pada Tabel 2.
Tabel 2. Simbol-simbol BNF

::=
Identik dengan simbol à pada aturan produksi
|
Menyatakan “atau”
<  >
Mengapit simbol variabel / non terminal
{  }
Pengulangan 0 sampai n kali

Contoh, terdapat aturan produksi sebagai berikut :
                E à T | T+E | T-E, T à a
Notasi BNF :
                E ::= | + | - , T ::= a

Diagram Sintaks
Diagram sintaks merupakan alat bantu dalam pembentukan parser / analisis sintaks. Notasi yang terdapat dalam diagram sintaks :
             Empat persegi panjang melambangkan simbol variabel / non terminal.
             Bulatan melambangkan simbol terminal

Misal, terdapat aturan produksi :
        Tà F*T | F/T | F
Diagram sintaksnya adalah sebagai berikut :
 
Gambar 2. Diagram Produksi

Selengkapnya dapat dilihat pada presentasi di link berikut :


2 comments: