Untuk dapat menyelami proses kompilasi diperlukan waktu yang lebih guna mengamati perilaku kompilasi.
Terdapat bahasa-bahasa pemrograman yang berbeda macam dan bahkan platform, untuk itu perlu ada keseragaman.
Konsep
dan
Notasi
Bahasa
Teori Bahasa
Bahasa
adalah kumpulan
kalimat.
Kalimat
adalah rangkaian
kata. Kata adalah komponen
terkecil
kalimat
yang tidak bisa dipisahkan
lagi.
Contoh : Si Kucing kecil menendang bola besar -----------> Bhs Indonesia
The little cat kicks a big ball -----------> Bhs Inggris
for i :=
start to finish do A[i] := B[i]*sin(i*pi/16.0) --> Bhs Pascal
Dalam bahasa pemrograman,
kalimat dikenal sebagai ekspresi, dan kata sebagai token. Kata terdiri atas beberapa karakter. Kelompok karakter yang membentuk sebuah token dinamakam lexeme untuk token tersebut. Setiap token yang dihasilkan,
disimpan
dalam tabel simbol.
Derivasi adalah sebuah proses dimana suatu himpunan produksi akan diturunkan / dipilah-pilah dengan melakukan sedertan produksi sehingga membentuk untai terminal.
Pengertian dasar
- Setiap anggota alfabet, dinamakan sebagai simbol terminal atau token.
- Himpunan simbol terminal dinyatakan sebagai VT, sedangkan himpunan simbol non terminal dinyatakan sebagai VN.
- Simbol-simbol berikut adalah simbol terminal :
- Huruf kecil awal alfabet, misal x, y, z.
- Simbol operator, misal +, -, dan x
- Simbol tanda baca, misal (,), dan ;
- String yang tercetak tebal, misal, if, then, dan else
4. Simbol-simbol berikut adalah simbol non terminal :
- Huruf besar awal alfabet, misal X, Y, Z.
- Huruf S sebagai simbol awal.
- String yang tercetak miring, misal expr dan stmt.
5. Huruf besar akhir alfabet melambangkan simbol terminal atau non
terminal, misal X, Y, Z
6. Huruf kecil akhir alfabet melambangkan string
yang tersusun atas symbol-simbol terminal, misalnya :
x, y, z.
7. Sebuah produksi dilambangkan sebagai a®b, artinya : dalam sebuah derivasi dapat
dilakukan penggantian simbol a dengan simbol b.
8. Simbol a dalam produksi berbentuk a®b disebut ruas kiri produksi sedangkan simbol b disebut ruas kanan produksi.
9. Pengertian terminal berasal dari kata terminate (berakhir), maksudnya derivasi
berakhir jika sentensial yang dihasilkan adalah sebuah kalimat (yang tersusun atas
simbol-simbol terminal itu).
10. Pengertian nonterminal berasal dari kata not terminate (belum/tidak berakhir), maksudnya
derivasi belum/ tidak berakhir jika sentensial
yang dihasilkan mengandung simbol non terminal.
11. String adalah deretan
terbatas (finite) simbol-simbol. Sebagai contoh, jika a, b dan c adalah tiga
buah simbol maka abcb adalah sebuah string yang dibangun dari ketiga symbol tersebut.
12. Jika w adalah sebuah string maka panjang string dinyatakan sebagai ïwï dan didefinisikan sebagai cacahan (banyaknya) simbol yang menyusun string tersebut.
Sebagai contoh, jika w = abcb maka ïwï= 4.
13. String hampa adalah sebuah string dengan
nol buah symbol. String hampa dinyatakan
dengan simbol e (atau ^) sehingga ïeï= 0. String hampa dapat dipandang sebagai simbol hampa
karena keduanya tersusun dari nol buah simbol.
Grammar dan
Klasifikasi
Chomsky
Grammar G didefinisikan sebagai pasangan 4 tupel : VN, VT,
S, dan Q, dan dituliskan sebagai G(VN, VT, S, Q), dimana
:
VT :
himpunan simbol-simbol terminal
(atau himpunan token -token, atau alfabet)
VN : himpunan
simbol-simbol non terminal
S Î V : simbol awal (atau simbol start)
Q : himpunan produksi
Aturan produksi dinyatakan sebagai a
® b, artinya a menurunkan b
Berdasarkan komposisi bentuk ruas kiri dan ruas kanan
produksinya (a ® b), Noam
Chomsky mengklasifikasikan 4 tipe grammar :
- Grammar tipe ke-0 : Unrestricted Grammar (UG)
Ciri : a,
b Î (VT½VN)*, ïaï>
0
- Grammar tipe ke-1 : Context
Sensitive Grammar (CSG)
Ciri : a,
b Î (VT½VN)*, 0 < ïaï
£ ïbï
- Grammar tipe ke-2 : Context Free
Grammar (CFG)
Ciri : a
Î V, b Î (VT½VN)*
- Grammar tipe ke-3 : Regular
Grammar (RG)
Ciri : a
Î V, b Î {V, VTVN}
atau a Î V, b Î
{VT, VNVT}
Ciri-ciri RG sering dituliskan sebagai :
a Î V, b Î
{a, bC} atau a Î V, b Î {a, Bc}
Kelas Grammar
Tabel 1.
Mesin pengenal Bahasa
Kelas Bahasa
|
Mesin Pengenal Bahasa
|
Unrestricted Grammar (UG)
|
Mesin Turing (Turing Machine), TM
|
Context Sensitive Grammar (CSG)
|
Linear Bounded Automaton, LBA
|
Context Free Gammar (CFG)
|
Automata Pushdown (Pushdown Automata), PDA
|
Regular Grammar, RG
|
Automata Hingga (Finite Automata)
|
Notasi BNF
Aturan-aturan produksi dapat
dinyatakan dalam bentuk BNF ( Backus Naur Form)
Beberapa simbol yang dipakai
dalam notasi BNF dapat dilihat pada Tabel 2.
Tabel 2. Simbol-simbol BNF
::=
|
Identik dengan simbol à
pada aturan produksi
|
|
|
Menyatakan “atau”
|
<
>
|
Mengapit simbol variabel / non terminal
|
{
}
|
Pengulangan 0 sampai n kali
|
Contoh, terdapat aturan produksi sebagai berikut :
E à T | T+E | T-E, T à a
Notasi BNF :
E ::= |
+ | - , T ::= a
Diagram Sintaks
Diagram sintaks merupakan alat bantu dalam pembentukan parser /
analisis sintaks. Notasi yang terdapat dalam diagram sintaks :
•
Empat
persegi panjang melambangkan simbol variabel / non terminal.
•
Bulatan
melambangkan simbol terminal
Misal, terdapat aturan produksi :
Tà F*T | F/T | F
Diagram sintaksnya adalah sebagai
berikut :
Selengkapnya dapat dilihat pada presentasi di link berikut :
Terimakasih Kaka :)
ReplyDeleteiya ade
Delete