Secara umum, arsitektur mesin penerjemah statistik Moses seperti pada gambar berikut :
Sumber data utama yang
dipergunakan adalah parallel corpus dan monolingual corpus.
Proses
training
terhadap parallel
corpus
menggunakan GIZA++ menghasilkan translation
model (TM). Proses
training
terhadap bahasa target pada parallel
corpus
ditambah
dengan monolingual monolingual
corpus
bahasa target menggunakan SRILM menghasilkan language
model (LM),
sedangkan PoS
model (PoS-M)
dihasilkan dari bahasa target pada parallel
corpus
yang
setiap katanya sudah ditandai dengan PoS. TM,
LM dan
PoS-M hasil
proses di atas digunakan untuk menghasilkan decoder Moses.
Selanjutnya Moses digunakan sebagai mesin penerjemah untuk
menghasilkan bahasa target dari input kalimat dalam bahasa sumber.
catatan : PoS Model merupakan salah satu fitur linguistik yang dapat digunakan pada moses, fitur lain yang dapat digunakan seperti lemma, gender, proses pembentukan kata (morfem) dan lain-lain.