Using GIZA++ for aligning words on Ubuntu

-Please scroll down for English-

Nếu đã quen sử dụng thì bạn nên chuyển sang MGIZA để chạy nhanh hơn.

Bài viết này chủ yếu dựa theo hướng dẫn trên blog của anh Lương Việt Thắng.

GIZA++ là công cụ phổ biến phục vụ gióng từ cho ngữ liệu song ngữ, tiền xử lý cho Dịch thống kê (Statistical Machine Translation). Các bạn có thể dễ dàng tìm các hướng dẫn trên mạng, tuy nhiên đa phần hơi rối ở bước cài đặt củng như sử dụng, Do đó bằng cách tiếp cận sử dụng file .sh, mình muốn đạt được 2 mục tiêu:  Read More

Advertisements