Cara Kerja Artificial Intelligence pada Google Translate Bahasa Isyarat

TIKTAK.ID – Terdapat ribuan bahasa di dunia, dan hampir semua bahasa terpopuler bisa diterjemahkan secara langsung menggunakan Google Translate. Untuk terjemahan langsung, beberapa perangkat lunak menggunakan suara melalui mikrofon, sehingga pengguna dapat menerjemahkan pesan tanpa perlu mengetik.

Sementara pada Google Translate bahasa isyarat untuk membantu pengguna disabilitas wicara dan tuli menggunakan Artificial Intelligence (AI) dengan pemanfaatan gambar.

Convolution Neural Nets (CNN)
Convolution Neural Nets (CNN) merupakan salah satu cara kerja komputer berupa jaringan saraf konvolusional yang bisa mengklasifikasikan gambar atau citra visual. Sistem ini pun terlatih mendeskripsikan ribuan foto, serta mengklasifikasikan masing-masing kategori gambar untuk diterjemahkan.

CNN memiliki beberapa lapisan, yang terdiri dari konvolusional, penggabungan, dan terhubung sepenuhnya (fully-connected layers).

Lapisan konvolusional sendiri terdiri atas kernel (filter) dengan ukuran yang berbelit-belit. Kemudian di atas piksel, mengalikan dan menjumlahkan nilai, dan pada akhirnya dibentuk dalam matriks baru yang lebih kecil dan disederhanakan.

Persiapan Data
Data gambar bahasa isyarat yang sudah dikumpulkan, lantas diatur ke dalam 29 folder dengan 3.000 gambar di setiap folder untuk setiap huruf alfabet. Terdapat pula tiga folder tambahan untuk ruang menghapus gambar. Untuk mempercepat pelatihan, maka gambar bahasa isyarat diturunkan ukurannya ke 48×48 dari 200×200.

Lapisan Konvolusional dan Penggabungan
Seperti dilansir CNN Indonesia, terdapat sejumlah tindakan dalam lapisan konvolusional dan penggabungan untuk menerjemahkan bahasa isyarat pada Google Translate.

1. Pada baris pertama, ada jumlah filter dan ukuran filter ditentukan. Untuk lapisan pertama, 64 filter 3×3 digunakan, dan ukuran gambar ditentukan 48×48. Usai matriks mengalami konvolusi, lantas membentuk matriks ifitur, lalu melewati normalisasi batch. Tindakan tersebut pun mengurangi pergeseran nilai lapisan yang tersembunyi.

2. Baris berikutnya merupakan tempat terjadinya penggabungan. Telah ditentukan ukuran filter penggabungan 2×2 dan menggunakan penggabungan maksimal. Hal itu demi mengurangi ukuran matriks.

3. Matriks dihapus node-nya melalui jaringan saraf (Neural Net). Hal ini agar jaringan mengurangi kesensitifannya terhadap bobot setiap node. Selain itu, penghapusan ini membuat jaringan menjadi lebih umum dalam memprediksikan dan meningkatkan akurasi.