Pencipta Khmer Unicode mengembangkan pemeriksa ejaan ‘AI’

1 Maret 2023

PHNOM PENH – Pada tahun 2001, Dahn Hong mengembangkan Khmer Unicode, yang tetap menjadi dasar sebagian besar font Khmer yang digunakan saat ini. Dia merancang Unicode – sistem standar yang memberikan nomor unik untuk setiap karakter – sebagai respons terhadap frustrasi terhadap jenis huruf Limon, versi yang jauh lebih awal, yang dikembangkan pada tahun 1994. Limon sulit digunakan, apalagi di era smartphone.

Tidak puas dengan menyediakan sumber yang bersih dan andal untuk hampir semua tipografi Khmer yang digunakan, ia mengarahkan perhatiannya pada perangkat lunak pemeriksa ejaan yang andal.

Hong, seorang mantan mahasiswa hukum, terinspirasi untuk merancang program tersebut setelah mengamati peningkatan kesalahan eja dalam bahasa nasional Kerajaan.

Dia mulai mengerjakan aplikasi Nextspell pada tahun 2019.

Sebagian besar perangkat lunak pengujian ejaan menggunakan pengenalan karakter optik – proses yang mengubah gambar teks menjadi format teks yang dapat dibaca mesin. Ini berarti mengembangkan sistem yang dapat mengenali teks Khmer.

“Koreksi bahasa Inggris mudah dilakukan di sebagian besar program populer, seperti Microsoft Office suite. Seseorang dapat melakukan koreksi dengan mengklik sebuah tombol, kata-kata yang salah eja secara otomatis digarisbawahi dan kata-kata baru dapat ditambahkan ke kamus program. Nextspell serupa dalam beberapa hal, namun menggunakan AI untuk menyimpan perbaikan umum di database pusat yang besar,” kata Hong.

Semakin banyak orang menggunakan program ini, semakin akurat jadinya. Google Terjemahan adalah contoh bagus dari kemajuan ini. Sejak 10 tahun yang lalu, menerjemahkan bahasa Khmer ke bahasa Inggris sering kali tidak terbaca. Sekarang jauh lebih akurat.

“Selama data diunggah secara rutin, maka akan terus ditingkatkan,” ujarnya.

Pada akhirnya, tujuannya adalah untuk memungkinkan aplikasi mengoreksi kata-kata yang salah eja secara otomatis, meskipun hal ini pada akhirnya bergantung pada jumlah tanggal yang ditambahkan ke database aplikasi.

“Kata-kata yang salah eja digarisbawahi dengan warna merah, dan jika database berisi alternatif, maka akan dilakukan koreksi dan digarisbawahi dengan warna biru. Jika tidak ada alternatif lain yang tersedia di database, yang bisa dilakukan program hanyalah menyorotnya,” kata Hong.

Dia menjelaskan bahwa aksara Khmer adalah salah satu aksara yang paling rumit di dunia, dan diperlukan pembaruan rutin.

“Kami bergantung pada kamus yang dirancang oleh Patriark Tertinggi Chuon Nath pada tahun 1938, namun ada istilah-istilah modern yang perlu ditambahkan, dan beberapa kata yang perlu distandarisasi,” katanya.

Hong tidak mengetahui jumlah pasti orang yang menggunakan aplikasinya, namun menjelaskan bahwa versi gratis dari aplikasi tersebut membatasi setiap pengguna hingga 200 kata. Pengguna reguler memiliki akses hingga 3.000 kata, hanya dengan $12 per tahun.

“Ada lebih banyak pengguna gratis dibandingkan profesional, tapi hal itu umum terjadi pada sebagian besar aplikasi,” katanya.

Selain aplikasi Android dan Apple, Nextspell dapat diakses secara gratis melalui browser apa pun.

Pengguna cukup mengunjungi situs web Nextspell, mendaftar untuk mendapatkan akun gratis, lalu menyalin dan menempelkan teks Khmer ke halaman tersebut.

“Program ini menjadi lebih akurat setiap hari. Tentu saja, kata-kata yang paling umum adalah kata-kata yang paling cepat teridentifikasi, namun basis datanya terus meningkatkan basis pengetahuannya,” kata Hong.

Meskipun Unicode-nya digunakan secara luas, ia belum mendapatkan manfaat darinya. Nextspell memberikan penghasilan yang tidak terlalu besar dari penjualan aplikasi, dan karyanya dengan bahasa Khmer membuatnya membantu pemerintah Laos membuat Unicode mereka sendiri.

“Khmer dengan vokal dan suku kata jauh lebih kompleks dibandingkan bahasa Inggris, jadi program ini sangat penting. Saya juga sedang mengembangkan font untuk anak-anak. Bahasa Khmer harus tetap relevan di era digital,” ujarnya.

Keluaran Sidney

By gacor88