19 Juni 2023
SEOUL – Seri berikut ini merupakan bagian dari proyek “Hello Hangeul” The Korea Herald, yang terdiri dari wawancara, analisis mendalam, video, dan berbagai bentuk konten lainnya yang menjelaskan kisah orang-orang yang mempelajari bahasa Korea dan korelasi antara kelembutan Korea. kekuatan dan kebangkitan bahasanya dalam liga bahasa dunia. – Ed.
Di tengah popularitas besar konten buatan Korea mulai dari musik hingga acara TV, semakin banyak orang di seluruh dunia yang ingin mempelajari Hangeul, alfabet Korea. Dan model kecerdasan buatan tercanggih di dunia tidak terkecuali.
Korea sendiri mungkin bukan pasar yang cukup besar, namun potensi Hangeul dan layanan AI terkait tampaknya tidak terbatas, menurut para ahli di sini.
“Konten Korea telah memainkan peran penting dalam mempromosikan nilai budaya dan bahasa Korea kepada dunia, yang telah memicu minat baru terhadap Hangeul di kalangan pengembang AI di seluruh dunia,” kata Kim Se-hyun, direktur teknis Korea Artificial Intelligence Asosiasi, kata.
Park Jin-ho, seorang profesor bahasa dan sastra Korea di Universitas Nasional Seoul, juga menawarkan prospek yang cerah untuk layanan AI berbahasa Korea.
“Sejalan dengan booming budaya Korea, penggemar mereka di seluruh dunia akan beralih ke layanan tersebut untuk lebih memahami Hangeul,” kata Park.
Para ahli memperkirakan bahwa model AI buatan Korea akan digunakan secara luas di Asia Tenggara, Tiongkok, dan Jepang, karena negara-negara tersebut secara geografis lebih dekat dengan Korea dan masyarakatnya lebih menyukai budaya Korea. Namun mereka sepakat bahwa sebagian besar kemajuan teknologi dapat terjadi di AS, pasar AI terbesar di dunia, yang berarti persaingan sengit antara pengembang AI di dalam dan luar negeri.
Persaingan yang lebih ketat
Semakin banyak perusahaan teknologi besar yang berinvestasi dalam pembelajaran Hangeul seiring dengan meningkatnya permintaan akan layanan AI berbasis bahasa Korea yang semakin besar dan cepat.
Bulan lalu, raksasa teknologi AS Google memilih bahasa Korea dan Jepang sebagai bahasa asing pertama untuk chatbot berbasis AI Bard dalam upaya untuk memperbarui persaingannya dengan ChatGPT, yang didukung oleh saingan beratnya Microsoft. Ini adalah pengumuman yang tidak terduga karena Korea adalah salah satu dari sedikit pasar di mana Google bukan mesin pencari yang dominan. Di negara dengan populasi 51 juta jiwa, pangsa pasar Google mencapai sekitar 30 persen.
Pada acara Developer Day, CEO Google Sundar Pichai menjelaskan bahwa bahasa Korea adalah bahasa yang paling cocok untuk pengembangan aplikasinya, dengan mengatakan “Dari sudut pandang penutur bahasa Inggris, bahasa Korea dan Jepang cukup sulit.”
Perusahaan AI Jerman DeepL juga meluncurkan layanan terjemahan bahasa Korea pada bulan Januari, memilih bahasa Korea sebagai bahasa ke-31 perusahaan dan bahasa Asia keempat setelah bahasa Mandarin, Jepang, dan Indonesia. Perusahaan juga fokus pada potensi bahasa Korea.
“Kami mendapat banyak permintaan untuk dukungan bahasa Korea… Kami terkejut melihat minat pengguna lebih dari yang diharapkan,” kata Jarek Kutylowski, pendiri dan CEO DeepL, pada konferensi pers di Seoul bulan lalu.
Pengamat industri mengatakan sangat wajar bagi perusahaan global untuk melakukan ekspansi bisnis di Korea dengan memanfaatkan booming budaya K baru-baru ini. Namun mereka tetap skeptis terhadap keberhasilan komersial mereka di sini.
“Korea adalah salah satu dari banyak pasar tempat mereka menawarkan layanan. Ini akan menjadi tantangan bagi mereka untuk mengembangkan model AI yang dirancang lebih khusus untuk bahasa Korea,” kata seorang pejabat industri yang enggan disebutkan namanya.
Meningkatkan keuntungan rumah
Raksasa teknologi Korea Naver dan Kakao juga berupaya keras untuk mendapatkan keunggulan kompetitif dibandingkan pesaing global mereka dengan mengembangkan model AI yang lebih canggih yang melampaui ChatGPT dalam hal kemampuan bahasa Korea.
Naver, operator portal web No. 1 di negara tersebut, berencana meluncurkan model AI hiperskalanya, yang disebut HyperClova X, pada musim panas ini. Ini akan menjadi yang ketiga setelah yang ada di AS dan Tiongkok, dan yang terbesar yang khusus menangani Hangeul, kata perusahaan itu.
HyperClova X dilatih dalam bahasa Korea dan Inggris, namun kekuatan terbesarnya adalah kemampuannya untuk lebih memahami konteks sosial dan budaya, serta supremasi linguistiknya berkat basis data substansial yang disusun oleh Naver, situs web portal dominan di negara tersebut.
“Kami berharap dapat membangun ekosistem layanan terintegrasi AI di wilayah seperti Jepang, Asia Tenggara, dan Timur Tengah, di mana permintaan terhadap layanan berbasis Hangeul kami sudah tinggi,” kata seorang pejabat Naver. “Potensi pertumbuhan tampaknya cukup tinggi mengingat kegilaan Hallyu.”
Kakao, operator no. Aplikasi messenger nomor satu KakaoTalk, juga berencana meluncurkan versi terbaru dari model AI berbahasa Korea, KoGPT, pada kuartal ketiga. Model AI perusahaan, yang dikembangkan oleh unit AI-nya, Kakao Brain, terutama dilatih menggunakan teks berbahasa Korea. Perusahaan mengatakan mereka memiliki daya saing dalam berkomunikasi dengan lebih efisien dan akurat dalam bahasa Korea.
Bahasa yang sulit dipelajari
Para ahli sepakat bahwa Hangeul adalah bahasa yang sulit dipelajari bahkan untuk model AI karena struktur tata bahasa rumit yang sangat berbeda dari bahasa Inggris – bahasa paling umum dalam studi AI.
Kemampuan bahasa Korea pada model AI global telah meningkat secara drastis dalam beberapa tahun terakhir, terutama untuk layanan populer seperti terjemahan, ringkasan, dan menjawab pertanyaan sederhana. Namun mereka masih tertinggal dibandingkan layanan berbasis bahasa Inggris.
“Bahasa Korea secara tata bahasa berbeda dengan bahasa lain. Struktur kalimat dan ekspresi dianggap lebih rumit. Mempelajari bahasa juga terkait dengan pemahaman budaya dan karakteristik unik Korea,” kata Kim dari AI Institute.
Saat ini, sebagian besar AI generatif, yang terutama digunakan di negara-negara berbahasa Inggris, menggunakan teknik tokenisasi – cara memecah teks menjadi unit lebih kecil yang disebut token, termasuk kata, karakter, atau subkata. Meskipun sistem ini mungkin cocok untuk bahasa Inggris, namun tidak sepenuhnya berlaku untuk bahasa Korea, tambahnya.
Itu sebabnya Naver dan Kakao memutuskan untuk mengembangkan metode berbagi token mereka sendiri yang cocok untuk morfem Korea guna mengatasi keterbatasan ini, menurut Park, profesor SNU.
“Sangat penting untuk memahami sepenuhnya karakteristik suatu bahasa untuk mengembangkan model AI baru, belum lagi bahasa Korea yang memiliki banyak elemen predikat tidak beraturan,” kata profesor tersebut. “Saya berharap perusahaan-perusahaan lokal dapat menghasilkan model AI berbahasa Korea yang sukses, sehingga dapat dibagikan dengan perusahaan-perusahaan lain yang tidak berbahasa Korea.”