![](http://literasi.scientia.id/wp-content/uploads/sites/2/2024/02/WhatsApp-Image-2024-02-04-at-08.20.41-266x300.jpeg)
Suatu hari saya mencari sebuah kata dalam Kamus Besar Bahasa Indonesia (KBBI). Kata ini merupakan kosakata klasik, yaitu wirawan. Kosakata ini sudah ada dalam Logat Ketjil Bahasa Indonesia (Poerwadarminta, 1951) yang bermakna ‘gagah berani’. Poerwadarminta kemudian melengkapi makna kata ini menjadi ‘gagah berani; pahlawan’ dalam Kamus Umum Bahasa Indonesia (1952). Dalam kamus-kamus lain, seperti Kamus Modern Bahasa Indonesia (Sutan Mohammad Zain), serta Kamoes Indonesia dan Kamus Indonesia Ketjik (E. St. Harahap), kosakata ini belum tercantum sebagai kosakata bahasa Indonesia.
Dalam KBBI, Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia sudah membedakan penggunaan kata wirawan sebagai kata benda yang bermakna ‘pahlawan’ dan kata sifat yang bermakna ‘gagah perkasa, gagah berani’. Namun, KBBI tidak mencantumkan etimologi bahwa kata ini berasal dari bahasa Sanskerta. Jika menelusuri kosakata dalam KBBI, kita akan menemukan bahwa sejumlah kosakata yang diserap dari bahasa daerah dan bahasa asing sudah tidak mendapatkan pelabelan dari mana bahasa tersebut berasal. Hal tersebut terjadi karena masyarakat Indonesia sudah tidak menganggap lagi bahwa kosakata tersebut sebagai kosakata asing sehingga Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia juga tidak mencantumkan lagi etimologi kata tersebut.
Etimologi kata wirawan sebagai kosakata yang diserap dari bahasa Sansekerta dapat ditemukan pada lema berjenis ungkapan berupa wira ananta rudhira yang bermakna ‘tabah sampai akhir; semboyan Satuan Kapal Selam TNI AL’ dan wira dharma bhakti ‘yang bermakna dengan semangat dan jiwa kepahlawanan, kita tunaikan kewajiban; semboyan Komando Daerah Udara (KODAU) IV’. Namun, penggunaan kata wirawan dan kedua ungkapan tersebut tidak ada dalam KBBI.
Dalam kajian leksikografi, sebuah kata menjadi bagian dalam sebuah kamus karena kosakata tersebut terekam telah dipakai oleh masyarakat. Karena kata wirawan sudah tercantum dalam kamus pada tahun 1950-an, penggunaan kata ini tentu sudah tercantum dalam sumber-sumber lisan pada masa itu, seperti rekaman radio dan televisi atau sumber tertulis berupa media cetak, buku, poster, atau sumber-sumber tertulis lainnya. Sayangnya, Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia yang menjadikan Kamus Umum Bahasa Indonesia (Poerwadarminta, 1952) sebagai sumber kosakata KBBI tidak melengkapi kata wirawan dengan contoh penggunaan kata dalam KBBI. Dalam kondisi seperti ini, apa yang harus kita lakukan? Ke mana kita dapat melacak penggunaan kata dalam bahasa Indonesia?
Dulu sekali kita pasti akan menggunakan mesin pencari, seperti Google. Google dapat menghubungkan kita dengan sejumlah laman yang memuat kosakata tersebut. Namun, Google mempunyai keterbatasan. Untuk kosakata klasik, kosakata arkais, atau kosakata yang tidak populer, Google belum mampu melacak penggunaan kata tersebut karena kosakata tersebut masih tersimpan pada sumber lisan atau sumber tertulis yang belum diunggah secara digital.
Meskipun demikian, teknologi digital yang berkembang pada hari ini dapat membantu kita dalam menemukan contoh penggunaan kata yang tidak terekam dalam KBBI. Sejumlah lembaga-lembaga khusus telah mengumpulkan kosakata bahasa Indonesia dan menghasilkan korpus bahasa Indonesia. Korpus secara harfiah bermakna ‘badan’ dan dalam kajian bahasa mengacu pada ‘sampel dari data bahasa yang natural atau otentik’ (Mc Enery et. al, 2006). Itulah sebabnya, kata korpus pada hari ini semakin populer dipakai, terutama bagi leksikografer, peneliti, penerjemah, dan pembelajar bahasa.
Apakah pengguna bahasa Indonesia yang tidak memfokuskan diri pada kajian bahasa bisa menggunakan korpus tersebut? Jawabannya tentu saja bisa. Secara sederhana, Prihantoro (2022) dalam Buku Referensi Pengantar Linguistik Korpus menjelaskan bahwa artikel yang terdapat dalam surat kabar online dan kompilasi cuitan di X (dulu Twitter) dan status Facebook, dapat disebut dengan korpus. Kita dapat menemukan penggunaan kosakata bahasa Indonesia dalam sumber-sumber tersebut. Namun, dalam kajian ilmiah, sejumlah lembaga sudah menghadirkan korpus bahasa Indonesia secara khusus. Dengan menggunakan korpus ini, kita dapat mengenal lebih dalam, seperti apa sebuah kata dipakai oleh pengguna bahasa Indonesia.
Salah satu korpus yang bisa ditelusuri terdapat di Sketch Engine (https://app.sketchengine.eu/). Sketch Engine merupakan pengelola korpus dan perangkat lunak analisis teks yang dikembangkan oleh Lexical Computing CZ s.r.o. sejak tahun 2003. Kita dapat menggunakan Sketch Engine untuk menemukan penggunaan kosakata bahasa Indonesia dalam dua korpus bahasa Indonesia, yakni Indonesia Web (Indonesian Wac) yang memiliki 90.120.046 token dan Indonesian Web 2020 (idTenTen20) yang memiliki 3.687.192.045 token. Token merupakan ‘kemunculan kata, angka, atau huruf yang terpisahkan oleh spasi dalam suatu teks’. Dengan demikian, kita dapat melihat betapa banyaknya penggunaan kata dalam dua korpus bahasa Indonesia di Sketch Engine tersebut.
Bagaimana caranya menggunakan Sketch Engine? Kita dapat membuat akun secara gratis. Dengan akun tersebut, kita dapat menggunakan korpus yang disediakan. Ada puluhan korpus dalam Sketch Engine, seperti korpus bahasa Inggris, Arab, Cina, Jerman, Perancis, Jepang, India, Korea, Italia, Portugis, Rusia, Spanyol, Afrika, dan juga korpus bahasa Indonesia. Selain itu, kita juga dapat membangun ruang penyimpanan sendiri hingga satu juta kata, misalnya kita mengumpulkan kosakata dari kompilasi cuitan di X (dulu Twitter) dan status Facebook, lalu mengunggahnya ke Sketch Engine. Kita dapat memberi nama korpus tersebut sesuka hati. Setelah selesai diunggah, kita dapat mengecek penggunaan kata tertentu pada korpus yang dibangun tersebut.
Karena penggunaan kata wirawan tidak ada dalam KBBI, saya pun menggunakan korpus bahasa Indonesia yang disediakan Sketch Engine. Dengan menggunakan fitur concordance atau konkordansi, saya mengetikkan kata wirawan pada korpus Indonesian Web 2020 (idTenTen20). Sketch Engine menyajikan 7.135 baris konkordansi kata wirawan. Siapa sangka bahwa ternyata kata wirawan terekam sebagai nama orang, seperti Sarlito Wirawan, Denny Wirawan, Bambang Wiraman, I Made Wirawan, Wirawan Winarto, Putu Edi Wirawan, Chandra Wirawan, Sarlito Wirawan, dan Pandu Wirawan. Dari 500 baris konkordasi teratas, disajikan sebanyak 498 merupakan nama orang yang menggunakan kata wirawan dan dua lagi merupakan kosakata bahasa Indonesia yang bermakna ‘pahlawan’. Kedua penggunaan kata tersebut dapat dilihat sebagai berikut.
(1) Setiap bulan November diperingati sebagai hari pahlawan guna menghargai jasa para wirawan tanah air.
(2) Malangnya, Laksamana Sunan bukan lagi wirawan. Kudratnya lenyap dan ditawan penjajah yang menaklukkan Melaka.
Dari kedua data tersebut, tampak bahwa kata wirawan merupakan kosakata yang tidak dipakai lagi oleh masyarakat Indonesia. Para pengguna bahasa Indonesia hari ini lebih suka menggunakan kata pahlawan daripada wirawan. Karena tidak digunakan lagi, Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia menjelaskan kata ini sebagai kata klasik dalam KBBI.
Meskipun penggunaan kata ini sudah terbatas, masyarakat Indonesia sudah merekam kata ini sebagai kosakata bahasa Indonesia sehingga kemudian dilekatkan pada nama. Hampir semua nama menunjukkan bahwa wirawan merupakan nama seorang laki-laki. Hal tersebut berkenaan dengan makna yang melekat pada wirawan berupa ‘gagah perkasa; gagah berani’. Dalam bahasa Indonesia, kata perkasa merupakan kata sifat yang melekat pada laki-laki.
Dengan demikian, korpus Indonesian Web 2020 (idTenTen20) telah menunjukkan bagaimana pengguna bahasa Indonesia menggunakan kata wirawan dari masa ke masa. Pada awalnya, kata ini bermakna ‘1. pahlawan, 2. gagah perkasa; gagah berani’. Namun, kreativitas berbahasa menyebabkan orang-orang Indonesia menggunakan kata ini sebagai sebuah nama dan juga menjadi sebuah doa. Seseorang yang bernama wirawan diharapkan kelak dapat menjadi seorang pahlawan atau seseorang yang gagah perkasa dan gagah berani.
Hasil penelusuran kata wirawan dalam korpus tersebut menunjukkan bahwa kita masih bisa menelurusi penggunaan kata dalam korpus-korpus bahasa Indonesia ketika tidak dapat menemukannya dalam KBBI. Selain Sketch Engine, juga ada korpus bahasa Indonesia lainnya berupa CQPWeb yang dikembangkan oleh Universitas Lancaster (https://cqpweb.lancs.ac.uk), korpus Leipzig yang dikembangkan oleh Universitas Leipzig (https://corpora.uni-leipzig.de), dan korpus Indonesia (KoIn) yang dikembangkan oleh Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia (https://korpusindonesia.kemdikbud.go.id).
Di antara korpus tersebut, ada yang mewajibkan untuk membuat akun, ada juga yang mengizinkan langsung akses tanpa akun. Kesempatan akses ini dapat menambah wawasan kita bagaimana sebuah kata dipakai oleh masyarakat Indonesia. Jadi, jika tidak menggunakan contoh penggunaan kata dalam KBBI, kita dapat memanfaatkan korpus bahasa Indonesia di berbagai sistem berbasis web tersebut. Selamat mencoba!