Pada zaman sekarang ini teknologi semakin maju. Ada banyak sekali teknologi yang ada, tapi yang ingin di bahas kali ini adalah tentang biometrik. Biometrik merupakan studi tentang metode otomatis untuk mengenali atau mengidentifikasi manusia berdasarkan satu atau lebih bagian tubuh manusia atau kelakuan dari manusia itu sendiri. Contohnya dalam pengenalan fisik manusia yaitu dengan pengenalan sidik jari, retina, iris, pola dari wajah (facial patterns), tanda tangan dan cara mengetik (typing patterns) serta suara.
Pada materi ini saya akan mengambil bahasan biometrik melalui suara. Suara digunakan oleh manusia untuk berkomunikasi. Suara manusia berguna untuk menyampaikan ide, keinginan, informasi kepada manusia lainnya. Lintasan vokal manusia dan artikulasi adalah organ biologi dengan sifat tak linier dan ini beroperasi tidak hanya dibawah kontrol kesadaran tetapi juga dipengaruhi oleh sifat gender dan keadaan emosional. Oleh sebab itu ucapan manusia bervariasi membentuk pengenalan wicara dan ini mempunyai masalah yang sangat kompleks. Sistem pengenalan wicara merupakan suatu usaha untuk dapat menghasilkan suatu mesin cerdas yang mampu mengenali ucapan manusia. Pengenalan penutur adalah proses secara otomatis mengenali siapa yang bicara dengan dasar informasi individu yang mengandung gelombang wicara. Teknik ini memungkinkan menggunakan suara penutur untuk memverifikasi identitas wicara dan mengontrol layanan seperti menekan nomor telepon dengan suara (voice dialing), perbankan dengan telepon, belanja melalui telepon, layanan akses melalui basis data (database), layanan informasi, surat dengan suara (voice mail), kontrol keamanan area rahasia, dan akses jarak jauh dengan komputer.
Penelitian ini membangun sistem pengenalan penutur secara otomatis. Semua penutur mengucapkan satu kata tunggal yang sama dalam pelatihan dan akan diuji (testing) kemudian. Daftar bahasa yang digunakan adalah kata yang sering digunakan dalam pengetesan pengenalan penutur karena sering digunakan untuk berbagai aplikasi. Sebagai contoh, pengguna harus mengucapkan PIN (Personal Identification Number) untuk membuka pintu laboratorium, atau pengguna harus mengucapkan nomer kartu kredit melalui saluran telepon. Dalam penelitian ini dilakukan proses pengenalan penutur dengan meng-gunakan metode Mel-frequency Wrapping. Dengan pemrosesan Mel-frequency Wrapping ini adalah menirukan perilaku dari pendengaran manusia sehingga dapat mengenali ucapan dari penutur.
Tujuan utama dari pemroses MFCC adalah menirukan perilaku dari pendengaran manusia. Adapun prosesnya sebagai berikut :
J Frame Blocking
J Windowing
J Transformasi Fourier Cepat
J Mel-Frequency Wrapping
J Cepstrum
J Vektor Kuantisasi
J Pelatihan Vektor-Vektor
J Algoritma K-Means
J Pengukuran Jarak
Metode yang digunakan dalam penelitian ini adalah pertama pengambilan sampel dilakukan sebanyak 10 orang penutur dengan masing-masing penutur mengucap-kan satu pola kata yang telah ditentukan. Kata-kata tersebut adalah kata /kampus/. Pola kata dari masing-masing penutur tersebut disimpan dan
kemudian dilatihkan secara bersamaan ke dalam sistem pengenalan penutur. Yang kedua adalah memroses koefisien mel-frequency cepstrum tujuannya adalah menirukan perilaku dari pendengaran manusia. Yang ketiga adalah proses pelatihan. Dalam proses pelatihan pola kata dimasukkan secara urut mulai penutur 1 dengan pola kata /kampus/. Kemudian penutur 2 dengan pola kata yang sama, demikian seterusnya sampai pembicara ke-10 (pelatihan data set). Dalam proses pelatihan ini untuk mengenali pola kata yang dilatihkan sesuai target yang ditentukan pula. Yang keempat adalah menguji penutur dengan MFCC dan VQ untuk mengenali penutur. Yang kelima yaitu menganalisa dan pengambilan kesimpulan.
Penelitian ini untuk membuat sistem pengenalan penutur. Ekstraksi ciri wicara dari penutur tak dikenal dan dibandingkan dengan ekstraksi ciri dari penutur yang ada dalam database. Ekstraksi ciri menggunakan mel frequency wraping yaitu dengan MFCC. Fungsi mel cepstrum digunakan untuk menghitung sinyal mel. Penutur dimodelkan dengan menggunakan VQ. Codebook VQ dibangkitkan oleh kluster dari pelatihan vektor-vektor ciri dari masing-masing penutur dan di-simpan dalam database. Dalam metode ini, algoritma K-mean digunakan untuk kluster. Dalam tahap pengenalan penutur, distorsi diukur berdasarkan minimisasi jarak Euclidean yang digunakan saat mencocokkan (matching) penutur tak dikenal dengan database penutur. Dengan MFCC dan VQ pengenalan penutur dapat digunakan untuk identifikasi penutur.
Sekian ringkasan yang dapat saya tuliskan dari jurnal mengenai biometrik. Jika kalian ingin mengetahui lebih jelas, silahkan download jurnalnya, klik jurnalnya di sini.
Tidak ada komentar:
Posting Komentar