Abstrak
Dalam tulisan ini dijelaskan mengenai kualitas transformasi suara dengan analisa sintesa pemetaan spectral dan amplop power spectral, pada kondisi supervisi dan non-supervisi. Pemetaan spectral suara pembicara dilakukan untuk mendapatkan referensi suara, yang akan menjadi acuan dalam melakukan identifikasi karakteristik suara pembicara, dengan memakai interpolasi dan pengkodean fuzzy. Dari hasil evaluasi percobaan identifikasi suara pembicara, dapat diketahui bahwa rata-rata prosentase identifikasi, transformasi suara laki-laki ke suara laki-laki untuk kedua cara diatas adalah 84%, sedangkan transformasi suara laki-laki ke perempuan diperoleh prosentase rata-rata identifikasi sebesar 70% pada kondisi supervisi.
Kata kunci: Pemetaan spektral supervisi dan non supervisi, Amplop spektral power, pengkodean fuzzy
Pendahuluan
Untuk mewujudkan man machine interface secara alami, pengontrolan karakteristik suara pembicara pada suara buatan, merupakan salah satu pekerjaan yang sangat penting. Akan tetapi, transformasi kualitas suara agar menjadi suara pembicara independen juga merupakan bidang penelitian yang sangat ditunggu-tunggu perkembangannya. Seperti output suara buatan dari telepon penterjemah otomatis dan bilingual suara dalam siaran televisi, yang dapat menghasilkan kualitas suara seperti suara asalnya pembicara. Tinggi rendahnya kualitas suara pembicara, banyak disebabkan oleh perbedaan secara anatomis (vocal cord, dan vocal tract sebagai perangkat penghasil suara) dan secara akustikal (formant frequency, kemiringan spectral serta fundamental frequency rata-rata), yang menjadi parameter-parameter penting untuk persepsi karakteristik suara pembicara [1].
Peneliti: Driszal Fryantoni
Post a Comment
Post a Comment