Diposting oleh Ouiam Koubaa – Product Manager dan Yingzhe Li – Software Engineer
Hari ini, kami sangat senang bisa mengumumkan perilisan mesin Text-To-Speech (TTS) baru yang berkinerja baik dan andal. Text-to-speech mengubah teks menjadi ucapan yang terdengar natural untuk lebih dari 50 bahasa yang didukung teknologi machine learning (ML) Google. Mesin text-to-speech baru pada Wear OS menggunakan model ML prosodi yang lebih kecil dan efisien untuk menghadirkan sintesis yang lebih cepat pada perangkat Wear OS.
Kasus penggunaan text-to-speech Wear OS dapat mencakup layanan aksesibilitas, panduan latihan untuk aplikasi olahraga, panduan navigasi, dan membacakan peringatan yang masuk dengan keras melalui speaker jam atau headphone yang terhubung melalui Bluetooth. Mesin ini diperuntukkan buat interaksi singkat, jadi sebaiknya tidak digunakan untuk membaca artikel panjang, atau ringkasan podcast berdurasi panjang.
Cara menggunakan TTS Wear OS
Text-to-speech telah lama didukung di Android. TTS baru Wear OS telah disempurnakan agar berkinerja baik dan andal pada perangkat dengan memori rendah. Semua API Android masih sama, jadi developer menggunakan proses yang sama untuk mengintegrasikannya ke dalam aplikasi Wear OS, misalnya, TextToSpeech#speak bisa digunakan untuk mengucapkan teks tertentu. TTS tersedia pada perangkat yang menjalankan Wear OS 4 atau yang lebih tinggi.
Saat pengguna berinteraksi dengan TTS Wear OS untuk pertama kalinya setelah perangkat booting, mesin sintesis akan siap dalam waktu sekitar 10 detik. Untuk kasus tertentu ketika developer menginginkan agar jam segera berbicara setelah membuka aplikasi atau meluncurkan pengalaman, kode berikut bisa digunakan untuk melakukan pemanasan awal mesin TTS sebelum ada permintaan sintesis yang masuk.
private fun initTtsEngine() {
// Callback when TextToSpeech connection is set up
val callback = TextToSpeech.OnInitListener { status ->
if (status == TextToSpeech.SUCCESS) {
Log.i(TAG, "tts Client Initialized successfully")
// Get default TTS locale
val defaultVoice = tts.voice
if (defaultVoice == null) {
Log.w(TAG, "defaultVoice == null")
return@OnInitListener
}
// Set TTS engine to use default locale
tts.language = defaultVoice.locale
try {
// Create a temporary file to synthesize sample text
val tempFile =
File.createTempFile("tmpsynthesize", null, applicationContext.cacheDir)
// Synthesize sample text to our file
tts.synthesizeToFile(
/* text= */ "1 2 3", // Some sample text
/* params= */ null, // No params necessary for a sample request
/* file= */ tempFile,
/* utteranceId= */ "sampletext"
)
// And clean up the file
tempFile.deleteOnExit()
} catch (e: Exception) {
Log.e(TAG, "Unhandled exception: ", e)
}
}
}
tts = TextToSpeech(applicationContext, callback)
}
Setelah selesai menggunakan TTS, Anda dapat menghentikan mesin dengan memanggil tts.shutdown() dalam metode onDestroy() aktivitas Anda. Perintah ini juga harus digunakan saat menutup aplikasi yang menggunakan TTS.
Bahasa dan Lokalitas
Secara default, TTS Wear OS memuat 7 bahasa bawaan dalam image sistem: Bahasa Inggris, Spanyol, Prancis, Italia, Jerman, Jepang, dan Mandarin. OEM dapat memilih untuk melakukan pramuat set bahasa yang berbeda. Anda bisa memeriksa bahasa apa saja yang tersedia dengan menggunakan TextToSpeech#getAvailableLanguages(). Selama pengaturan jam, jika pengguna memilih bahasa sistem yang bukan merupakan file suara pramuat, jam akan secara otomatis mendownload file suara yang sesuai saat pengguna pertama kali terhubung ke Wi-Fi saat mengisi daya jam mereka.
Ada beberapa kasus tertentu di mana output ucapan mungkin berbeda dari bahasa sistem pengguna. Misalnya, dalam skenario ketika aplikasi keamanan menggunakan TTS untuk memanggil petugas tanggap darurat, developer mungkin ingin menyintesis ucapan dalam bahasa lokal tempat pengguna berada, bukan bahasa yang digunakan jam. Untuk menyintesis teks dalam bahasa yang berbeda dari setelan sistem, gunakan TextToSpeech#setLanguage(java.util.Locale)
Kesimpulan
Aplikasi Wear OS Anda sekarang dapat berbicara, baik secara langsung dari speaker jam atau melalui headphone yang terhubung dengan Bluetooth. Pelajari lebih lanjut tentang penggunaan TTS.
Kami sangat ingin melihat bagaimana Anda menggunakan mesin Text-to-speech untuk menciptakan pengalaman yang lebih bermanfaat dan menarik bagi pengguna Anda di Wear OS!
Copyright 2023 Google LLC.
SPDX-License-Identifier: Apache-2.0