Transkripsi Berkelanjutan Real-time dengan Live Transcribe
06 March 2019
Organisasi Kesehatan Dunia (WHO) memperkirakan bahwa di dunia terdapat 466 juta orang penderita tunarungu dan yang kesulitan mendengar. Teknologi yang sangat penting dalam memberdayakan komunikasi dan akses inklusif ke semua informasi dunia untuk populasi ini adalah pengenalan ucapan otomatis (ASR), yang memungkinkan komputer mendeteksi bahasa yang terdengar dan menuliskannya dalam bentuk teks untuk dibaca. Google ASR berada di belakang teks otomatis di Youtube, presentasi di Slide dan juga panggilan ponsel. Namun, meskipun ASR telah melakukan beberapa penyempurnaan dalam beberapa tahun terakhir, penderita tunarungu dan orang yang kesulitan mendengar sebagian besar masih mengandalkan layanan transkripsi manual seperti CART di AS, Palantypist di Inggris, atau STTR di negara lainnya. Layanan-layanan ini sangat mahal dan sering kali harus dijadwalkan jauh sebelumnya, mengurangi peluang bagi para penderita tunarungu dan orang yang kesulitan mendengar untuk berpartisipasi dalam percakapan dadakan serta acara sosial. Kami percaya teknologi bisa menjembatani kesenjangan ini dan memberdayakan komunitas ini.
Hari ini, kami mengumumkan Live Transcribe, layanan Android gratis yang membuat percakapan dunia nyata lebih mudah diakses dengan menghadirkan kekuatan teks otomatis ke dalam penggunaan percakapan sehari-hari. Didukung oleh Google Cloud, Live Transcribe menuliskan teks percakapan secara real-time, mendukung lebih dari 70 bahasa dan lebih dari 80% populasi dunia. Anda bisa meluncurkannya dengan satu tap dari dalam aplikasi apa pun, langsung dari ikon aksesibilitas pada baki sistem.
Membangun Live Transcribe
Sistem transkripsi berbasis ASR yang sebelumnya biasanya memerlukan model intensif-komputasi, riset pengguna yang mendalam dan akses mahal ke konektivitas, semuanya menghambat adopsi transkripsi berkelanjutan otomatis. Untuk mengatasi masalah ini dan memastikan transkripsi real-time yang cukup akurat, Live Transcribe menggabungkan hasil riset pengalaman pengguna (UX) yang luas dengan konektivitas yang mulus dan stabil ke server pemrosesan suara. Selain itu, kami perlu memastikan bahwa konektivitas ke server ini tidak mengakibatkan penggunaan data yang berlebihan oleh pengguna.
Mengandalkan ASR cloud memberi kami akurasi yang lebih tinggi, tetapi kami ingin mengurangi konsumsi data jaringan yang dibutuhkan Live Transcribe. Untuk melakukannya, kami mengimplementasikan detektor suara berbasis neural network pada perangkat, yang dibangun dalam karya kami sebelumnya dengan AudioSet. Jaringan ini adalah model serupa gambar, mirip dengan model VGGish kami yang sudah dipublikasikan, yang mendeteksi pembicaraan dan secara otomatis mengelola sambungan jaringan ke engine ASR cloud, meminimalkan penggunaan data dalam periode penggunaan yang lama.
Pengalaman Pengguna
Untuk membuat Live Transcribe seintuitif mungkin, kami bermitra dengan Gallaudet University untuk memulai kerja sama riset pengalaman pengguna yang akan memastikan kebutuhan pengguna inti terpuaskan sembari memaksimalkan potensi teknologi kami. Kami mempertimbangkan berbagai model, komputer, tablet, smartphone, dan bahkan proyektor kecil, yang merupakan beberapa cara untuk menampilkan informasi dan teks yang terdengar. Pada akhirnya, kami memutuskan untuk berfokus pada smartphone karena perangkat ini dimiliki oleh hampir semua orang dan kemampuannya terus meningkat.
Setelah diputuskan, kami perlu mengatasi masalah penting lainnya: menampilkan kepercayaan transkripsi. Secara tradisional dianggap bermanfaat bagi pengguna, riset kami mengeksplorasi apakah kami benar-benar perlu menunjukkan kepercayaan level-kata atau level-frasa.
Memperkuat riset UX sebelumnya dalam area ini, riset kami menunjukkan bahwa transkrip paling mudah dibaca ketika tidak dilapisi dengan sinyal-sinyal ini. Sebagai gantinya, Live Transcribe berfokus pada penyajian teks yang lebih baik dan menambahkannya dengan sinyal pendengaran lainnya selain ucapan.
Sinyal UX lain yang bermanfaat adalah tingkat kebisingan dari lingkungan saat ini. Dikenal sebagai masalah cocktail party, memahami seorang pembicara di tengah ruangan yang bising adalah tantangan utama bagi komputer. Untuk mengatasinya, kami membuat indikator yang memvisualisasikan volume ucapan pengguna secara relatif terhadap kebisingan latar belakang. Indikator ini juga memberikan masukan langsung kepada pengguna tentang seberapa baik mikrofon menerima suara yang masuk dari speaker, sehingga memungkinkan mereka untuk menyesuaikan penempatan ponsel.
Peningkatan potensial di masa mendatang dalam transkripsi ucapan otomatis berbasis seluler meliputi pengenalan pada-perangkat, pemisahan ucapan, dan peningkatan ucapan. Bergantung hanya pada transkripsi bisa menimbulkan kesulitan tersendiri yang dapat menyebabkan miskomunikasi. Riset kami dengan Gallaudet University menunjukkan bahwa menggabungkannya dengan sinyal pendengaran lainnya seperti deteksi ucapan dan indikator kenyaringan, membuat perubahan yang nyata dalam opsi komunikasi bagi pengguna.
Live Transcribe sekarang tersedia dalam peluncuran bertahap di Play Store, dan langsung terinstal di semua perangkat Pixel 3 dengan update terbaru. Live Transcribe bisa diaktifkan melalui Accessibility Settings. Anda juga bisa membaca selengkapnya tentang hal ini di The Keyword.
Ucapan Terima Kasih
Live Transcribe dibuat oleh peneliti Chet Gnegy, Dimitri Kanevsky, dan Justin S. Paul bekerja sama dengan anggota tim Android Accessibility Brian Kemler, Thomas Lin, Alex Huang, Jacqueline Huang, Ben Chung, Richard Chang, I-ting Huang, Jessie Lin, Ausmus Chang, Weiwei Wei, Melissa Barnhart dan Bingying Xia. Kami juga ingin mengucapkan terima kasih kepada mitra dekat kami dari Gallaudet University, Christian Vogler, Norman Williams dan Paula Tucker.
1 Pembaca yang jeli bisa melihat mode kepercayaan level frasa yang digunakan oleh Dr. Obeidat dalam video di atas.↩
Organisasi Kesehatan Dunia (WHO) memperkirakan bahwa di dunia terdapat 466 juta orang penderita tunarungu dan yang kesulitan mendengar. Teknologi yang sangat penting dalam memberdayakan komunikasi dan akses inklusif ke semua informasi dunia untuk populasi ini adalah pengenalan ucapan otomatis (ASR), yang memungkinkan komputer mendeteksi bahasa yang terdengar dan menuliskannya dalam bentuk teks untuk dibaca. Google ASR berada di belakang teks otomatis di Youtube, presentasi di Slide dan juga panggilan ponsel. Namun, meskipun ASR telah melakukan beberapa penyempurnaan dalam beberapa tahun terakhir, penderita tunarungu dan orang yang kesulitan mendengar sebagian besar masih mengandalkan layanan transkripsi manual seperti CART di AS, Palantypist di Inggris, atau STTR di negara lainnya. Layanan-layanan ini sangat mahal dan sering kali harus dijadwalkan jauh sebelumnya, mengurangi peluang bagi para penderita tunarungu dan orang yang kesulitan mendengar untuk berpartisipasi dalam percakapan dadakan serta acara sosial. Kami percaya teknologi bisa menjembatani kesenjangan ini dan memberdayakan komunitas ini.
Hari ini, kami mengumumkan Live Transcribe, layanan Android gratis yang membuat percakapan dunia nyata lebih mudah diakses dengan menghadirkan kekuatan teks otomatis ke dalam penggunaan percakapan sehari-hari. Didukung oleh Google Cloud, Live Transcribe menuliskan teks percakapan secara real-time, mendukung lebih dari 70 bahasa dan lebih dari 80% populasi dunia. Anda bisa meluncurkannya dengan satu tap dari dalam aplikasi apa pun, langsung dari ikon aksesibilitas pada baki sistem.
Membangun Live Transcribe
Sistem transkripsi berbasis ASR yang sebelumnya biasanya memerlukan model intensif-komputasi, riset pengguna yang mendalam dan akses mahal ke konektivitas, semuanya menghambat adopsi transkripsi berkelanjutan otomatis. Untuk mengatasi masalah ini dan memastikan transkripsi real-time yang cukup akurat, Live Transcribe menggabungkan hasil riset pengalaman pengguna (UX) yang luas dengan konektivitas yang mulus dan stabil ke server pemrosesan suara. Selain itu, kami perlu memastikan bahwa konektivitas ke server ini tidak mengakibatkan penggunaan data yang berlebihan oleh pengguna.
Mengandalkan ASR cloud memberi kami akurasi yang lebih tinggi, tetapi kami ingin mengurangi konsumsi data jaringan yang dibutuhkan Live Transcribe. Untuk melakukannya, kami mengimplementasikan detektor suara berbasis neural network pada perangkat, yang dibangun dalam karya kami sebelumnya dengan AudioSet. Jaringan ini adalah model serupa gambar, mirip dengan model VGGish kami yang sudah dipublikasikan, yang mendeteksi pembicaraan dan secara otomatis mengelola sambungan jaringan ke engine ASR cloud, meminimalkan penggunaan data dalam periode penggunaan yang lama.
Pengalaman Pengguna
Untuk membuat Live Transcribe seintuitif mungkin, kami bermitra dengan Gallaudet University untuk memulai kerja sama riset pengalaman pengguna yang akan memastikan kebutuhan pengguna inti terpuaskan sembari memaksimalkan potensi teknologi kami. Kami mempertimbangkan berbagai model, komputer, tablet, smartphone, dan bahkan proyektor kecil, yang merupakan beberapa cara untuk menampilkan informasi dan teks yang terdengar. Pada akhirnya, kami memutuskan untuk berfokus pada smartphone karena perangkat ini dimiliki oleh hampir semua orang dan kemampuannya terus meningkat.
Setelah diputuskan, kami perlu mengatasi masalah penting lainnya: menampilkan kepercayaan transkripsi. Secara tradisional dianggap bermanfaat bagi pengguna, riset kami mengeksplorasi apakah kami benar-benar perlu menunjukkan kepercayaan level-kata atau level-frasa.
![]() |
Menampilkan level kepercayaan transkripsi. Kuning berarti level kepercayaan tinggi, hijau berarti sedang dan biru berarti kepercayaan rendah. Putih adalah teks baru yang menunggu konteks sebelum diproses. Di sebelah kiri, pewarnaan berada pada level per-frasa sedangkan di sebelah kanan berada pada level per-kata.1 Riset menemukan bahwa mereka mengganggu pengguna tanpa memberikan arti percakapan. |
Sinyal UX lain yang bermanfaat adalah tingkat kebisingan dari lingkungan saat ini. Dikenal sebagai masalah cocktail party, memahami seorang pembicara di tengah ruangan yang bising adalah tantangan utama bagi komputer. Untuk mengatasinya, kami membuat indikator yang memvisualisasikan volume ucapan pengguna secara relatif terhadap kebisingan latar belakang. Indikator ini juga memberikan masukan langsung kepada pengguna tentang seberapa baik mikrofon menerima suara yang masuk dari speaker, sehingga memungkinkan mereka untuk menyesuaikan penempatan ponsel.
Peningkatan potensial di masa mendatang dalam transkripsi ucapan otomatis berbasis seluler meliputi pengenalan pada-perangkat, pemisahan ucapan, dan peningkatan ucapan. Bergantung hanya pada transkripsi bisa menimbulkan kesulitan tersendiri yang dapat menyebabkan miskomunikasi. Riset kami dengan Gallaudet University menunjukkan bahwa menggabungkannya dengan sinyal pendengaran lainnya seperti deteksi ucapan dan indikator kenyaringan, membuat perubahan yang nyata dalam opsi komunikasi bagi pengguna.
Live Transcribe sekarang tersedia dalam peluncuran bertahap di Play Store, dan langsung terinstal di semua perangkat Pixel 3 dengan update terbaru. Live Transcribe bisa diaktifkan melalui Accessibility Settings. Anda juga bisa membaca selengkapnya tentang hal ini di The Keyword.
Ucapan Terima Kasih
Live Transcribe dibuat oleh peneliti Chet Gnegy, Dimitri Kanevsky, dan Justin S. Paul bekerja sama dengan anggota tim Android Accessibility Brian Kemler, Thomas Lin, Alex Huang, Jacqueline Huang, Ben Chung, Richard Chang, I-ting Huang, Jessie Lin, Ausmus Chang, Weiwei Wei, Melissa Barnhart dan Bingying Xia. Kami juga ingin mengucapkan terima kasih kepada mitra dekat kami dari Gallaudet University, Christian Vogler, Norman Williams dan Paula Tucker.
1 Pembaca yang jeli bisa melihat mode kepercayaan level frasa yang digunakan oleh Dr. Obeidat dalam video di atas.↩
WINNING303 SITUS JUDI ONLINE TERBESAR DAN TERBAIK
ReplyDeleteWinning303 adalah salah satu situs judi online yang sedang berkembang menuju yang terbaik diantara lainnya. Untuk itu kami memberikan bonus Spesial kepada seluruh member-member kami seperti :
- BONUS WELCOME 20%
- BONUS DEPOSIT 10%
- VONUS CASHBACK 5-10%
- BONUS 7x WIN SABUNG AYAM
- PROMO DISKON TOGEL SAMPAI 65%
- BONUS ROLINGAN 0.5%
- 1% ROLINGAN SLOT
Yuk segera daftarkan diri anda bosku, untuk menikmati bonus-bonus diatas. Terima kasih.
Hubungi kami di :
WA : +6281717177303
atau langsung di Livechat kami di www(titik)winning303(titikk)org
DAFTAR
Winning303
Thank you very much for sharing this very useful information with us, I am very happy to have found this information.
ReplyDeleterajaqq
poker99
prediksi togel
data sgp
prediksi togel
data hk
crazy davinci
ReplyDeleteclever hotels
douniamag
break away mag
campus school
power gen italia
poker online
ReplyDeletepoker online
daftar poker online
daftar poker online
kasirqq
daftar poker online
judi poker
daftar poker online
daftar poker online
daftar poker online
Thanks google. Seluruh aplikasi dan software yang anda sediakan benar-benar bermanfaat dan dapat membantu kami, selaku pengguna. Tidak heran google menjadi salah satu perusahaan besar di dunia.
ReplyDeletedaftar 88tangkas
bola deposit pulsa
daftar akun casino
deposit slot pakai pulsa telkomsel
bola tangkas88
aplikasi slot joker123
joker123 deposit pulsa
aplikasi joker
slot deposit pulsa tanpa potongan
poker online aman dan terpecaya
ReplyDeletebandar darat
taipanqq
nagaqq
I never found this application. Is it only a trial, or already published?
ReplyDeletedagbet
indobetplay
asla apk
maxparlay
wap.tbsbet
www.cool222.com
tbsbet
tbsbet wap
igkbet
Segera daftarkan diri anda di https://tantepoker.me dapatkan bonus menarik setiap minggunya sebesar 0,3% sampai 0,5% dengan jumlah turnover diatas 1 juta dalam waktu seminggu
ReplyDeleteJudi Online
Judi poker
Poker pulsa
Poker Online
Borneopoker
ReplyDeleteLasvegasqq
Amanqq
Togel Online
ReplyDeletePrediksi sgp
toto hk
Syair sgp
toto sgp
Syair hk
Bandar Togel Terpercaya
Tabel Shio 2020
Master Prediksi Togel Hari Ini
Judi Slot Via Pulsa
Situs Togel WAP
Slot Deposit Pulsa
Situs Judi QQ
ReplyDeleteSitus Judi Online
Situs Judi BandarQ
Situs Judi Domino QQ
Situs Judi Poker Online
Poker Online
Judi Online
Situs BandarQ Online
BandarQ
PKV Games
Togel Online
ReplyDeletePrediksi SDY
Syair SDY
Prediksi Togel Hari Ini
Prediksi Jitu
Prediksi Hongkong
Prediksi Sydney
Prediksi HK
Prediksi SDY
Susunan Shio
Tabel Shio 2020
Livedraw Sydney
Prediksi Sidney
Livedraw HK
Livedraw Hongkong
Prediksi Hongkong Malam Ini
A good blog and very interesting what else is the concept applied to give deep meaning, thank you very helpful
ReplyDeletehttps://sdtogel.blogspot.com
Bandar Togel Wap
thank you for sharing this information with us. daftar situs poker online
ReplyDeleteBlogs are a very good way of exchanging information and I love to read Blog posts sometimes related to famous personality biography blogs. Some blogs give me so much knowledge and this is one kind of those blogs. Besides this topic, I also love to read blogs/ articles related to the Famous Sports Personalities of India.
ReplyDeletehttps://savedaughters.com/page
Very good, I read your article and it is very helpful for my work. I follow you on social media also. It helped my thoughts and grow my ideas. Your blog provides valuable insights, and I love your engaging writing style. Keep up the great work! Our mission is to provide girls with education by generating revenue by providing our readers with practical information about world-famous personalities who inspire many of our readers, and we can promote girls' education and empowerment. If you want to encourage such small children to support then please visit our website:-https://savedaughters.com/page
ReplyDeleteJasa Penghulu Nikah Siri Terdekat 🔥 |
ReplyDeleteJasa Nikah Siri Jabodetabek 🔥 |
Jasa Penghulu Nikah Siri Jabodetabek 🔥 |
Jasa Nikah Siri Terdekat dari Lokasi Saya 🔥 |
Penghulu Nikah Siri Terdekat 🔥 |
Nikah Siri Jabodetabek 🔥 |
Live Transcribe is a real-time transcription app that captures conversations and converts them to text instantly. It is useful for the hearing impaired or anyone who needs instant transcription. The app supports multiple languages, has a text saving feature, and allows for easier interaction in everyday communication with high accuracy. Lawyers are experts in interpreting and applying the law to provide advice and representation to clients in various legal matters.
ReplyDeletehow to file for divorce in virginia
virginia personal injury law
truck accident law firm
emergency protective order virginia