Banyak bisnis perlu mendigitalkan foto, dokumen, memo, dan jenis media fisik lainnya untuk membantu tugas-tugas seperti pemrosesan faktur, tinjauan aplikasi, dan analisis kontrak. Di Google Cloud, kami menyediakan sejumlah cara yang bisa dilakukan pelanggan, mulai dari menggunakan API machine learning yang sudah dilatih, membangun di paket AutoML kami, hingga menerapkan Document Understanding AI, solusi AI terbaru kami.
Dalam postingan ini, kami akan berfokus pada satu pendekatan, menggunakan Cloud AutoML untuk melakukan pemberian tag dokumen untuk keperluan pemrosesan dokumen. Pemberian tag dokumen berarti mengidentifikasi pasangan nilai kunci dari sebuah dokumen seperti respons (atau nilai) ke kolom (atau tag) seperti pelanggan, nomor akun, total, dan lainnya. Di sini, ‘tag’ adalah kolom yang ingin diekstrak, dan ‘nilai’ adalah data tentang tag tersebut. Dalam solusi ini, kami akan menggunakan AutoML untuk mengambil konten penting dari sebuah gambar seperti tanda tangan, stempel, dan kotak, untuk diproses.

Solusi masa lalu

Beberapa tahun lalu, digitalisasi dokumen artinya hanya memindai dan menyimpannya dalam bentuk gambar di cloud. Sekarang, dengan fitur dan teknik yang lebih baik, dan dengan booming solusi berbasis ML baru-baru ini, kita bisa mengubah dokumen fisik menjadi data terstruktur yang dapat diproses secara otomatis, dan dari sini pengetahuan yang berguna dapat diekstraksi.
Sampai saat ini, digitalisasi dokumen memerlukan aplikasi metodologi berbasis aturan seperti menggunakan ekspresi reguler untuk mengidentifikasi kolom, atau mengekstraksi OCR dari posisi kolom tetap. Namun solusi ini tidak selalu berfungsi pada dokumen baru dan bisa saja terjadi masalah dengan pencocokan kata kunci atau model NLP berbasis teks. Deteksi objek dan pengenalan entity, yang menjadi pusat perhatian dalam beberapa tahun terakhir, kini telah menyebabkan peningkatan yang signifikan dalam bidang ini. Cloud AutoML, paket layanan AI kami yang memungkinkan Anda membuat model machine learning khusus berkualitas tinggi dengan keahlian ML yang minimal, adalah salah satu contohnya.

Solusi GCP: AutoML sesuai kebutuhan

Ada berbagai macam layanan AutoML yang bisa digunakan sebagai dasar untuk membuat model yang mampu memecahkan masalah bisnis yang unik. Dalam kasus digitalisasi dokumen, satu kemungkinan arsitektur yang bisa digunakan terlihat seperti ini:
cloud ai solutions suite.png
Jenis arsitektur ini tidak hanya mudah diikuti, tetapi juga mudah diterapkan dalam produksi. Semua komponen berdasar pada produk-produk GCP yang sudah ada serta sangat skalabel, tanpa server, dan bisa langsung diproduksi.
  1. Dokumen yang ditag—Anda bisa menggunakan AI Platform Data Labeling Service jika belum memiliki data yang dianotasi.
  2. OCR & deteksi objek—Ini bisa dilakukan dengan Vision API dan AutoML Vision Object Detection, tambahan terbaru dalam paket produk AutoML.
  3. Penggabungan dan pemrosesan fitur—Ada beberapa cara berbeda yang bisa dilakukan, seperti menggunakan notebook Jupyter sederhana atau solusi ter-container berbasis Python.
  4. Pengenalan entity—Ini bisa dilakukan dengan menggunakan Entity extraction, fitur baru di AutoML Natural Language, tambahan terbaru dalam paket produk AutoML
  5. Pascapemrosesan—Ini bisa dilakukan dengan cara yang hampir sama dengan pemrosesan fitur.
Seluruh pipeline bisa diatur menggunakan Cloud Composer, atau dapat diterapkan menggunakan Google Kubernetes Engine (GKE). Namun, beberapa masalah bisnis, seperti membangun pipeline penyerapan data yang disesuaikan ke GCP, mengekstraksi aturan dari dokumen hukum, menyunting informasi sensitif dari dokumen sebelum menganalisisnya, dll., memerlukan pengembangan kustomisasi tambahan selain arsitektur yang disebutkan di atas. Untuk kebutuhan tersebut, Anda bisa menghubungi tim penjualan kami untuk bantuan dan detail selengkapnya.

Produksi nilai

Berbagai solusi ML memiliki keuntungan teknis atau bisnis mereka sendiri—dan banyak pelanggan kami menggunakan solusi seperti ini untuk mencapai tujuannya, apakah itu untuk meningkatkan pengalaman pengguna, mengurangi biaya operasional, atau mengurangi error secara keseluruhan. Solusi seperti yang dijelaskan dalam postingan ini bisa digunakan di berbagai industri seperti layanan kesehatan, layanan keuangan, media, dan banyak lagi. Berikut adalah beberapa contohnya:
  • Secara otomatis mengekstraksi data dari Electronic Health Records (EHR).
  • Pembuatan pasangan nilai kunci dari faktur.
  • Pengambilan kolom dari dokumen finansial.
  • Memahami teks keluhan pelanggan.
  • Pemberian tag cek bank, tiket, dan data lainnya.

Berikutnya

Di era deep learning ini, solusi yang menyederhanakan proses pelatihan, seperti transfer learning, semakin dibutuhkan. Arsitektur yang dijelaskan dalam postingan ini telah berhasil diuji dan diterapkan untuk bekerja sesuai kebutuhan, dan memungkinkan digitalisasi dokumen tanpa memerlukan ribuan gambar beranotasi untuk pelatihan model.
Namun, variabilitas data masih merupakan faktor penting dalam setiap solusi berbasis machine learning. AutoML secara otomatis memecahkan banyak masalah dasar atas variansi data, sehingga memungkinkan Anda untuk menggunakan hanya beberapa ribu gambar untuk melatih model khusus.
Membantu pelanggan memproses dokumen mereka sangat sesuai dengan misi Google untuk mengatur informasi dunia dan membuatnya bisa diakses dan bermanfaat secara global. Kami berharap bahwa dengan membagikan postingan ini, kami bisa menginspirasi lebih banyak organisasi untuk memanfaatkan cloud. Fitur seperti Cloud AutoML Vision, Cloud AutoML Natural Language, dan Cloud Storage bisa membantu Anda membangun set data lengkap dan meningkatkan pengalaman pengguna akhir.
Ini adalah solusi tertarget dan sederhana untuk masalah tertentu. Untuk otomatisasi proses dokumen yang lebih kuat dan luas serta teknologi ekstraksi data, silakan merujuk ke solusi Document Understanding AI Google. AutoML adalah komponen inti dari solusi Document Understanding AI end-to-end, yang mudah diterapkan melalui mitra kami, dan tidak memerlukan keahlian machine learning. Anda bisa mempelajari lebih lanjut di situs kami.