Sukses dalam industri film bergantung pada kemampuan studio untuk menarik penonton bioskop—tetapi terkadang hal ini lebih mudah diucapkan daripada dilakukan. Penonton bioskop adalah kelompok yang beragam, dengan berbagai minat dan preferensi. Dahulu, studio film sangat bergantung pada pengalaman ketika memutuskan untuk berinvestasi dalam skrip tertentu—tetapi ini berisiko besar, terutama ketika berinvestasi dalam cerita asli dan baru. Proses kompleks dan berulang antara mencocokkan cerita dan penonton ini akhirnya membuat Julie Rieger, President, Chief Data Strategist and Head of Media, dan Miguel Campo-Rembado, SVP of Data Science, bersama dengan tim data scientist mereka di 20th Century Fox, memutuskan untuk mengklarifikasi dengan data.
Tantangan data yang sesuai untuk Machine Learning
Memahami segmentasi pasar dari film yang go publik adalah fungsi pokok dari studio film. Selama bertahun-tahun, studio telah berinvestasi dalam pemrosesan data tingkat tinggi untuk mencoba memetakan segmen pelanggan, dan membuat prediksi untuk film di masa depan. Akan tetapi, sampai saat ini, prediksi terperinci di tingkat segmen, belum lagi di tingkat pelanggan, tetap sulit dipahami karena hambatan teknologi dan kelembagaan.
Miguel dan timnya berhasil menyingkirkan beberapa hambatan tersebut melalui kerja sama dengan mitra seperti Google Cloud. Bersama-sama, kami membangun kemitraan data dengan privasi yang kuat untuk lebih memahami penonton bioskop, dan mengembangkan model deep learning internal yang mengatur data pelanggan terperinci dan skrip film untuk mengidentifikasi pola dasar preferensi penonton untuk berbagai jenis film. Dalam durasi waktu 18 bulan, model-model ini telah menjadi pertimbangan rutin untuk keputusan bisnis penting, dan menyediakan salah satu barometer paling objektif, berdasar-data, dan efektif untuk mengevaluasi gaya film, afinitasnya dengan penonton inti serta penonton yang lain, dan potensi kinerja keuangannya.
Mari bicara tentang metode-metode ini secara lebih terperinci. Ketika berhubungan dengan film, kita akan terbatasi bila menganalisis teks yang diambil dari skrip karena hanya menyediakan kerangka cerita, tanpa ada dinamisme tambahan yang bisa menarik penonton untuk menonton film. Tim ingin tahu apakah ada cara untuk menggunakan computer vision yang modern dan canggih untuk mempelajari trailer film, yang tetap menjadi elemen paling pokok dari keseluruhan campaign pemasaran film. Perilisan trailer untuk film baru adalah moment yang sangat dinanti-nantikan yang bisa membantu memprediksi kesuksesan di masa mendatang, sehingga bisnis ini harus memastikan bahwa trailer tersebut memenuhi harapan penonton bioskop. Untuk mencapai tujuan ini, tim data science dari 20th Century Fox bermitra dengan
Advanced Solutions Lab Google dan membuat
Merlin Video, fitur computer vision yang mempelajari banyak trailer film untuk membantu memprediksi penonton yang datang ke bioskop di masa mendatang untuk trailer tertentu.
Merancang pipeline data
Langkah pertama yang dilakukan tim adalah mengidentifikasi teknologi apa yang harus mendukung fitur ini. Tentu saja pilihannya adalah
Cloud Machine Learning Engine (Cloud ML Engine), bersama dengan framework deep learning
TensorFlow. Karena ini adalah layanan terkelola, Cloud ML Engine auto-generate semua penyediaan dan pemantauan sumber daya, sehingga tim bisa fokus membangun model deep learning untuk Merlin, daripada mengonfigurasi infrastruktur. Integrasinya dengan
Cloud Dataflow juga memungkinkan pembuatan laporan yang mulus di
Data Studio, yang memberi tim pemahaman yang lebih mendalam tentang bagaimana proses ini bekerja. Pemeliharaan sistem sehari-hari (pada umumnya, penyerapan data) bisa dilakukan dengan sederhana dan mudah, dan dapat ditangani sepenuhnya oleh data scientist, serta tidak membutuhkan intervensi dari engineer unit bisnis lainnya.