Mempercepat Kinerja TensorFlow di Mac

Ditulis oleh Pankaj Kanwar dan Fred Alcober

Logo Apple M1

Dengan TensorFlow 2, pelatihan kinerja terbaik di kelasnya pada berbagai platform, perangkat, dan hardware, developer, engineer, dan peneliti bisa bekerja pada platform pilihannya. Pengguna TensorFlow di Mac berprosesor Intel atau Mac yang ditenagai oleh chip M1 baru dari Apple sekarang bisa memanfaatkan pelatihan yang dipercepat menggunakan TensorFlow 2.4 versi Apple yang dioptimalkan untuk Mac dan framework ML Compute baru. Peningkatan ini, dikombinasikan dengan kemampuan developer Apple yang bisa mengeksekusi TensorFlow di iOS melalui TensorFlow Lite, terus menunjukkan fleksibilitas dan keintensifan TensorFlow dalam mendukung eksekusi ML berkinerja tinggi di hardware Apple.

Kinerja di Mac dengan ML Compute

Mac telah lama menjadi platform populer bagi developer, engineer, dan peneliti. Dengan pengumuman Apple minggu lalu, yang menampilkan jajaran Mac terkini yang berisi chip M1 terbaru, versi TensorFlow 2.4 yang dioptimalkan untuk Mac memaksimalkan kekuatan Mac dengan peningkatan kinerja yang sangat besar.

Dengan ML Compute, framework baru Apple yang mendukung pelatihan untuk model TensorFlow langsung di Mac, kini Anda dapat memanfaatkan pelatihan akselerasi CPU dan GPU di Mac berprosesor M1 dan Intel.

Sebagai contoh, chip M1 berisi CPU 8-Core baru yang kuat dan GPU hingga 8-core yang dioptimalkan untuk tugas pelatihan ML langsung di Mac. Pada grafik di bawah, Anda bisa melihat bagaimana TensorFlow 2.4 yang dioptimalkan untuk Mac dapat memberikan peningkatan kinerja sangat besar pada Mac berprosesor M1 dan Intel dengan model populer.

Dampak pelatihan terhadap model umum yang menggunakan ML Compute pada MacBook Pro 13 inci berprosesor M1 dan Intel ditampilkan dalam detik per batch, dengan angka yang lebih rendah menunjukkan waktu pelatihan yang lebih cepat.
Dampak pelatihan terhadap model umum yang menggunakan ML Compute pada MacBook Pro 13 inci berprosesor M1 dan Intel ditampilkan dalam detik per batch, dengan angka yang lebih rendah menunjukkan waktu pelatihan yang lebih cepat.
Dampak pelatihan terhadap model umum yang menggunakan ML Compute pada Mac Pro 2019 berprosesor Intel
Dampak pelatihan terhadap model umum yang menggunakan ML Compute pada Mac Pro 2019 berprosesor Intel ditampilkan dalam detik per batch, dengan angka yang lebih rendah menunjukkan waktu pelatihan yang lebih cepat.

Mulai menggunakan TensorFlow yang dioptimalkan untuk Mac

Pengguna tidak perlu melakukan perubahan apa pun pada skrip TensorFlow yang sudah ada untuk menggunakan ML Compute sebagai backend untuk TensorFlow dan TensorFlow Addons.

Untuk memulai, kunjungi repo GitHub Apple guna mendapatkan petunjuk tentang cara mendownload dan menginstal TensorFlow 2.4 yang dioptimalkan untuk Mac.

Dalam waktu dekat, kami akan semakin memudahkan update sehingga pengguna bisa dengan mudah mendapatkan angka kinerja ini dengan mengintegrasikan versi terpisah ke dalam cabang master TensorFlow.

Anda bisa mempelajari lebih lanjut tentang framework ML Compute di situs Machine Learning Apple.


Catatan kaki:

  1. Pengujian dilakukan oleh Apple pada bulan Oktober dan November 2020 menggunakan sistem MacBook Pro 13 inci praproduksi dengan chip Apple M1, RAM 16GB, dan SSD 256GB, serta sistem MacBook Pro 13 inci berbasis Intel Core i7 quad-core 1,7 GHz versi produksi dengan Intel Iris Plus Graphics 645, RAM 16GB, dan SSD 2TB. Diuji dengan macOS Big Sur prarilis, TensorFlow 2.3, TensorFlow 2.4 prarilis, ResNet50V2 dengan fine-tuning, CycleGAN, Style Transfer, MobileNetV3, dan DenseNet121. Uji kinerja dilakukan menggunakan sistem komputer khusus dan mencerminkan perkiraan kinerja MacBook Pro.
  2. Pengujian dilakukan oleh Apple pada bulan Oktober dan November 2020 menggunakan sistem Mac Pro berbasis Intel Xeon W 16-core 3,2 GHz versi produksi dengan RAM 32GB, grafis AMD Radeon Pro Vega II Duo dengan 64GB HBM2, dan SSD 256GB. Diuji dengan macOS Big Sur prarilis, TensorFlow 2.3, TensorFlow 2.4 prarilis, ResNet50V2 dengan fine-tuning, CycleGAN, Style Transfer, MobileNetV3, dan DenseNet121. Uji kinerja dilakukan menggunakan sistem komputer khusus dan mencerminkan perkiraan kinerja Mac Pro.