Google telah mengumumkan ketersediaan Cloud TPU v2 Beta untuk platform Google Cloud

Posted on

Google telah mengumumkan ketersediaan Cloud TPU v2 Beta untuk platform Google Cloud

Minggu ini, Google mengumumkan ketersediaan Cloud TPU beta di Google Cloud Platform (GCP), yang dapat diakses melalui infrastruktur mesin komputasi sebagai layanan. Dengan menggunakan unit pemrosesan Tensor (TPU) generasi kedua Google, konfigurasi Cloud TPU standar masih memiliki empat ASIC khusus dan 64 GB HBM2 di satu papan, yang dirancang untuk mempercepat beban pembelajaran mesin berbasis TensorFlow. Dengan mesin virtual komputasi Google yang disewa, Anda dapat menggunakan sumber daya TPU Cloud bersama dengan penawaran CPU dan GPU saat ini dari platform Google Cloud saat ini.

Pertama kali terungkap di Google I / O 2016, TPU asli adalah akselerator berbasis PCIe yang dirancang untuk beban kerja inferensi, dan dalam banyak kasus, TPUv1 digunakan secara internal. Musim panas lalu, Google memperkenalkan penerus berorientasi inferensi untuk TPUv2 dan menguraikan rencana untuk memasukkannya ke dalam layanan cloud-nya. Keduanya kemudian dijelaskan dalam presentasi teknis Hot Chips 2017.

Di bawah tenda, TPUv2 memiliki sejumlah modifikasi. Singkatnya, TPU ASIC generasi kedua hadir dengan konfigurasi “inti” ganda, masing-masing dengan unit skalar / vektor dan unit perkalian campuran 128×128 yang mampu melakukan operasi titik mengambang 32-bit, tidak seperti TPUv1 inti tunggal 256×256 MXU dan 8- sedikit. Kemampuan integer TPUv2 juga menggunakan HBM alih-alih DDR3 untuk meningkatkan bandwidth memori pendahulunya, dengan 8GB HBM2 terhubung ke setiap inti dengan total 16GB per chip.

Empat dari ASIC ini membentuk papan Cloud TPU, dengan Google melaporkan hingga 180 TFLOPS kinerja komputasi yang tidak ditentukan. Seperti yang diumumkan sebelumnya, Google bertujuan untuk meluncurkan “pod TPU” sebagai salah satu tujuan utamanya, di mana 64 TPU Cloud akan diintegrasikan ke dalam susunan rak jaringan khusus. Google berencana untuk menawarkan semua Pod TPU di GCP akhir tahun ini.

Secara praktis, fitur ini disediakan untuk developer yang mencari fungsi machine learning TPU yang tepat untuk beban kerja khusus TensorFlow, dengan memanfaatkan infrastruktur cloud Google yang ada sebagai layanan. Karena sifatnya yang beta, Google memiliki sejumlah dokumen dan alat di situsnya. Dalam banyak hal, kemampuan TPU saat ini ada sebagai semacam pembersih pipa ekspansi untuk pod TPU masa depan, dan Google menyebutkan hal ini dalam pengumumannya. Sejumlah fitur belum diselesaikan untuk TPU: misalnya, paralelisasi model belum didukung, tidak semua operasi TensorFlow internal tersedia, dan ada batasan tertentu untuk pembelajaran yang ditingkatkan pelatihan, model jaringan saraf berulang (RNN). Atau jaringan permusuhan produktif (GAN).

Meskipun partner tertentu memiliki akses ke Cloud TPU untuk digunakan dalam manufaktur, pengumuman hari ini membuka akses ke pelanggan publik GCP. Google Cloud TPU tersedia saat ini sebagai waktu komputasi yang dapat dihitung waktu AS dari VM yang disediakan oleh Compute Engine dengan harga $ 6,50 per TPU per jam dengan peningkatan satu detik. Pihak yang berminat dapat mengajukan permintaan kuota beta.

Bacaan terkait



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *