Keupayaan dan aplikasi yang menjadikan AI generatif sangat revolusioner memerlukan infrastruktur yang paling canggih dan berkemampuan. Google Cloud telah melabur dalam pusat dan rangkaian datanya selama 25 tahun, dan kini mempunyai rangkaian global sebanyak 38 rantau awan, dengan matlamat untuk beroperasi sepenuhnya menggunakan tenaga bebas karbon 24/7 menjelang tahun 2030. Rangkaian global ini termasuk rantau awan di Indonesia dan Singapura, dengan rantau awan baharu yang akan tiba di Malaysia dan Thailand. Selain itu, infrastruktur yang dioptimumkan AI Google Cloud merupakan pilihan utama untuk melatih dan melayani model AI generatif, dengan lebih daripada 70% unicorn AI generatif membina atas Google Cloud, termasuk AI21, Anthropic, Cohere, Jasper, Replit, Runway, dan Typeface.
Untuk membantu organisasi di Asia Tenggara menjalankan beban kerja AI mereka yang paling mencabar secara kos efektif dan berskala, Google Cloud hari ini mendedahkan penambahbaikan ketara kepada portfolio infrastruktur yang dioptimumkan AI: Cloud TPU v5e—tersedia untuk pratonton awam—dan ketersediaan awam A3 VMs dengan NVIDIA H100 GPU.
Kapsyen: Dalam sebuah rantau Google Cloud yang menjalankan Cloud Tensor Processing Unit, termasuk cip tersuai, rangkaian pusat data, suis litar optik, sistem penyejukan air, pengesahan keselamatan biometrik dan banyak lagi.
Cloud TPU v5e merupakan pemecut AI bertujuan yang paling cekap kos, serba boleh dan berskala Google Cloud setakat ini. Kini, para pelanggan boleh menggunakan satu platform Unit Pemprosesan Tensor Awan (TPU) untuk menjalankan kedua-dua latihan dan inferens AI berskala besar. Cloud TPU v5e menyampaikan sehingga 2 kali lebih tinggi prestasi latihan untuk setiap dolar dan sehingga 2.5 kali lebih tinggi prestasi inferens untuk setiap dolar untuk model LLM dan AI generatif berbanding dengan Cloud TPU v4, membolehkan lebih banyak organisasi untuk melatih dan menggunakan model AI yang lebih besar dan lebih kompleks. Cloud TPU v5e kini tersedia untuk pratonton awam bagi rantau awan Las Vegas dan Columbus Google Cloud, dengan rancangan untuk mengembang ke rantau lain, termasuk rantau awan Singapura Google Cloud lewat tahun ini.
A3 VMs, superkomputer yang dikuasakan oleh Unit Pemprosesan Grafik (GPU) H100 NVIDIA, akan tersedia secara umum pada bulan hadapan, membolehkan organisasi untuk mencapai prestasi latihan 3 kali lebih cepat berbanding dengan A2, generasi sebelumnya. A3 VMs dibina untuk melatih dan melayan, terutamanya beban kerja LLM dan AI generatif yang mencabar. Di atas pentas di Google Cloud ‘23, Google Cloud dan NVIDIA juga mengumumkan integrasi baharu untuk membantu organisasi menggunakan teknologi NVIDIA yang sama seperti yang telah digunakan sejak dua tahun yang lalu oleh Google DeepMind dan pasukan penyelidikan Google.
Kapsyen: Google Cloud CEO Thomas Kurian dan NVIDIA CEO Jensen Huang mengumumkan perkembangan perkongsian syarikat-syarikat tersebut di atas pentas di Google Cloud Next ‘23.
Google Cloud juga mengumumkan kemajuan infrastruktur utama yang lain, termasuk:
Google Kubernetes Engine (GKE) Enterprise: Ini membolehkan penskalaan mendatar berbilang kelompok yang diperlukan untuk beban kerja AI dan pembelajaran mesin (ML) yang paling mencabar dan kritikal untuk misi. Para pelanggan kini boleh meningkatkan produktiviti pembangunan AI dengan memanfaatkan GKE untuk menguruskan orkestrasi beban kerja AI berskala besar pada Cloud TPU v5e. Tambahan lagi, sokongan GKE untuk A3 VM dengan NVIDIA H100 GPU kini tersedia secara umum.
Cross Cloud Network: Ini merupakan platform rangkaian global yang membantu pelanggan menyambung dan mengekalkan keselamatan aplikasi antara awan dan di lokasi premis. Ia terbuka dan dioptimumkan oleh beban kerja – ini penting untuk prestasi hujung ke hujung sambil organisasi mengguna pakai AI generatif, dan menawarkan keselamatan dikuasakan ML untuk menyampaikan amanah sifar.
Tawaran AI baharu untuk Google Distributed Cloud (GDC): GDC direka untuk memenuhi permintaan unik organisasi yang ingin menjalankan beban kerja di edge atau dalam pusat data mereka. Portfolio GDC akan membawa AI ke edge, dengan integrasi Vertex AI dan tawaran terurus AlloyDB Omni baharu pada GDC Hosted.
Mark Lohmeyer, Vice President and General Manager, Compute and ML Infrastructure, Google Cloud, berkata: “Selama dua dekad, Google telah membina beberapa keupayaan AI terkemuka dalam industri: daripada penciptaan seni bina Transformer Google yang memungkinkan AI generatif, kepada infrastruktur yang dioptimumkan AI kami, yang dibina untuk menyampaikan skala dan prestasi global yang diperlukan oleh produk Google yang berkhidmat kepada berbilion pengguna seperti YouTube, Gmail, Google Maps, Google Play dan Android. Kami teruja untuk membawa inovasi dan penyelidikan berdekad kepada pelanggan Google Cloud sambil mereka mengejar peluang transformatif dalam AI. Kami menawarkan penyelesaian lengkap untuk AI, daripada infrastruktur pengkomputeran yang dioptimumkan untuk AI kepada perisian dan perkhidmatan hujung ke hujung yang menyokong kitaran hayat penuh latihan, penalaan dan perkhidmatan model pada skala global.”
Memperluaskan pembangunan AI generatif untuk perusahaan dengan model dan alatan baharu atas Vertex AI
Kapsyen: Google dan Alphabet CEO Sundar Pichai di atas pentas di Google Cloud Next ‘23 untuk berkongsi bagaimana syarikat ini menjadikan AI lebih berguna untuk semua orang.
Di samping infrastruktur bertaraf dunia Google Cloud, syarikat tersebut menyampaikan Vertex AI, platform AI komprehensif yang membolehkan pelanggan mengakses, menala dan menggunakan model pihak pertama, pihak ketiga dan sumber terbuka, serta membina dan menskalakan aplikasi AI bergred perusahaan. Membina atas pelancaran sokongan AI generatif di Vertex AI, Google Cloud kini mengembangkan keupayaan Vertex AI dengan ketara. Ini termasuk:
Penambahbaikan kepada PaLM 2: 38 bahasa termasuk bahasa Cina Ringkas, Cina Tradisional, Indonesia, Thai dan Vietnam, kini tersedia secara umum untuk PaLM 2 for Text and Chat – model pihak pertama untuk meringkaskan dan menterjemah teks, dan mengekalkan perbualan yang berterusan. PaLM 2 for Text and Chat boleh diakses melalui Model Garden Vertex AI di samping keupayaan penalaan penyesuai. Ini membolehkan organisasi di Asia Tenggara untuk membina aplikasi AI generatif yang memberikan perkhidmatan yang lebih baik kepada pengguna dalam bahasa tempatan sambil mengasaskan respons dengan data perusahaan atau korpus persendirian mereka sendiri. Google Cloud juga merancang untuk menghoskan PaLM 2 for Text and Chat di rantau awan Singapuranya lewat tahun ini. Untuk menyokong sembang soal jawab yang lebih panjang dan meringkaskan serta menganalisis dokumen besar seperti kertas penyelidikan, buku dan taklimat undang-undang, PaLM 2 for Text and Chat kini menyokong tetingkap konteks bertoken 32,000 (iaitu, cukup untuk memasukkan dokumen yang mempunyai 85 halaman dalam satu gesaan).
Penambahbaikan kepada Codey: Penambahbaikan telah dilakukan terhadap kualiti Codey, model pihak pertama Google yang menjana dan membetulkan kod perisian, sehingga 25% dalam bahasa utama yang disokong untuk penjanaan kod dan sembang kod. Perusahaan boleh mengakses Codey melalui Model Garden Vertex AI di samping keupayaan penalaan penyesuai. Google Cloud juga merancang untuk menghoskan Codey di rantau awan Singapuranya lewat tahun ini.
Penambahbaikan kepada Imagen: Google Cloud memperkenalkan Penalaan Gaya untuk Imagen, keupayaan baharu untuk membantu perusahaan menyelaraskan imej mereka berasaskan garis panduan jenama mereka dengan kurang daripada 10 imej. Imagen merupakan model pihak pertama Google Cloud yang mencipta imej bergred studio daripada penjelasan teks. Perusahaan boleh mengakses Imagen melalui Model Garden Vertex AI. Google Cloud juga melancarkan tera air digital di Vertex AI, kini dalam ketersediaan percubaan, untuk memberi perusahaan keupayaan untuk mengesahkan imej yang dijana AI yang dihasilkan oleh Imagen. Ketersediaan percubaan tera air digital di Vertex AI menjadikan Google Cloud sebagai penyedia awan hiperskala pertama untuk membolehkan penciptaan tera air yang tidak kelihatan dan tahan gangguan dalam imej yang dijana AI. Teknologi ini dikuasakan oleh Google DeepMind SynthID, teknologi terkini yang membenamkan tera air digital terus ke dalam piksel imej, menjadikannya tidak kelihatan oleh mata manusia dan sukar untuk diusik tanpa merosakkan imej tersebut.
Model-model baharu: Llama 2 dan Code Llama dari Meta, Falcon LLM dari Technology Innovative Institute—model sumber terbuka popular—kini tersedia secara umum di Model Garden Vertex AI. Google Cloud juga membuat pra-pengumuman tentang ketersediaan Claude 2 dari Anthropic di Model Garden Vertex AI. Google Cloud akan menjadi satu-satunya pembekal awan yang menawarkan kedua-dua penalaan penyesuai dan pembelajaran pengukuhan daripada maklum balas manusia (RLHF) untuk Llama 2.
Vertex AI Search and Conversation: Kini tersedia secara umum, alat-alat ini membolehkan organisasi untuk mencipta aplikasi carian dan sembang menggunakan data mereka hanya dalam beberapa minit, dengan pengekodan minimum dan pengurusan bergred perusahaan dan keselamatan terbina dalam.
Grounding: Google Cloud mengumumkan perkhidmatan grounding perusahaan yang berfungsi merentasi Carian dan Perbualan Vertex AI, dan model asas di Model Garden Vertex AI, memberi organisasi keupayaan untuk membumikan respons dalam data perusahaan mereka sendiri untuk menyampaikan respons yang lebih tepat. Syarikat tersebut juga bekerjasama dengan beberapa pelanggan awal untuk menguji grounding dengan teknologi yang menguasakan Google Search.
Google menilai modelnya dengan teliti untuk memastikan ia memenuhinya Prinsip AI Bertanggungjawabnya. Apabila para pelanggan sedang menggunakan Vertex AI, mereka akan mempunyai kawalan sepenuhnya ke atas data mereka: ia tidak perlu meninggalkan penyewa awan pelanggan, ia disulitkan dalam transit dan dalam keadaan rehat, dan tidak dikongsi atau digunakan untuk melatih model-model Google.
Kapsyen: Google Cloud CEO Thomas Kurian mendedahkan model-model dan alatan terkini dalam Vertex AI untuk memperkasakan inovasi AI gen untuk perusahaan.
Thomas Kurian, Chief Executive Officer, Google Cloud, berkata: “Pengawalan data anda adalah sama penting dengan penemuan dan pelatihan model yang betul. Dari awal, kami mereka bentuk Vertex AI untuk memberi anda kawalan penuh dan pengasingan atas data, kod dan harta intelek anda, tanpa kebocoran data sifar. Apabila anda menyesuaikan dan melatih model anda dengan Vertex AI—dengan dokumen dan data peribadi daripada aplikasi SaaS, pangkalan data atau sumber proprietari anda yang lain—anda tidak akan mendedahkan data tersebut kepada model asas. Kami mengambil snapshots model, membolehkan anda melatih dan merangkumnya bersama-sama dalam konfigurasi peribadi, memberikan anda kawalan sepenuhnya ke atas data anda. Gesaan dan data anda, serta input pengguna pada masa inferens, tidak akan digunakan untuk menambah baik model-model kami dan tidak boleh diakses oleh pelanggan lain.”
Organisasi-organisasi merentas industri di seluruh dunia sudah mula menggunakan Vertex AI untuk membina dan melancarkan aplikasi AI, termasuk affable.ai, Aruna, Bank Raykat Indonesia, FOX Sports, GE Appliances, HCA Healthcare, HSBC, Jiva, Kasikorn Business-Technology Group Labs, KoinWorks, The Estée Lauder Companies, the Singapore Government, Mayo Clinic, Priceline, Shopify, Wendy’s, dan banyak lagi.
“Sejak mengumumkan sokongan AI generatif di Vertex AI kurang daripada enam bulan yang lalu, kami sangat teruja dan berbesar hati kerana dapat melihat kes penggunaan inovatif daripada semua jenis pelanggan – daripada perusahaan seperti GE Appliances, yang mempunyai aplikasi penggunanya, SmartHQ, yang menawarkan pengguna keupayaan untuk menjana resipi tersuai berdasarkan makanan yang terdapat di dapur mereka, kepada syarikat permulaan unicorn seperti Typeface, yang membantu organisasi memanfaatkan AI untuk penceritaan jenama yang menarik. Kami dapat melihat permintaan yang kukuh daripada pengguna, dengan bilangan akaun pelanggan Vertex AI yang telah meningkat lebih daripada 15 kali ganda pada suku lepas,” tambah Kurian.