Rabu, 19 Mei 2021

MUM: Tanda aras baharu AI dalam pemahaman informasi

Oleh Pandu Nayak, Felo dan Timbalan Presiden Google, Carian

Memahami bahasa, video, imej dan lokasi di sekitar kita merupakan teras misi kami dalam penyusunan informasi dunia. Pencapaian dalam penyelidikan AI seperti BERT telah banyak meningkatkan kualiti Carian melalui pemahaman lebih baik niat di sebalik pertanyaan anda, namun kami sentiasa mencari jalan untuk mencabar sempadan kebolehan Google.


Kini kami telah mencapai tanda aras AI yang seterusnya melalui Multitask Unified Model atau MUM. Ia berpotensi membawa pemahaman informasi Google ke tahap baharu. Seperti BERT, MUM dibangunkan di atas sebuah pengantar Transformer, tetapi ia 1,000 kali lebih berkuasa. MUM bukan sahaja memahami, ia juga mampu menjana bahasa. Ia terlatih dalam 75 buah bahasa berbeza serta mampu melakukan pelbagai tugasan pada satu-satu masa; ini membolehkan ia untuk membentuk sebuah pemahaman informasi dan pengetahuan dunia yang lebih komprehensif berbanding model-model terdahulu seperti BERT. MUM juga bersifat multimodal, oleh itu ia memahami informasi merentasi teks dan imej. Di masa hadapan, ia boleh dikembangkan untuk merangkumi lebih banyak modal seperti video dan audio. 


Kami akan membawakan ciri-ciri serta peningkatan dikuasakan MUM kepada produk-produk kami dalam bulan-bulan dan tahun-tahun terdekat ini. Walaupun kami masih di hari-hari awal penyelidikan MUM, kami mempersembahkan kepada anda bagaimana keupayaan uniknya mampu membantu kami menangani cabaran informasi yang semakin kompleks di masa hadapan.



Memahami soalan-soalan perbualan yang lebih kompleks

MUM sangat berkuasa dan unik kerana ia mampu menggabungkan pemahaman sesebuah bahasa dengan fakta atau ciri-ciri utama seseorang, tempat atau perkara demi mendapatkan informasi yang relevan. 


Bayangkan anda merupakan seorang pendaki tegar, dan anda ingin mengetahui: “Saya telah mendaki Gunung Adams dan ingin mendaki Gunung Fuji ketika musim luruh nanti. Apakah perbezaan dalam persiapan pendakian yang harus saya lakukan?”


Ia merupakan sebuah soalan santai buat rakan pendaki, namun ia sangat kompleks untuk sebuah enjin pencarian. Ini kerana ia memerlukan bukan sahaja pengetahuan pendakian malah bagaimana untuk menjana perbandingan. Hari ini, jika anda ingin mendapatkan jawapan persoalan anda, beberapa pertanyaan kepada Google perlu dilakukan, ataupun menanyakan kembali soalan anda dalam pelbagai bentuk beberapa kali.


Jika anda menanyakan soalan ini kepada Google di masa hadapan, MUM mungkin berupaya memahami bahawa anda sedang membandingkan dua gunung dan membuat kesimpulan bahawa informasi ketinggian serta laluan jejak mungkin relevan. Ia juga mungkin memahami bahawa dalam konteks mendaki, untuk “bersedia” mungkin melibatkan perkara seperti latihan kecerdasan di samping mendapatkan peralatan yang bersesuaian. Oleh kerana ia mampu mengenalpasti dan memahami nuansa-nuansa ini, MUM berpotensi mengetengahkan informasi relevan untuk persoalan sebegini.


Satu aspek lain yang menjadikan MUM unik adalah keupayaannya menjana kesimpulan berdasarkan pengetahuan mendalamnya tentang dunia. Sebagai contoh, MUM mungkin menjana respon yang mengatakan bahawa walaupun Gunung Fuji secara kasarnya terletak pada tahap ketinggian seperti Gunung Adams, musim luruh merupakan musim hujan di Gunung Fuji jadi anda mungkin memerlukan jaket kalis air. 


MUM juga berkebolehan mengutarakan sub topik berguna untuk penerokaan lebih mendalam - seperti peralatan terbaik atau latihan kecerdasan terbaik - beserta rujukan artikel, video dan imej berguna merentasi tapak web. Dengan mengumpulkan lebih banyak informasi relevan untuk menjawab pelbagai bahagian persoalan kompleks, Google mampu membantu anda mendapatkan apa yang anda cari dengan lebih pantas. 



Menghapuskan batasan bahasa

Bahasa mampu menjadi batasan yang signifikan dalam mengakses informasi. MUM berpotensi untuk menghapuskan batasan ini dengan memindahkan pengetahuan merentasi bahasa. Ini bermaksud ia mampu mempelajari dari sumber-sumber yang tidak ditulis dalam bahasa pencarian anda dan seterusnya membantu mengetengahkan informasi tersebut kepada anda. 


Mungkin memang adanya informasi berguna berkenaan Gunung Fuji dalam bahasa Jepun; hari ini tidak mungkin anda mampu mendapatkannya melainkan pencarian anda dilakukan menggunakan bahasa Jepun. Tetapi, MUM berupaya memindahkan pengetahuan dari pelbagai sumber merentasi bahasa serta menggunakan maklumat yang diperolehi untuk mendapatkan hasil paling relevan dalam bahasa pilihan anda. Jadi di masa hadapan ketika anda mencari maklumat untuk melawat Gunung Fuji, anda mungkin diberikan informasi seperti lokasi paling sesuai untuk menikmati panorama gunung, lokasi kolam air panas serta kedai cenderahati popular setempat, yang mana ia lebih mudah diperolehi jika melakukan pencarian dalam bahasa Jepun. 



Memahami informasi multimodal dunia

MUM bersifat multimodal, yang bermaksud ia mampu memahami informasi dalam format berbeza seperti tapak web, gambar, dan banyak lagi secara serentak. Anda akhirnya mungkin mengambil foto but mendaki anda dan bertanya, “Bolehkah saya menggunakan ini untuk mendaki Gunung Fuji?” MUM akan memahami imej yang dipaparkan dan mengaitkannya dengan persoalan anda serta memaklumkan anda but itu sesuai. Ia juga boleh memandu anda ke satu senarai peralatan mendaki yang disyorkan dalam sebuah blog Gunung Fuji.



Mengaplikasikan AI maju dalam Carian dengan bertanggungjawab.

Setiap kali kami mengambil langkah ke hadapan dengan AI demi menjadikan informasi dunia lebih mudah diakses, kami melakukannya dengan penuh tanggungjawab. Setiap penambahbaikan Carian Google melalui proses penilaian ketat untuk memastikan agar kami memberikan kepada anda hasil carian yang lebih relevan serta membantu. Penaraf manusia, yang mematuhi Garis Panduan Penaraf Kualiti Pencarian, membantu kami memahami sebaik mana hasil pencarian kami membantu orang ramai mendapatkan informasi.


Seperti bagaimana kami telah berulang kali menguji dengan teliti aplikasi BERT semenjak pelancarannya pada tahun 2019, MUM akan turut melalui proses ini dalam aplikasi model-modelnya di Carian dalam bulan-bulan dan tahun-tahun akan datang. Secara spesifiknya, kami akan cuba mendapatkan pola yang mungkin menunjukkan bias dalam pembelajaran mesin demi mengelak merangkumkannya ke dalam sistem kami. Kami juga akan menggunakan penyelidikan terbaharu kami berkenaan bagaimana untuk mengurangkan jejak karbon sistem latihan seperti MUM untuk memastikan agar Carian dapat beroperasi dengan lancar.


Walaupun kami berada dalam hari-hari awal penerokaan MUM, ia merupakan langkah penting ke arah masa hadapan dimana Carian berupaya memahami cara berbeza orang ramai berkomunikasi dan menafsirkan informasi. Carian masih belum dirungkai dan kami benar-benar percaya bahawa kami mampu menjadikan informasi dunia lebih terbuka dan lebih mudah diakses dengan MUM.