Oleh Cristos Goodrow, Timbalan Presiden Kejuruteraan di YouTube
Apabila cadangan YouTube berada di tahap terbaik, ia menghubungkan berbilion orang di seluruh dunia kepada kandungan yang memberi inspirasi, mengajar, dan menghibur dalam cara tersendiri. Bagi saya, ia mengambil bentuk kuliah yang meneroka persoalan etika mengenai teknologi hari ini atau sorotan permainan bola sepak Amerika anjuran Universiti California Selatan yang pernah saya tonton semasa kecil. Untuk anak perempuan sulung saya, ia bermakna mencari sumber gelak ketawa dan komuniti menerusi Vlogbrothers. Dan untuk anak lelaki sulung saya, cadangan mengemukakan pemahaman yang lebih baik mengenai algebra linear melalui penjelasan animasi oleh 3Blue1Brown - diselang-selikan dengan tontonan video KSI pada waktu rehat.Seperti yang dapat dilihat daripada keluarga saya, terdapat penonton untuk hampir setiap video, dan tugas sistem cadangan kami adalah untuk mencari penonton tersebut. Fikirkan betapa sukarnya untuk mengemudi kesemua buku di sebuah perpustakaan besar tanpa bantuan pustakawan. Cadangan mendorong sejumlah besar tontonan secara keseluruhan di YouTube, lebih banyak daripada langganan saluran atau carian. Saya telah meluangkan masa selama sedekad di YouTube untuk membina sistem cadangan kami dan saya berbangga untuk melihat ia menjadi sebahagian penting daripada pengalaman YouTube semua orang. Tetapi cadangan seringkali dilihat sebagai sebuah kotak hitam yang penuh misteri. Kami inginkan sistem ini difahami semua, jadi izinkan saya untuk menerangkan cara ia berfungsi, bagaimana ia telah berkembang, dan mengapa kami mengutamakan penyampaian cadangan yang bertanggungjawab.
Apakah itu sistem cadangan?
Sistem cadangan kami dibina berdasarkan prinsip mudah iaitu untuk membantu orang ramai mencari video yang ingin mereka tontoni dan yang akan memberikan nilai. Anda boleh melihat cadangan di dua lokasi utama: laman utama anda dan panel "Seterusnya". Laman utama anda adalah apa yang anda lihat apabila anda mula membuka YouTube - ia memaparkan pelbagai cadangan yang diperibadikan, langganan, dan berita serta maklumat terkini. Panel ‘Seterusnya’ muncul apabila anda sedang menonton sebuah video dan ia mencadangkan kandungan tambahan berdasarkan apa yang anda sedang tonton, bersama dengan video lain yang kami rasa anda mungkin minati.
Pada tahun 2008, apabila kami mula membina sistem cadangan kami, pengalaman tersebut adalah sangat berbeza. Katakan anda sering menonton video memasak. Tidakkah ia mengecewakan jika laman utama anda hanya mengesyorkan video sukan dan muzik terkini kepada anda kerana video-video tersebut mempunyai tontonan yang paling banyak? Begitulah YouTube pada zaman itu. Sistem tersebut menyusun video berdasarkan populariti untuk membuat satu halaman "Trending" yang besar. Tidak ramai orang menonton video-video tersebut dan sebahagian besar penonton YouTube berasal dari carian atau pautan yang dikongsi di luar platform.
Hari ini, sistem kami menyaring berbilion-bilion video untuk mencadangkan kandungan yang disesuaikan dengan minat khusus anda. Sebagai contoh, sistem kami mengenali bahawa saya telah menonton soroton bola sepak Amerika USC klasik dan mencadangkan kepada saya sorotan sukan lain dari zaman muda saya. Tanpa cadangan-cadangan tersebut, saya tidak akan tahu tentang kewujudan video-video ini. Tidak seperti platform lain, kami tidak menghubungkan penonton ke kandungan melalui rangkaian sosial mereka. Sebaliknya, kejayaan cadangan YouTube bergantung pada ramalan video yang ingin anda tonton dengan tepat.
Untuk berbuat demikian, kami bermula dengan pengetahuan bahawa setiap orang mempunyai tabiat tontonan yang unik. Kemudian, sistem kami membandingkan tabiat tontonan anda dengan tontonan yang serupa dengan anda, dan menggunakan maklumat tersebut untuk mencadangkan kandungan lain yang anda mungkin ingin tontoni. Jadi, jika anda suka video tenis dan sistem kami menyedari bahawa orang lain yang sukakan video sama juga menikmati video jazz, video jazz juga mungkin akan dicadangkan kepada anda (untuk kategori seperti berita dan maklumat, ia mungkin berfungsi secara berlainan - lebih lanjut mengenai perkara ini kemudian) - walaupun anda tidak pernah menonton satu video jazz pun sebelum ini. Beberapa tahun yang lalu, sistem kami mencadangkan video Tyler Oakley kepada anak perempuan sulung saya, kerana kebanyakkan orang yang menonton Vlogbrothers juga menonton salurannya pada waktu itu. Dia akhirnya menjadi seorang peminat besar, sehinggakan kami kemudian membawanya untuk berjumpa dengan beliau pada sebuah sesi bertemu peminat.
Namun begitu, kami juga tahu bahawa bukan semua orang ingin berkongsi maklumat ini dengan kami. Jadi kami memberi anda kawalan untuk menentukan berapa banyak data yang ingin anda kongsikan. Anda boleh jeda, edit atau padam carian dan sejarah tontonan YouTube anda pada bila-bila masa.
Cara kami memperibadikan cadangan
Untuk membekalkan keperibadian tersebut, sistem cadangan kami tidak beroperasi berdasarkan sebuah “buku resipi”. Ia terus berkembang, belajar setiap hari dari lebih daripada 80 bilion maklumat yang dikenali sebagai isyarat. Oleh sebab itulah, memberikan lebih banyak ketelusan adalah tidak semudah menyenaraikan formula untuk cadangan, tetapi melibatkan pemahaman semua data yang dimasukkan ke dalam sistem kami. Sejumlah isyarat saling membina atas satu sama lain bagi membantu memaklumkan sistem kami mengenai perkara yang anda anggap memuaskan: klik, masa tontonan, respon tinjauan, perkongsian, menyukai dan tidak menyukai.
Klik: Mengklik pada video memberikan petunjuk yang kuat bahawa ia memuaskan bagi anda. Lagipun, anda tidak akan mengklik sesuatu yang anda tidak mahu tonton.
Tetapi, seperti yang kami pelajari pada tahun 2011, mengklik pada sebuah video tidak bermakna anda menontonnya. Katakan anda sedang mencari sorotan daripada perlawanan Wimbledon dari tahun tersebut. Anda menatal halaman dan mengklik salah satu video, yang mempunyai lakaran kecil (thumbnail) dan tajuk yang mencadangkan bahawa ia menunjukkan rakaman perlawanan. Namun, video tersebut menunjukkan seseorang di bilik tidur mereka berbincang tentang perlawanan tersebut. Anda mengklik pada video yang dicadangkan oleh sistem kami di panel ‘Seterusnya’, hanya untuk mencari seorang lagi peminat membincang tentang perlawanan itu. Berkali-kali anda mengklik video-video ini sehingga akhirnya anda disyorkan video dengan rakaman perlawanan yang anda ingin tontoni. Sebab itulah kami menambahkan masa tontonan pada tahun 2012.
Masa Tontonan: Masa tontonan anda - video mana yang telah anda tonton dan untuk berapa lama - membekalkan isyarat yang diperibadikan kepada sistem kami mengenai video yang berkemungkinan besar ingin anda tontoni. Jadi jika peminat tenis kami menonton klip soroton Wimbledon selama 20 minit, dan hanya menonton video analisa perlawanan selama beberapa saat, kami boleh menganggap secara selamat bahawa untuk mereka, video-video sorotan itu adalah lebih bernilai.
Apabila kami memasukkan masa tontonan ke dalam cadangan pada kali pertama, kami melihat jumlah tontonan jatuh sebanyak 20% dengan serta merta. Namun kami percaya bahawa ia adalah lebih penting bagi kami untuk memberikan lebih banyak nilai kepada penonton. Namun, bukan semua masa tontonan adalah sama. Kadangkala, saya berjaga lewat, menonton video secara rawak, walaupun saya boleh meluangkan masa tersebut dengan mempelajari bahasa baharu di YouTube atau menyempurnakan kemahiran memasak saya bersama-sama dengan seorang pencipta. Kami tidak mahu para penonton untuk menyesali video yang mereka tontoni dan menyedari bahawa kami perlu melakukan lebih banyak lagi untuk mengukur berapa banyak nilai yang anda dapat daripada masa anda di YouTube.
Respon Tinjauan: Bagi memastikan penonton berpuas hati dengan kandungan yang mereka tontoni, kami mengukur “masa tontonan berharga” - jumlah masa yang dihabiskan untuk menonton video yang anda anggap bernilai. Kami mengukur masa tontonan berharga melalui tinjauan pengguna yang meminta anda menilai video yang anda tonton dengan satu hingga lima bintang, Ini memberikan kami sebuah sukatan bagi menentukan kepuasan anda terhadap kandungan yang ditonton. Jika anda memberi penilaian satu hingga dua bintang kepada video itu, kami akan bertanya mengapa anda memberikannya penilaian yang rendah. Begitu juga, jika anda memberikan sebuah video empat hingga lima bintang, kami akan bertanya mengapa — adakah video itu memberi ilham atau adakah ia bermakna kepada anda? Hanya video-video yang dinilai tinggi dengan empat hingga lima bintang dikira sebagai masa tontonan berharga.
Sudah tentu, bukan semua orang mengisi tinjauan untuk setiap video yang mereka tontoni. Berdasarkan respons yang telah kami dapati, kami telah melatih sebuah model pembelajaran mesin untuk meramalkan respon tinjauan untuk semua orang. Bagi menguji ketepatan ramalan ini, kami sengaja menyimpan sebilangan respons tinjauan dari latihan tersebut. Dengan ini, kami sentiasa memantau seberapa dekat sistem kami mengikuti respon sebenar.
Berkongsi, Menyukai, Tidak Menyukai: Secara purata, orang ramai akan lebih berpuas hati dengan video yang mereka kongsi atau sukai. Sistem kami menggunakan maklumat ini untuk meramalkan kemungkinan anda akan berkongsi atau menyukai video selanjutnya. Jika anda tidak menyukai sesebuah video, itu adalah isyarat bahawa ia mungkin bukan sesuatu yang anda gemari.
Seperti cadangan-cadangan anda, kepentingan setiap isyarat bergantung kepada anda. Jika anda seseorang yang berkongsi mana-mana video yang anda tontoni, termasuk video yang anda nilai dengan satu hingga dua bintang, sistem kami akan tahu untuk tidak terlalu menitikberatkan kongsian anda semasa mengesyorkan kandungan. Semua ini adalah sebab mengapa sistem kami tidak mengikuti formula yang tetap, tetapi berkembang secara dinamik seiring dengan perubahan tabiat menonton anda.
Tumpuan terhadap cadangan bertanggungjawab
Klik, jumlah tontonan, masa tontonan, tinjauan pengguna, perkongsian, menyukai dan tidak menyukai sangat sesuai untuk mendorong cadangan bagi topik seperti muzik dan hiburan — apa yang menjadi tontonan kebanyakan orang di YouTube. Tetapi sejak beberapa tahun kebelakangan ini, semakin ramai penonton telah mengunjungi YouTube untuk mendapatkan berita dan maklumat. Sama ada berita terkini atau kajian ilmiah yang kompleks, kualiti maklumat dan konteks untuk topik-topik ini adalah sangat penting. Seseorang mungkin melaporkan bahawa mereka sangat berpuas hati dengan video yang menyatakan "Bumi adalah rata", tetapi itu tidak bermaksud kami ingin mengesyorkan kandungan berkualiti rendah ini.
Oleh itu, cadangan memainkan peranan yang penting dalam cara kami mengekalkan sebuah platform yang bertanggungjawab. Ia menghubungkan para penonton kepada maklumat berkualiti tinggi dan mengurangkan peluang untuk melihat kandungan yang bermasalah. Dan ini saling melengkapi kerja yang dilakukan oleh Garis Panduan Komuniti mantap kami yang menentukan apa yang dibenarkan dan tidak dibenarkan di YouTube.
Kami menggunakan cadangan untuk mengehadkan kandungan berkualiti rendah daripada dilihat secara meluas sejak 2011, ketika kami membuat pengkelasan untuk mengenal pasti video yang tidak sopan atau ganas dan menghalangnya daripada disyorkan. Dan pada tahun 2015, kami menyedari bahawa kandungan tabloid sensasi kerap muncul di laman utama dan telah mengambil langkah untuk menghadkannya juga. Setahun kemudian, kami mula meramalkan kemungkinan sesebuah video itu memaparkan kanak-kanak di bawah umur dalam situasi berisiko dan mengeluarkan video-video ini dari cadangan. Dan pada 2017, untuk memastikan sistem cadangan kami berlaku adil kepada komuniti terpinggir, kami mula menilai pembelajaran mesin yang memberi kuasa kepada sistem kami untuk berlaku adil dengan kumpulan yang dilindungi — seperti komuniti LGBTQ +.
Peningkatan salah maklumat yang salah dalam beberapa tahun kebelakangan ini mendorong kami untuk memperluas cara kami menggunakan sistem cadangan kami untuk merangkumi salah maklumat dan kandungan sempadan - iaitu kandungan yang hampir, tetapi tidak melanggar Garis Panduan Komuniti kami. Ini termasuk video teori konspirasi ("pendaratan bulan dipalsukan") atau kandungan lain yang menyebarkan maklumat yang salah ("jus oren dapat menyembuhkan barah").
Kami boleh berbuat demikian dengan menggunakan pengkelasan untuk mengenal pasti sama ada sesebuah video itu "berwibawa" atau "sempadan". Pengkelasan-pengkelasan ini bergantung kepada penilai manusia yang menilai kualiti maklumat di setiap saluran atau video. Penilai-penilai ini berasal daripada seluruh dunia dan dilatih melalui satu set panduan penilaian terperinci dan tersedia untuk umum. Kami juga bergantung kepada pakar yang diperakui, seperti doktor perubatan apabila kandungannya melibatkan maklumat kesihatan.
Untuk menentukan kewibawaan, penilai perlu menjawab beberapa soalan utama. Adakah kandungan itu memenuhi janji atau mencapai matlamatnya? Kepakaran apa yang diperlukan untuk mencapai matlamat video itu? Apakah reputasi jurucakap dalam video itu dan salurannya? Apakah topik utama video itu (cth. Berita, Sukan, Sejarah, Sains, dll)? Adakah kandungannya satira? Jawapan-jawapan ini dan lain-lain menentukan kewibawaan sesebuah video. Semakin tinggi skornya, semakin banyak video itu akan dipromosikan untuk kandungan berita dan maklumat. Untuk menentukan kandungan sempadan, penilai perlu menilai faktor yang merangkumi, tetapi tidak terhad kepada, sama ada kandungannya: tidak tepat, mengelirukan atau menipu; tidak sensitif atau tidak bertoleransi; dan berbahaya atau berpotensi menyebabkan bahaya. Hasilnya digabungkan untuk memberi sebuah skor tentang kemungkinan video tersebut mengandungi salah maklumat yang membahayakan atau ianya kandungan sempadan. Sebarang video yang dikelaskan sempadan akan diturunkan kedudukannya dalam cadangan.
Penilai-penilai manusia ini melatih sistem kami untuk mencontohi penilaian mereka, dan kami kini menjadikan penilaian mereka sebagai sumber rujukan ke atas semua video di YouTube.
Menangani soalan lazim mengenai cadangan
Cadangan memainkan peranan yang penting dalam komuniti kami, memperkenalkan para penonton kepada kandungan yang mereka sukai dan membantu pencipta kandungan berhubung dengan penonton baharu. Bagi masyarakat yang lebih luas secara keseluruhannya, cadangan dapat membantu menghentikan penyebaran salah maklumat yang berbahaya secara bermakna. Kerana walaupun klik, masa tontonan, tinjauan pengguna, perkongsian, menyukai dan tidak menyukai adalah isyarat penting yang memberitahu sistem kami, ia boleh diterbalikkan oleh komitmen kami bagi memenuhi tanggungjawab kami kepada komuniti YouTube dan masyarakat umum.
Terdapat beberapa soalan yang biasa ditanya kepada saya mengenai sistem cadangan kami yang saya rasa penting untuk ditangani:
Adakah kandungan sempadan mendapat paling banyak penglibatan?
Sebenarnya, melalui tinjauan dan maklum balas, kami mendapati bahawa kebanyakan penonton tidak mahu disyorkan kandungan sempadan, dan ramai yang menganggapnya menjengkelkan dan tidak menyenangkan. Sebenarnya, apabila kami menurunkan kandungan sensasi atau jenis tabloid, kami mendapati bahawa masa tontonan meningkat sebanyak 0.5% peratus selama 2.5 bulan, berbanding ketika kami tidak meletakkan had.
Tambahan lagi, kami tidak melihat sebarang bukti bahawa kandungan sempadan adalah lebih menarik daripada jenis kandungan lain. Pertimbangkan kandungan dari orang yang mempercayai bahawa bumi adalah rata. Walaupun terdapat lebih banyak video yang dimuat naik yang mengatakan bahawa bumi adalah rata berbanding yang mengatakan bahawa bumi adalah bulat, secara purata, video mengenai bumi rata mendapat lebih kurang tontonan. Tinjauan menunjukkan bahawa kandungan sempadan hanya memuaskan hati sebahagian kecil penonton di YouTube. Kami telah melaburkan banyak masa dan wang untuk memastikan bahawa ia tidak menemui jalan ke khalayak yang lebih luas melalui sistem cadangan kami. Hari ini, kandungan sempadan mendapat sebahagian besar paparannya dari platform lain yang menghubungkannya ke YouTube.
Adakah kandungan sempadan meningkatkan masa tontonan untuk YouTube?
Bagi sebilangan besar orang, kandungan sempadan tidak memenuhi jangka masa yang dihabiskan dengan baik di YouTube. Itulah sebabnya pada tahun 2019 kami mula menurunkan kandungan sempadan dalam cadangan, mengakibatkan penurunan 70% dalam masa tontonan kandungan sempadan yang tidak dilanggan dan disyorkan di A.S. Hari ini, tontonan kandungan sempadan yang berasal dari cadangan kami jauh di bawah 1%.
Adakah cadangan mendorong penonton ke kandungan yang semakin melampau?
Seperti yang saya jelaskan, kami secara aktifnya menurunkan maklumat berkualiti rendah dalam cadangan. Kami juga mengambil langkah tambahan dengan menunjukkan video berwibawa yang menarik kepada penonton. Katakan saya menonton sebuah video mengenai vaksin COVID-19. Dalam panel ‘Seterusnya’ saya, saya akan melihat video dari sumber berwibawa seperti Vox dan Bloomberg Quicktake dan tidak akan melihat video yang mengandungi maklumat yang mengelirukan mengenai vaksin (sejauh mana sistem kami dapat mengesannya).
Di samping berita dan video penjelasan COVID-19, saya juga akan mendapat cadangan diperibadikan dari topik lain berdasarkan sejarah tontonan saya - sebuah skit dari Saturday Night Live atau ucapan TEDx Talk mengenai Kesan Super Mario. Kepelbagaian yang diperibadikan ini membantu penonton mendapat akses kepada subjek-subjek dan format-format yang baharu berbanding jenis video yang sama setiap kali.
Semakin ramai penyelidik bebas telah menyelidik bagaimana platform teknologi mempengaruhi penggunaan kandungan sempadan — dan sementara kajian berterusan — penemuan yang diterbitkan baru-baru ini menunjukkan bahawa cadangan YouTube sebenarnya tidak mendorong penonton ke arah kandungan yang melampau. Sebaliknya, tontonan kandungan berita dan politik di YouTube, secara umumnya, menggambarkan pilihan peribadi yang dapat diperhatikan menerusi tabiat dalam talian mereka.
Adakah kandungan sempadan dapat menjana duit?
Pertama sekali, garis panduan mesra pengiklan kami telah melarang banyak kandungan sempadan daripada menjanakan duit. Ramai pengiklan telah memberitahu kami bahawa mereka tidak ingin dikaitkan dengan kandungan jenis ini di YouTube dan sering memilih untuk tidak memaparkan iklan dengannya. Ini bermakna setiap video sempadan yang ditonton adalah peluang menjana duit yang hilang, menyebabkan YouTube hilang pendapatan. Begitu juga, kandungan seperti ini menimbulkan rasa tidak percaya dan menimbulkan keraguan bukan hanya dengan rakan pengiklanan, tetapi juga dengan masyarakat, akhbar, dan perangka dasar. Hakikatnya, usaha tanggungjawab kami telah berkembang, begitu juga dengan syarikat kami dan seluruh ekonomi pencipta. Tanggungjawab adalah sesuatu perkara yang baik untuk perniagaan.
Dengan itu, mengapa kami tidak membuang sahaja kandungan sempadan? Salah maklumat cenderung beralih dan berkembang dengan cepat, tidak seperti keganasan atau keselamatan kanak-kanak, yang sering kali tidak mempunyai kata sepakat. Tambahan lagi, salah maklumat boleh berbeza-beza bergantung pada perspektif dan latar belakang peribadi. Kami menyedari bahawa kadangkala, ini bermaksud mengekalkan kandungan yang kontroversial atau kandungan yang menyinggung perasaan. Jadi, kami terus bertumpu kepada usaha membina sistem cadangan yang bertanggungjawab serta mengambil langkah yang bermakna bagi mengelakkan sistem kami dari mengesyorkan kandungan ini secara meluas.
Diambil secara keseluruhannya, semua usaha tanggungjawab kami berkaitan cadangan telah menunjukkan kesan yang nyata. Masa tontonan berita berwibawa meningkat secara dramatik dan tontonan video sempadan turun. Ini tidak bermakna isu ini telah diselesaikan - ia hanya bermakna kami perlu terus menyempurnakan dan melabur dalam sistem kami untuk terus bertambah baik. Matlamat kami adalah untuk mendapatkan paparan kandungan sempadan daripada cadangan di bawah 0.5% keseluruhan tontonan di YouTube.
Misi YouTube adalah untuk memberi suara kepada semua dan menunjukkan dunia kepada mereka. Ia telah membawa perubahan yang besar dalam kehidupan keluarga saya sendiri. Video yang membawa pelajaran toleransi dan empati mempunyai kesan mendalam dan positif terhadap peribadi anak perempuan sulung saya. Anak lelaki saya berjaya merintangi detik-detik sukar dalam kelas algebra linearnya. Saya telah mempelajari sejumlah konteks dan nuansa yang bermakna menerusi kuliah-kuliah para pemimpin dalam etika teknologi. Dan komitmen kami kepada keterbukaan telah melahirkan suara dan idea baharu yang sebaliknya tidak akan mempunyai sebarang platform. Para pencipta seperti Marques Brownlee, MostlySane, atau NikkieTutorials telah memberi inspirasi kepada berjuta-juta orang dengan kepakaran, advokasi, dan kejujuran mereka.
Sistem cadangan kami bertambah baik setiap hari berkat maklum balas daripada anda semua, tetapi sistem ini selalu boleh ditambah baik. Saya dan pasukan saya komited untuk terus berusaha, dan memberikan anda pengalaman yang paling bermanfaat dan bernilai.