Untuk perusahaan yang menggunakan ML, data berlabel adalah pembeda utama

Untuk perusahaan yang menggunakan ML, data berlabel adalah pembeda utama

AI sedang mengemudi pergeseran paradigma yang merupakan transisi industri perangkat lunak ke pemrograman data-sentris dari menulis pernyataan logis. Data sekarang adalah oksigen. Semakin banyak data pelatihan yang dikumpulkan perusahaan, semakin cerah produk bertenaga AI-nya akan terbakar.

Mengapa Tesla jauh di depan dengan sistem bantuan pengemudi lanjutan (ADAS)? Karena tidak ada orang lain yang mengumpulkan informasi sebanyak itu — ia memiliki data lebih dari 10 miliar mil perjalanan, membantunya unggul dalam persaingan seperti Waymo, yang hanya menempuh jarak sekitar 20 juta mil. Tetapi perusahaan mana pun yang mempertimbangkan untuk menggunakan pembelajaran mesin (ML) tidak dapat mengabaikan satu pilihan teknis: pembelajaran yang diawasi atau tidak diawasi.

Setiap perusahaan yang mempertimbangkan untuk menggunakan pembelajaran mesin tidak dapat mengabaikan satu pilihan teknis: pembelajaran yang diawasi atau tidak diawasi.

Ada perbedaan mendasar antara keduanya. Untuk pembelajaran tanpa pengawasan, prosesnya cukup mudah: Data yang diperoleh langsung diumpankan ke model, dan jika semuanya berjalan dengan baik, itu akan mengidentifikasi pola.

Elon Musk membandingkan pembelajaran tanpa pengawasan dengan otak manusia, yang mendapatkan data mentah dari enam indera dan membuatnya masuk akal. Dia baru-baru ini bersama bahwa menjadikan pembelajaran tanpa pengawasan berfungsi untuk ADAS merupakan tantangan besar yang belum terpecahkan.

Pembelajaran dengan pengawasan saat ini merupakan pendekatan paling praktis untuk sebagian besar tantangan ML. Laporan O’Reilly tahun 2021 tentang Adopsi AI di Perusahaan menemukan bahwa 82% perusahaan yang disurvei menggunakan pembelajaran yang diawasi, sementara hanya 58% yang menggunakan pembelajaran yang tidak diawasi. Gartner memperkirakan bahwa hingga tahun 2022, pembelajaran yang diawasi akan tetap disukai oleh perusahaan, dengan alasan bahwa “sebagian besar nilai ekonomi saat ini yang diperoleh dari ML didasarkan pada kasus penggunaan pembelajaran yang diawasi.”