Databricks memperkenalkan Delta Sharing, alat sumber terbuka untuk berbagi data

Databricks memperkenalkan Delta Sharing, alat sumber terbuka untuk berbagi data

Databricks hari ini meluncurkan proyek sumber terbuka kelimanya, alat baru bernama Delta Sharing yang dirancang untuk menjadi cara netral vendor untuk berbagi data dengan infrastruktur cloud atau produk SaaS apa pun, selama Anda memiliki konektor yang sesuai. Ini adalah bagian dari proyek Delta Lake sumber terbuka Databricks yang lebih luas.

Seperti yang ditunjukkan oleh CEO Ali Ghodsi, data meledak, dan memindahkan data dari Titik A ke Titik B adalah masalah yang semakin sulit untuk dipecahkan dengan perkakas berpemilik. “Penghalang nomor satu bagi organisasi untuk berhasil dengan data adalah berbagi data, membagikannya di antara pandangan yang berbeda, membagikannya ke seluruh organisasi — itulah masalah nomor satu yang kami lihat dalam organisasi,” jelas Ghodsi.

Delta Sharing adalah protokol sumber terbuka yang dirancang untuk mengatasi masalah tersebut. “Ini adalah protokol terbuka pertama di industri, standar terbuka untuk berbagi kumpulan data dengan aman. […] Mereka dapat membuat standar pada Databricks atau yang lainnya. Misalnya, mereka mungkin telah membuat standar dalam menggunakan AWS Data Exchange, Power BI, atau Tableau — dan kemudian mereka dapat mengakses data tersebut dengan aman.”

Alat ini dirancang untuk bekerja dengan beberapa infrastruktur cloud dan layanan SaaS dan di luar gerbang ada banyak mitra yang terlibat, termasuk Tiga Besar vendor infrastruktur cloud Amazon, Microsoft dan Google, serta visualisasi data dan vendor manajemen seperti Qlik, Starburst, Collibra dan Alation serta penyedia data seperti Nasdaq, S&P, dan Foursquare

Ghodsi mengatakan kunci untuk membuat karya ini adalah sifat proyek yang terbuka. Dengan melakukan itu dan menyumbangkannya ke The Linux Foundation, dia berusaha memastikan bahwa itu dapat bekerja di lingkungan yang berbeda. Aspek besar lainnya dari ini adalah kemitraan dan perusahaan yang terlibat. Ketika Anda dapat melibatkan perusahaan-perusahaan besar dalam proyek seperti ini, kemungkinan besar proyek tersebut akan berhasil karena bekerja di berbagai layanan populer ini. Faktanya, ada sejumlah konektor yang tersedia saat ini, tetapi Databricks memperkirakan jumlah tersebut akan meningkat seiring waktu karena kontributor membuat lebih banyak konektor ke layanan lain.

Databricks beroperasi pada model penetapan harga konsumsi seperti Snowflake, yang berarti semakin banyak data yang Anda pindahkan melalui perangkat lunaknya, semakin banyak uang yang dihasilkannya, tetapi alat Delta Sharing berarti Anda dapat berbagi dengan siapa saja, bukan hanya pelanggan Databricks lainnya. Ghodsi mengatakan bahwa sifat open-source dari Delta Sharing berarti perusahaannya masih bisa menang, sekaligus memberi pelanggan lebih banyak fleksibilitas untuk memindahkan data antar layanan.

Vendor infrastruktur juga menyukai model ini karena alat cloud data lake memindahkan data dalam jumlah besar melalui layanan mereka dan menghasilkan uang juga, yang mungkin menjelaskan mengapa mereka semua setuju dengan ini.

Salah satu ketakutan besar pelanggan cloud modern adalah terikat pada satu vendor seperti yang sering terjadi di tahun 1990-an dan awal 2000-an ketika sebagian besar perusahaan membeli setumpuk layanan dari satu vendor seperti Microsoft, IBM atau Oracle. Di satu sisi, Anda benar-benar tersedak, tetapi Anda terikat pada penjual karena biaya pindah ke yang lain sangat tinggi. Perusahaan tidak ingin terkunci seperti itu lagi dan perkakas open source adalah salah satu cara untuk mencegahnya.

Databricks didirikan pada 2013 dan telah mengumpulkan hampir $2 miliar. Putaran terakhir adalah pada bulan Februari untuk $1 miliar dengan penilaian $28 miliar, angka yang mencengangkan untuk sebuah perusahaan swasta. Kepingan salju, pesaing utama, go public September lalu. Sampai hari ini, ia memiliki kapitalisasi pasar lebih dari $66 miliar.