Hashing Fitur: Teknik Reduksi Dimensi untuk Variabel Kategorikal Kardinalitas Tinggi

Hashing Fitur: Teknik Reduksi Dimensi untuk Variabel Kategorikal Kardinalitas Tinggi

Dalam dunia ilmu data, kita sering kali dikelilingi oleh informasi dalam jumlah besar, sebagian besar dalam bentuk variabel kategori berkardinalitas tinggi. Variabel-variabel ini, seperti daftar ID pelanggan, nama produk, atau lokasi geografis, menyimpan banyak potensi wawasan namun juga dapat membebani model tradisional karena ukurannya yang besar. Untuk memahaminya, data scientist harus menemukan cara untuk mengurangi …

Read more