Friday, February 6, 2026

LeNet: Pelopor Convolutional Neural Network yang Mengubah Dunia

Sejarah LeNet

Jauh sebelum istilah deep learning menjadi arus utama, fondasi pentingnya telah diletakkan oleh sebuah model sederhana bernama LeNet. Model ini dikembangkan pada akhir 1980-an hingga 1990-an oleh Yann LeCun bersama rekan-rekannya di Bell Labs. Pada masanya, LeNet menjadi terobosan besar karena memperkenalkan cara baru bagi komputer untuk memahami citra, bukan melalui aturan buatan manusia, melainkan melalui pembelajaran langsung dari data.

Sebelum LeNet, sistem pengenalan citra umumnya bergantung pada fitur yang dirancang secara manual. Pendekatan ini rumit, tidak fleksibel, dan sulit beradaptasi dengan variasi data nyata. LeNet menawarkan gagasan yang berbeda dan radikal: biarkan mesin belajar mengekstraksi fitur visualnya sendiri. Inilah cikal bakal convolutional neural network atau CNN yang kini menjadi tulang punggung berbagai aplikasi kecerdasan buatan.

Versi paling terkenal dari keluarga ini adalah LeNet-5, yang diperkenalkan secara formal pada tahun 1998. Arsitekturnya mungkin tampak sederhana jika dibandingkan dengan model modern, tetapi susunannya sangat visioner. LeNet-5 mengombinasikan lapisan konvolusi, lapisan subsampling atau pooling, serta lapisan fully connected dalam satu alur pemrosesan yang utuh. Model ini dirancang untuk mengenali angka tulisan tangan dan berhasil digunakan secara nyata, misalnya dalam sistem pembacaan cek bank.

 

Cara Kerja LeNet: Dari Piksel Menjadi Makna

Cara kerja LeNet dapat dipahami sebagai proses bertahap yang mengubah piksel mentah menjadi informasi bermakna. Proses dimulai dari citra input grayscale berukuran 32×32 piksel. Ukuran ini dipilih agar operasi konvolusi dapat berjalan efisien sekaligus mempertahankan detail penting.

1.        Tahap pertama adalah lapisan konvolusi. Pada tahap ini, sejumlah filter kecil digeser di atas citra untuk mendeteksi pola lokal seperti tepi, garis, dan lengkungan. Setiap filter menghasilkan feature map yang menonjolkan karakteristik tertentu dari citra. Fitur-fitur ini tidak ditentukan sebelumnya, melainkan dipelajari selama proses pelatihan.

2.        Setelah itu, LeNet menerapkan subsampling atau pooling. Tujuan tahap ini adalah mereduksi ukuran data dan menekan sensitivitas terhadap perubahan kecil pada posisi objek. Dengan demikian, model menjadi lebih stabil ketika menghadapi variasi tulisan tangan yang wajar.

 

3.        Proses konvolusi dan pooling dilakukan beberapa kali. Lapisan awal menangkap pola sederhana, sementara lapisan yang lebih dalam menggabungkan pola-pola tersebut menjadi representasi yang lebih kompleks, seperti bentuk angka secara utuh. Pendekatan hierarkis ini menjadi salah satu kekuatan utama CNN.

4.        Tahap akhir adalah lapisan fully connected, di mana seluruh fitur yang telah diekstraksi digabungkan untuk melakukan klasifikasi. Untuk pengenalan digit, output model berupa probabilitas setiap kelas angka, misalnya 0 hingga 9. Kelas dengan probabilitas tertinggi dipilih sebagai hasil prediksi.

Keunggulan LeNet terletak pada pelatihan end-to-end. Semua parameter, mulai dari filter konvolusi hingga bobot klasifikasi, dioptimalkan secara bersamaan menggunakan data contoh. Pendekatan ini kemudian menjadi standar dalam pelatihan CNN modern.

 

Warisan LeNet dalam Dunia Kecerdasan Buatan

Dampak LeNet melampaui tugas pengenalan angka. Prinsip desain yang diperkenalkannya menjadi fondasi bagi arsitektur CNN generasi berikutnya, mulai dari AlexNet hingga model-model mutakhir yang digunakan dalam pengenalan wajah, kendaraan otonom, dan analisis citra medis. LeNet membuktikan bahwa model dengan struktur sederhana dapat membawa perubahan besar jika didukung oleh ide yang tepat. Sebagai pelopor CNN, LeNet bukan sekadar catatan sejarah, melainkan batu pijakan yang mengubah cara mesin belajar melihat dunia.