Apa Itu Google AI Gemini: Pengertian, Fitur, dan Cara Kerjanya
Beda Google AI Pro dan Ultra menarik untuk disimak. ---Dok. Istimewa
Cara kerja Google Gemini pada dasarnya mirip dengan model AI generatif lainnya, tetapi dengan pendekatan multimodal yang terintegrasi. Berikut adalah penjelasan sederhananya:
1. Pelatihan pada Dataset Massive dan Multimodal
Gemini tidak hanya dilatih pada kumpulan teks yang sangat besar, tetapi juga pada miliaran data berupa gambar, audio, video, dan kode. Dataset ini telah dibersihkan dan diberi label untuk mengajarkan model tentang hubungan antara berbagai jenis informasi ini.
2. Pemrosesan Input Multimodal
Ketika Gemini menerima sebuah prompt (perintah), langkah pertama adalah memahami konteksnya.
Jika inputnya adalah teks, ia memprosesnya seperti model bahasa pada umumnya.
Jika inputnya adalah gambar + teks (misalnya, foto sepeda dengan pertanyaan "bagaimana cara memperbaiki rantai ini?"), Gemini tidak memproses gambar dan teks secara terpisah.
Model yang sama secara native menganalisis gambar untuk mengidentifikasi komponen sepeda sekaligus memahami pertanyaan teks untuk memberikan jawaban yang kontekstual.
BACA JUGA:Resmikan Gemini Academy, Kemendag dan Google Luncurkan Pelatihan Berbasis AI
3. Encoding dan Pemahaman Konteks
Informasi dari berbagai modalitas ini kemudian di-encode menjadi representasi numerik (vektor) yang dipahami oleh neural network.
Gemini menggunakan arsitektur transformer canggih untuk memetakan hubungan antara bagian-bagian yang berbeda dari input (misalnya, hubungan antara objek dalam gambar dengan kata-kata dalam pertanyaan).
4. Generasi Output yang Relevan
Berdasarkan pemahaman yang mendalam terhadap input dan konteks, decoder pada model Gemini kemudian menghasilkan output yang paling mungkin dan relevan. Output ini bisa kembali dalam berbagai bentuk:
- Output Teks: Menjawab pertanyaan, merangkum dokumen, atau menulis esai.
- Output Kode: Menghasilkan kode program berdasarkan deskripsi.
- Output Gambar atau Audio: Meski belum sepenuhnya dirilis ke publik, kemampuan generasi gambar dan audio adalah bagian dari roadmap Gemini.
5. Fine-Tuning dan Reinforcement Learning (RLHF)
Seperti model AI modern, Gemini melalui proses fine-tuning dan Reinforcement Learning from Human Feedback (RLHF).
Tim penilai manusia (human raters) menilai kualitas respons Gemini, dan umpan balik ini digunakan untuk terus menyempurnakan model, membuatnya lebih aman, akurat, dan selaras dengan niat pengguna.
Cek Berita dan Artikel lainnya di Google News
Temukan Berita Terkini kami di WhatsApp Channel
Sumber:
