Pembuatan teks
Gemini API dapat menghasilkan output teks dari berbagai input, termasuk teks, gambar, video, dan audio, dengan memanfaatkan model Gemini.
Berikut adalah contoh dasar yang menggunakan satu input teks:
Berpikir dengan Gemini 2. 5
Model 2.5 Flash dan Pro mengaktifkan "pemikiran" secara default untuk meningkatkan kualitas, yang mungkin memerlukan waktu lebih lama untuk dijalankan dan meningkatkan penggunaan token.
Saat menggunakan Flash 2.5, Anda dapat menonaktifkan proses berpikir dengan menetapkan anggaran berpikir ke nol.
Untuk mengetahui detail selengkapnya, lihat panduan pemikiran.
Petunjuk sistem dan konfigurasi lainnya
Anda dapat memandu perilaku model Gemini dengan petunjuk sistem. Untuk melakukannya, teruskan objek GenerateContentConfig.
Objek GenerateContentConfig juga memungkinkan Anda mengganti parameter pembuatan default, seperti temperature.
Lihat GenerateContentConfig dalam referensi API kami untuk mengetahui daftar lengkap parameter yang dapat dikonfigurasi dan deskripsinya.
Input multimodal
Gemini API mendukung input multimodal, sehingga Anda dapat menggabungkan teks dengan file media. Contoh berikut menunjukkan cara memberikan gambar:
Untuk metode alternatif dalam menyediakan gambar dan pemrosesan gambar yang lebih canggih, lihat panduan pemahaman gambar kami. API ini juga mendukung input dan pemahaman dokumen, video, dan audio.
Respons aliran data
Secara default, model hanya menampilkan respons setelah seluruh proses pembuatan selesai.
Untuk interaksi yang lebih lancar, gunakan streaming untuk menerima instance GenerateContentResponse secara bertahap saat instance tersebut dibuat.
Percakapan multi-giliran (Chat)
SDK kami menyediakan fungsi untuk mengumpulkan beberapa putaran perintah dan respons ke dalam chat, sehingga memberi Anda cara mudah untuk melacak histori percakapan.
Streaming juga dapat digunakan untuk percakapan multi-giliran.
Model yang didukung
Semua model dalam keluarga Gemini mendukung pembuatan teks. Untuk mempelajari lebih lanjut model dan kemampuannya, buka halaman Model.
Praktik terbaik
Tips perintah
Untuk pembuatan teks dasar, perintah zero-shot sering kali sudah cukup tanpa memerlukan contoh, petunjuk sistem, atau format tertentu.
Untuk output yang lebih disesuaikan:
- Gunakan Petunjuk sistem untuk memandu model.
- Berikan beberapa contoh input dan output untuk memandu model. Hal ini sering disebut sebagai perintah few-shot.
Lihat panduan rekayasa perintah kami untuk mengetahui tips selengkapnya.
Output terstruktur
Dalam beberapa kasus, Anda mungkin memerlukan output terstruktur, seperti JSON. Lihat panduan output terstruktur kami untuk mempelajari caranya.
Langkah berikutnya
- Coba Colab memulai Gemini API.
- Pelajari kemampuan pemahaman gambar, video, audio, dan dokumen Gemini.
- Pelajari strategi perintah file multimodal.
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-09-23 UTC.
Comments
Post a Comment