Mengintegrasikan Google Gemini ke Aplikasi Node.js

 Buka di aplikasi

Mengintegrasikan Google Gemini ke Aplikasi Node.js

3 menit membaca23 Januari 2024
Tekan enter atau klik untuk melihat gambar dalam ukuran penuh
Google Gemini AI

Apa itu Google Gemini?

Google Gemini adalah model AI yang canggih dan multifaset yang dikembangkan oleh Google AI. Gemini tidak hanya menangani teks; ia dapat memahami dan beroperasi dalam berbagai format seperti kode, audio, gambar, dan video. Hal ini membuka kemungkinan menarik untuk proyek Node.js Anda.

Artikel ini akan membantu Anda mengintegrasikan Google Gemini ke aplikasi Node.js Anda. Kami akan menggunakan Google Gemini SDK .

Prasyarat

  • Node.Js terinstal di mesin Anda
  • Akun Google AI Platform untuk menghasilkan kunci API
  1. Node.Js versi 18+ diperlukan.
  2. Untuk menggunakannya importdi Node.Js Anda perlu menambahkannya "type": "module"di package.jsonfile Anda.

Memulai

Mari kita mulai dengan membuat proyek Node.js baru. Buka terminal Anda dan jalankan perintah berikut:

mkdir google-gemini-nodejs 
cd google-gemini-nodejs
npm init -y

Selanjutnya, instal Google Gemini SDK dan paket dotenv:

npm install @google/generative-ai dotenv

Membuat Akun Google AI Platform

Untuk menggunakan Google Gemini SDK, Anda memerlukan Kunci API. Anda dapat membuat API baru dengan mengunjungi situs web Google AI Platform .

Dapatkan cerita Reetesh Kumar di kotak masuk Anda

Bergabunglah dengan Medium secara gratis untuk mendapatkan pembaruan dari penulis ini.

Untuk membuat kunci API baru, klik tombol Dapatkan Kunci API. Setelah Anda mendapatkan kunci API, simpan dalam .envfile di root proyek Anda.

API_KEY=KUNCI_API_ANDA

Menyiapkan Google Gemini SDK

Setelah kita memiliki kunci API, mari kita siapkan Google Gemini SDK. Buat file baru bernama "Gemini" index.jsdi direktori root proyek Anda dan tambahkan kode berikut:

Model Google Gemini Pro

import { GoogleGenerativeAI } dari  "@google/generative-ai" ; 
import dotenv dari "dotenv" ;
dotenv.config (); const gemini_api_key = process.env.API_KEY ; const googleAI = new GoogleGenerativeAI ( gemini_api_key); const geminiConfig = { temperature : 0.9 , topP : 1 , topK : 1 , maxOutputTokens : 4096 , } ; const geminiModel = googleAI.getGenerativeModel ( { model : "gemini-pro" , geminiConfig, }); const generate = async ( ) => { try { const prompt = "Beri tahu saya tentang google." ; const result = await geminiModel.generateContent ( prompt); const response = result.response ; console.log ( response.text ()); } catch ( error) { console.log ( "respons error" , error) ; } }; menghasilkan ();


























Dalam kode di atas, kami menggunakan model Google Gemini Pro yang unggul dalam menangani tugas-tugas bahasa alami seperti pembuatan teks, penerjemahan, serta obrolan teks dan kode multi-putaran. Hal ini menjadikannya sempurna untuk membangun sistem cerdas yang berinteraksi dengan pengguna dalam bahasa alami.

Model Visi Google Gemini

impor { GoogleGenerativeAI } dari  " @google/generative-ai" ; 
impor fs dari "fs/promises" ;
impor dotenv dari "dotenv" ;
dotenv.config (); const gemini_api_key = process.env.API_KEY ; const googleAI = new GoogleGenerativeAI (gemini_api_key); const geminiConfig = { suhu : 0.4 , topP : 1 , topK : 32 , maxOutputTokens : 4096 , }; const geminiModel = googleAI.getGenerativeModel ({ model : "gemini-pro-vision" , geminiConfig, }); const generate = async ( ) => { coba { // Baca berkas gambar const jalur_file = "some-image.jpeg" ; const berkas_gambar = await fs.readFile (jalur_file); const basis_image64 = berkas_gambar. toString ( "base64" ); const promptConfig = [ { text : "Bisakah Anda memberi tahu saya tentang gambar ini apa yang terjadi di sana?" }, { inlineData : { mimeType : "image/jpeg" , data : imageBase64, } , }, ]; const result = await geminiModel.generateContent ( { content : [{ role : "user" , parts : promptConfig }], } ); const response = await result.response ; console.log ( response.text ()); } catch ( error) { console.log ( "respon error" , error); } }; generate ();










































Dalam kode di atas, kami menggunakan model Google Gemini Vision yang dapat mengategorikan seluruh gambar berdasarkan kontennya dan menghasilkan teks untuk gambar tersebut. Hal ini menjadikannya sempurna untuk membangun sistem cerdas yang berinteraksi dengan pengguna dalam bahasa alami.

Menjalankan Aplikasi

Untuk menjalankan aplikasi, buka terminal Anda dan jalankan perintah berikut:

simpul index.js

Kesimpulan

Dalam artikel ini, kita mempelajari cara mengintegrasikan Google Gemini ke aplikasi Node.js. Kita juga mempelajari cara menggunakan Google Gemini Pro dan model Vision untuk menghasilkan teks dan keterangan gambar. Anda dapat menemukan kode sumber lengkapnya di GitHub .

Sekian untuk artikel ini. Semoga bermanfaat. Jika ada pertanyaan atau masukan, silakan bagikan di kolom komentar. Saya akan dengan senang hati menjawabnya.

Reetesh Kumar

Ditulis oleh Reetesh Kumar

Kita belajar, Kita bertumbuh, Kita bersinar.

Tanggapan ( )

Bisakah Anda membantu menjelaskan integrasi front-end?
Bagaimana kita menghubungkan back-end ini dengan react front-end?

1

Comments

Popular posts from this blog

IT Dev

cara menginstal dan menggunakan npm dotenv