Pemanggilan Tool

Sekarang setelah Anda memahami cara kerja konteks, mari kita lihat bagaimana model AI dapat melakukan lebih dari sekadar merespons teks—itulah yang disebut pemanggilan tool.

Ingat saat kita membandingkan model AI dengan endpoint API? Nah, pemanggilan tool itu seperti memberi API tersebut kemampuan untuk memanggil API lain saat dibutuhkan.

Izinkan saya memberi analogi. Bayangkan Anda membantu seorang teman memasak makan malam lewat telepon. Tanpa melihat dapur mereka, Anda hanya bisa memberikan panduan umum.

Sekarang bayangkan jika teman Anda mengirim foto isi kulkas, atau memberi tahu suhu persis oven mereka. Tiba-tiba saran Anda menjadi jauh lebih berguna dan spesifik.

Cara kerja pemanggilan alat

Saat pengembang membangun aplikasi AI, mereka dapat mendefinisikan “alat” tertentu yang dapat digunakan model. Alat-alat ini seperti kemampuan khusus yang dapat dipanggil model saat dibutuhkan.

Anda mungkin sudah pernah menggunakan pemanggilan alat tanpa menyadarinya! Saat Anda meminta ChatGPT untuk mencari informasi terkini, atau saat OpenCode membaca file di codebase Anda—itulah pemanggilan alat yang sedang bekerja.

Berikut yang terjadi di balik layar:

Model AI menerima permintaan Anda dan menyadari perlu kemampuan tambahan
Model memformat respons khusus dalam JSON yang menentukan alat mana yang dipanggil dan dengan parameter apa
Aplikasi menjalankan alat tersebut dan mengembalikan hasilnya
Model AI memasukkan hasil tersebut ke dalam konteksnya dan melanjutkan percakapan

Mengapa tools penting untuk coding

Untuk membangun software, tools sangat kuat karena memungkinkan model AI untuk:

Membaca dan menulis file di codebase Anda
Mencari di kode untuk menemukan fungsi atau pola yang relevan
Menjalankan perintah shell untuk menguji kode atau menginstal paket
Mengakses dokumentasi atau menelusuri web untuk informasi terbaru
Memeriksa error dengan menjalankan linter atau test

Tanpa tools, model AI hanya terbatas pada informasi yang Anda berikan secara eksplisit dalam konteks.

Apa saja yang ada di dalam pemanggilan alat?

Setiap alat memiliki tiga komponen utama:

Nama seperti read_file atau search_web
Deskripsi yang memberi tahu model kapan dan bagaimana menggunakan alat
Parameter yang merupakan input yang diperlukan agar alat dapat bekerja

Berikut adalah contoh seperti apa definisi alat:

{
  "name": "read_file",
  "description": "Read the contents of a file from the codebase",
  "parameters": {
    "filepath": "The path to the file to read"
  }
}

Saat model AI ingin menggunakan alat ini, model akan menghasilkan respons seperti:

{
  "tool": "read_file",
  "parameters": {
    "filepath": "src/components/Button.tsx"
  }
}

Aplikasi kemudian membaca file tersebut dan menambahkan isinya ke konteks percakapan, sehingga model dapat menggunakannya dalam responsnya.

Biaya alat

Ingat saat kita membahas token dan harga? Pemanggilan alat mengonsumsi token dengan dua cara:

Definisi alat disertakan dalam konteks input (biasanya beberapa ratus token per alat)
Hasil alat ditambahkan ke konteks output (bervariasi tergantung apa yang dikembalikan alat)

Artinya, percakapan dengan banyak penggunaan alat akan lebih cepat memenuhi jendela konteks dan berbayar lebih banyak.

Melampaui tool bawaan

Baru-baru ini, sebuah standar baru bernama MCP (Model Context Protocol) dibuat. Anggap ini sebagai cara standar agar tools pihak ketiga dapat terhubung ke model AI apa pun.

Sama seperti USB yang menjadi standar untuk menghubungkan perangkat ke komputer, MCP bertujuan menjadi standar untuk menghubungkan alat ke model AI.

Misalnya, Anda dapat menggunakan MCP untuk terhubung ke Figma untuk file desain, Linear untuk melihat tiket, atau database Anda untuk mengkueri data secara langsung.

Sekarang setelah Anda memahami pemanggilan tool, mari kita lihat apa yang terjadi ketika kita membicarakan sistem yang menggunakan alat-alat ini dalam loop—itulah yang disebut agen.