Betaworks bertaruh pada agen AI dalam kohort ‘Camp’ terbaru

Betaworks merangkul tren AI bukan dengan LLM baru lagi, melainkan sekelompok model agen yang mengotomatisasi tugas sehari-hari yang tidak begitu mudah didefinisikan. Inkubator terbaru investor, "Camp", melatih dan mendanai sembilan startup agen AI yang mereka harap akan mengambil alih tugas-tugas yang membosankan hari ini.

Kasus penggunaan untuk banyak perusahaan ini terdengar menjanjikan, tetapi AI cenderung kesulitan menepati janjinya. Apakah Anda akan percaya pada AI baru yang bersinar untuk menyortir email Anda? Bagaimana dengan mengekstrak dan menstruktur informasi dari halaman web? Apakah ada yang keberatan dengan AI yang membuat jadwal pertemuan di mana saja?

Ada elemen kepercayaan yang belum didirikan dengan layanan-layanan ini, sesuatu yang terjadi dengan sebagian besar teknologi yang mengubah cara kita bertindak. Meminta petunjuk dari MapQuest terasa aneh sampai tidak — dan sekarang navigasi GPS adalah alat sehari-hari. Tetapi apakah agen AI sudah mencapai tahap tersebut? CEO dan pendiri Betaworks, John Borthwick, berpikir demikian. (Pengungkapan: Editor TechCrunch sebelumnya dan tuan rumah Disrupt, Jordan Crook, meninggalkan TC untuk bekerja di perusahaan itu.)

“Anda mengeksploitasi sesuatu yang sudah kami pikirkan dengan waktu yang lama,” kata Borthwick kepada TechCrunch. “Meskipun agen AI masih dalam masa nascence-nya — dan ada isu-isu yang terjadi seputar tingkat keberhasilan agen, dll. — kami melihat kemajuan yang luar biasa bahkan sejak Camp dimulai.”

Sementara teknologi akan terus meningkat, Bortwick menjelaskan bahwa sebagian pelanggan siap untuk merangkulnya dalam keadaan ini.

“Secara historis, kami melihat pelanggan melakukan lompatan kepercayaan, bahkan dengan tugas-tugas yang lebih berisiko, jika produk itu ‘cukup baik.’ Bill.com asli, meskipun melakukan hal-hal menarik dengan OCR dan email scraping, tidak selalu mendapat hasil yang benar, dan pengguna masih mempercayainya dengan transaksi senilai ribuan dolar karena membuat tugas yang mengerikan menjadi sedikit lebih baik. Dan dari waktu ke waktu, melalui desain antarmuka yang sangat komunikatif, loop umpan balik dari pelanggan-pelanggan tersebut menciptakan produk yang lebih baik, lebih dapat diandalkan,” katanya.

“Untuk saat ini, sebagian besar pengguna awal produk di Camp adalah pengembang dan pendiri serta pengguna teknologi awal, dan kelompok tersebut selalu bersedia untuk menguji dengan sabar dan memberikan umpan balik terhadap produk-produk ini, yang akhirnya akan melompat ke pengguna mainstream.”

Betaworks bertaruh besar pada AI augmentatif dalam kohort camp terbaru: ‘Kami sangat tertarik’

Betaworks Camp adalah akselerator selama tiga bulan di mana perusahaan yang dipilih dalam tema yang dipilih mendapat bantuan langsung dengan produk, strategi, dan koneksi mereka sebelum dikirim keluar dengan cek sebesar $500.000 — berkat Betaworks sendiri, Mozilla Ventures, Differential Ventures, dan Stem AI. Tapi bukan sebelum startup-startup itu memamerkan kemampuannya pada hari demo, 7 Mei.

Kami telah melihat daftar sebelumnya. Berikut adalah tiga hal yang paling menarik bagi saya.

Twin mengotomatisasi tugas-tugas dengan menggunakan “model aksi” yang telah dibicarakan oleh Rabbit selama beberapa bulan terakhir (tetapi belum diluncurkan). Dengan melatih model pada banyak data yang mewakili antarmuka perangkat lunak, ia dapat (perusahaan-perusahaan ini mengklaim) mempelajari cara menyelesaikan tugas-tugas umum, hal-hal yang lebih kompleks daripada yang dapat ditangani oleh API, namun tidak begitu sulit sehingga tidak bisa didelegasikan kepada “magang pintar”. Kami sebenarnya menulis tentang mereka pada bulan Januari.

Kredit Gambar: Twin

Jadi daripada meminta seorang insinyur back-end untuk membangun skrip kustom untuk melakukan tugas tertentu, Anda dapat menunjukkannya atau menggambarkannya dengan bahasa biasa. Hal-hal seperti “letakkan semua resume yang kami terima hari ini di folder di Dropbox dan beri nama setelah pelamar, lalu kirimi saya tautan berbagi melalui DM di Slack.” Dan setelah Anda menyesuaikan alur kerja itu (“Ups, kali ini tambahkan tanggal aplikasi ke nama file”), itu bisa menjadi cara baru kerja proses itu. Tujuan perusahaan adalah mengotomatisasi 20% tugas-tugas yang memakan 80% waktu kita — apakah itu bisa dilakukan secara terjangkau mungkin adalah pertanyaan yang sebenarnya. (Twin menolak untuk menjelaskan tentang sifat model dan proses pelatihannya.)

Skej bertujuan untuk memperbaiki proses kadang-kadang menyakitkan dari menemukan waktu pertemuan yang cocok untuk dua (atau tiga, atau empat…) orang. Anda hanya perlu cc bot di email atau benang Slack dan itu akan memulai proses merapatkan ketersediaan dan preferensi semua orang. Jika memiliki akses ke jadwal, itu akan memeriksanya; jika seseorang mengatakan bahwa mereka lebih suka sore jika itu hari Kamis, itu akan bekerja dengan itu; Anda bisa mengatakan beberapa orang mendapat prioritas; dan sebagainya. Siapa pun yang bekerja dengan asisten eksekutif terampil tahu bahwa mereka tidak tergantikan, tetapi kemungkinan setiap EA di luar sana lebih suka menghabiskan lebih sedikit waktu untuk tugas-tugas yang hanya beberapa “Bagaimana dengan ini? Tidak? Bagaimana dengan ini?"

Kredit Gambar: Skej

Sebagai seorang misantropis, saya tidak punya masalah jadwal ini, tetapi saya menghargai bahwa yang lain mengalami masalah ini, dan juga akan memilih solusi tipe “atur dan lupakan” di mana mereka hanya merestui dengan hasilnya. Dan itu sangat barangkali bagi agen AI saat ini, yang pada dasarnya akan diberi tugas untuk memahami bahasa alami daripada formulir.

Jsonify adalah evolusi scraper situs web yang dapat mengekstrak data dari konteks yang relatif tidak terstruktur. Ini telah dilakukan selama berabad-abad, tetapi mesin yang mengekstrak info itu tidak pernah terlalu pintar. Jika dokumennya besar dan datar mereka baik-baik saja — jika di dalam tab di situs atau daftar visual yang buruk menyerupai manusia untuk mengeklik sekitar, mereka dapat gagal. Jsonify menggunakan pemahaman yang diperbarui dari model AI visual hari ini untuk lebih memecah dan mengurutkan data yang mungkin tidak dapat diakses oleh crawler sederhana.

Kredit Gambar: Jsonify

Jadi Anda dapat mencari opsi Airbnb di daerah tertentu, lalu memiliki Jsonify Dump semuanya ke dalam daftar terstruktur dengan kolom untuk harga, jarak dari bandara, peringkat, biaya tersembunyi, dll. Kemudian Anda dapat pergi melakukan hal yang sama di Vacasa dan mengekstrak data yang sama — mungkin untuk tempat yang sama (saya melakukan ini dan menghemat sekitar $150 hari itu, tetapi saya berharap bisa mengotomatisasi prosesnya). Atau, Anda tahu, lakukan hal profesional.

Tetapi tidakkah ketidaktepatan yang melekat pada LLM membuatnya menjadi alat yang meragukan untuk pekerjaan ini? “Kami telah berhasil membangun sistem pagar dan pengecekan yang cukup kuat,” kata pendiri Paul Hunkin. “Kami menggunakan beberapa model berbeda pada saat runtime untuk memahami halaman tersebut, yang memberikan beberapa validasi — dan LLM yang kami gunakan sudah disesuaikan dengan kasus penggunaan kami, jadi biasanya cukup dapat diandalkan bahkan tanpa lapisan pagar. Biasanya kami melihat akurasi ekstraksi 95%+, tergantung pada kasus penggunaannya.”

Saya bisa melihat salah satu dari ini berguna pada mungkin perusahaan teknologi maju apa pun. Orang lain dalam kohort memiliki teknis atau situasional yang sedikit lebih rumit — berikut enam sisanya:

  • Resolvd AI – otomatisasi agen dari aliran kerja cloud. Terasa berguna sampai integrasi khusus mengejarnya.
  • Floode – pembajak kotak masuk AI yang membaca email Anda dan menemukan hal penting sambil menyiapkan respons dan tindakan yang sesuai.
  • Extensible AI – AI Anda mundur? Tanyakan kepada dokter Anda jika Extensible adalah infrastruktur uji coba dan logging yang tepat untuk penerapan Anda.
  • Opponent – karakter virtual yang ditujukan untuk anak-anak agar dapat berinteraksi dan bermain secara ekstensif. Terasa seperti ranjau etika dan hukum tetapi seseorang harus melaluinya.
  • High Dimensional Research – bermain infra. Sebuah kerangka kerja untuk agen AI berbasis web dengan model berbayar jalan-jalan jadi jika eksperimen perusahaan Anda gagal, Anda hanya memerlukan beberapa dolar.
  • Mbodi – AI generatif untuk robotika, sebuah bidang di mana data pelatihan relatif langka. Saya pikir ini adalah kata Afrika tapi itu hanya berarti “ditopang.”

Tidak diragukan lagi agen AI akan memainkan peran dalam aliran kerja perangkat lunak yang semakin terotomatisasi di masa depan, tetapi sifat dan luasnya peran tersebut masih belum tertulis. Jelas Betaworks bertujuan untuk menyelipkan kaki mereka sejak dini meskipun beberapa produk belum sepenuhnya siap untuk debut pasar massal mereka belum.

Anda akan dapat melihat perusahaan-perusahaan tersebut memamerkan barang dagang agen mengecil pada 7 Mei.

Koreksi: Cerita ini diperbarui untuk mencerminkan bahwa pendiri Jsonify adalah Paul Hunkin, bukan Ananth Manivannan.