NVIDIA NeMo Retriever Bawa Teknologi AI Untuk Bisnis

NVIDIA NeMo Retriever

Jakarta, GayaTekno.id – NVIDIA mengumumkan layanan NVIDIA NeMo Retmikro AI generatif yang memungkinkan perusahaan untuk menghubungkan model bahasa besar khusus ke data perusahaan guna memberikan respons yang sangat akurat untuk aplikasi AI mereka.

NVIDIA NeMo Retriever merupakan bagian dari penawaran baru dalam rangkaian kerangka kerja dan alat NVIDIA NeMo untuk membangun, menyesuaikan, dan menerapkan model AI generatif membantu organisasi meningkatkan aplikasi AI generatif mereka dengan kemampuan retrieval-augmented generation (RAG) tingkat perusahaan.

Sebagai layanan mikro pengambilan semantik tingkat perusahaan, NeMo Retriever membantu aplikasi AI generatif memberikan respons yang lebih akurat melalui algoritma yang dioptimalkan NVIDIA.

Pengembang yang menggunakan layanan mikro dapat menghubungkan aplikasi AI mereka ke data bisnis di mana pun aplikasi tersebut berada di cloud dan pusat data.

Perusahaan juga menambahkan kemampuan RAG yang dioptimalkan NVIDIA ke pembuatan AI dan merupakan bagian dari platform perangkat lunak NVIDIA AI Enterprise, tersedia di AWS Marketplace.

Cadence, Dropbox, SAP, dan ServiceNow adalah beberapa pionir yang bekerja sama dengan NVIDIA untuk membangun kemampuan RAG siap produksi ke dalam aplikasi dan layanan AI generatif khusus mereka.

Aplikasi AI generatif dengan kemampuan RAG adalah aplikasi pembunuh perusahaan berikutnya, kata Jensen Huang, pendiri dan CEO NVIDIA. Dengan NVIDIA NeMo Retriever, pengembang dapat membuat chatbot, kopilot, dan alat ringkasan AI generatif khusus yang dapat mengakses data bisnis mereka untuk mentransformasikan produktivitas dengan kecerdasan AI generatif yang akurat dan berharga.

Sebagai contoh, perusahaan desain sistem elektronik Cadence melayani perusahaan-perusahaan di bidang komputasi hyperscale, komunikasi 5G, otomotif, seluler, ruang angkasa, konsumen, dan pasar layanan kesehatan.

Perusahaan ini bekerja sama dengan NVIDIA untuk mengembangkan fitur RAG untuk aplikasi AI generatif dalam desain industri elektronik.

“AI Generatif memperkenalkan pendekatan inovatif untuk memenuhi kebutuhan pelanggan, seperti alat untuk mengungkap potensi kelemahan di awal proses desain,” kata Anirudh Devgan, presiden dan CEO Cadence.

NVIDIA NeMo Retriever

Ia menambahkan, peneliti kami bekerja sama dengan NVIDIA untuk menggunakan NeMo Retriever guna lebih meningkatkan akurasi dan relevansi aplikasi AI generatif guna mengungkap masalah dan membantu pelanggan memasarkan produk berkualitas tinggi dengan lebih cepat.

Aplikasi AI Generatif Lebih Akurat

Tidak seperti toolkit RAG sumber terbuka, NeMo Retriever mendukung AI generatif siap produksi dengan model yang layak secara komersial, stabilitas API, patch keamanan, dan dukungan perusahaan.

Algoritma yang dioptimalkan NVIDIA memberikan hasil akurasi tertinggi pada model penyematan Retriever. Model penyematan yang dioptimalkan menangkap hubungan antar kata, memungkinkan LLM memproses dan menganalisis data tekstual.

Dengan menggunakan NeMo Retriever, perusahaan dapat menghubungkan LLM mereka ke berbagai sumber data dan basis pengetahuan, sehingga pengguna dapat dengan mudah berinteraksi dengan data dan menerima jawaban yang akurat dan terkini menggunakan perintah percakapan yang sederhana.

Bisnis yang menggunakan aplikasi yang didukung Retriever dapat memungkinkan pengguna mendapatkan akses aman ke informasi yang mencakup berbagai modalitas data, seperti teks, PDF, gambar, dan video.

Perusahaan dapat menggunakan NeMo Retriever untuk mencapai hasil yang lebih akurat dengan lebih sedikit pelatihan, mempercepat waktu pemasaran, dan mendukung efisiensi energi dalam pengembangan aplikasi AI generatif.

NVIDIA NeMo Retriever

Penerapan yang Andal, Sederhana, dan Aman dengan NVIDIA AI Enterprise
Perusahaan dapat menerapkan aplikasi yang didukung NeMo Retriever untuk dijalankan selama inferensi pada komputasi yang dipercepat NVIDIA di hampir semua pusat data atau cloud.

NVIDIA AI Enterprise mendukung inferensi yang dipercepat dan berkinerja tinggi dengan NVIDIA NeMo, NVIDIA Triton Inference Server, NVIDIA TensorRT, NVIDIA TensorRT-LLM, dan perangkat lunak NVIDIA AI lainnya.

Untuk memaksimalkan performa inferensi, pengembang dapat menjalankan model mereka pada NVIDIA GH200 Grace Hopper Superchips dengan perangkat lunak TensorRT-LLM.

Tivan Rahmat
The advance of technology is based on making it fit in so that you don't really even notice it, so it's part of everyday life