應用應用強大的生成式 AI 需考量的四大重點

Paul Done and Steve Jurczak

現今人工智慧以前所未有的速度快速發展,而生成式 AI 就站在這股風潮的浪頭上。生成式 AI 能力可以應用的範圍非常廣泛,從文本生成到音樂和藝術創作。但生成式 AI 之所以與眾不同,是因為可以深度解讀文本,產出與人類所寫的文本相似的結果。這不只可以用在智慧聊天機器人上,生成式 AI 擁有的潛力足以撼動產業,提供更豐富的使用者體驗,開啟多樣的可能性。

在未來幾個月和幾年的時間,我們將會看到越來越多使用生成式 AI 的應用程式,展現過去未曾見過的能力。不像現在熱門的聊天機器人 ChatGPT,使用者可能根本不會發現自己互動的對象是生成式 AI。生成式 AI 隱身在這些新式應用程式的背後,進行資訊檢索和文本生成,即時提供真正量身定做和符合情境的使用者經驗,這個流程稱為檢索增強生成(RAG)。

那麼檢索增強生成(RAG)是怎麼運作的呢?資料庫在過程中扮演的角色是什麼?跟我們一起探索生成式 AI 的世界以及它對資料庫的要求吧!

造訪我們的 AI 資源頁面,進一步了解如何使用 MongoDB 建立 AI 驅動應用程式。

訓練 AI 基礎模型的挑戰

無法存取私人或專屬資料是生成式 AI 目前面臨的主要挑戰之一。AI 基礎模型中,像是大型語言模型(LLM)就是其中的子集,通常是使用公開資料訓練,沒有辦法取用機密或是專屬資訊。就算是放在公開主機的,通常也是過時和不相關的資料。而且 LLM 在辨識非常近期發生的事件或知識上也有所限制。另外沒有經過適當的指引,LLM 有可能會產出錯誤的資訊,這在許多情境下都是無法允許的。

資料庫在解決這些挑戰上,扮演了非常重要的角色。應用程式可以直接使用資料庫,檢索相關資料,並把內容以文本的方式放入指令之中,而非直接傳送指令到 LLM。像是金融應用程式可以先在傳統資料庫中,查詢使用者的交易資料,接著把內容加入指令中,再把調整過後的指令傳到 LLM。這個方法可以確保 LLM 生成正確且最新的回應,避免資料缺失、資料過時和資料錯誤所造成的問題。

為生成式 AI 應用程式選擇資料庫的四大考量

現今每個人都能存取同樣的工具及知識庫,因此對公司來說要透過生成式 AI 取得競爭優勢,不是一件容易的事。但是可以創造出差異化的關鍵就在於企業 獨有的專屬資料,將之分層放入由基礎模型和 LLM 支援的生成式 AI 之上。想要完全實現生成式 AI 強化應用程式潛力的組織,在選擇資料庫上有四點需要考量的面向:

  1. 可查詢性:資料庫必須有能力支援豐富且具表達性的查詢及二級索引,進而即時提供情境感知的使用者經驗。不論查詢的複雜性高低,或是存在資料庫中的資料大小,這項能力能確保可以在毫秒內檢索資料。

  2. 具彈性的資料模型:生成式 AI 應用程式通常需要不同類型和格式的資料,也就是多模態資料。為了適應資料集的變化,資料庫需要具備彈性的資料模型,才能輕鬆導入新資料,不需要改變資料表結構 、修改編碼或發行新版本。對關聯式 資料庫來說,多模態資料是一種挑戰,因為這種資料庫是為處理結構化資料而設計,會將資訊整理為以欄列表示的表格,並有著嚴格的資料表結構的 規則。

  3. 整合式向量搜尋:生成式應用程式需要針對不同類型的資料,像是無特定結構的文本、音檔或圖像,進行語意或相似性查詢。向量資料庫中的向量嵌入使得系統能進行語意或相似性查詢,向量嵌入捕捉資料中的語意及文本資訊,因此適合用於各種任務,例如文本分類、機器翻譯和情感分析。資料庫應該要提供整合向量搜尋索引編輯的功能,以避免需要使用兩個不同系統來同步資料的複雜性,並且確保開發人員使用統一的查詢語言。

  4. 可擴展性:隨著生成式 AI 應用程式使用者數量及資料規模不斷成長,資料庫需要持續進行擴展,以支援持續增加的資料量及請求率。資料庫可以支援擴展分片,就能確保容量限制不會成為公司發展的絆腳石。

最理想的資料庫解決方案:MongoDB Atlas

在處理生成式 AI 獨特的要求上,MongoDB Atlas 是非常強大且用途廣泛的平台。MongoDB 使用強大的查詢 API,可以輕鬆操作多模態資料,開發人員在過程中不需要寫這麼多的編碼。MongoDB 是最受開發人員歡迎的文件資料庫,操作文件對開發人員來說非常簡單直覺,因為文件可以比對物件導向程式中的物件,比關聯式資料庫中無限的欄列表格更讓人駕輕就熟。具彈性的資料表結構 設計可幫助資料模型持續演化,滿足本質上多模態的生成式 AI 案例 的需求。Atlas 透過使用分片進行擴展,支援大量增加的資料以及來自生成式 AI 應用程式的請求。

MongoDB Atlas Vector Search 直接嵌入了向量搜尋索引編輯,因此不需要維護兩個不同的系統。Atlas 透過來源資料,隨時更新 Vector Search 的索引。開發人員可以使用單一端點和查詢語言,建立結合一般資料庫查詢篩選和向量搜尋篩選的查詢。可避免在使用上造成適應問題,為開發人員提供快速原型化並產出生成式 AI 解決方案的環境。

結論

生成式 AI 已經準備好重塑產業,為各大公司部門提供創新解決方案。有了適合的資料庫解決方案,生成式 AI 應用程式就能蓬勃發展,提供正確、情境感知並應用動態資料驅動的使用者體驗,滿足現今變化快速的數位環境成長所需。有了 MongoDB Atlas,組織就能提升敏捷度、生產力和成長,在這個快速演化的生成式 AI 世界裡擁有競爭力。

進一步了解 Atlas 如何幫助組織整合並操作生成式 AI 和 LLM 資料,下載我們的白皮書 運用 MongoDB 將生成式 AI 及進階搜尋嵌入你的應用程式。若你想在自家組織內應用生成式 AI,歡迎馬上與我們聯繫,了解我們可以如何協助你進行數位轉型。