當(dāng)DeepSeek+RAG,分分鐘秒變“學(xué)霸”!你有沒有遇到被AI“坑”了的糟心事? 問AI“現(xiàn)在黃金多少錢一克?”,它卻引用了去年底的數(shù)據(jù),和今天的金店報(bào)價(jià)不一致...... 讓它推薦“周末親子游好去處”,結(jié)果推薦了幾個(gè)已經(jīng)取消兒童項(xiàng)目的景區(qū)...... 這不是AI不聰明,而是它只會(huì)“背書”!傳統(tǒng)大模型依賴訓(xùn)練時(shí)的舊數(shù)據(jù),而不會(huì)實(shí)時(shí)“查資料”。 而今天要介紹的RAG系統(tǒng),能讓AI不再靠死記硬背,而是像“學(xué)霸”一樣,先查資料再答題! 什么是RAG? RAG(Retrieval-Augmented Generation)檢索增強(qiáng)生成在2020年首次被提出,但其真正火起來也是自ChatGPT發(fā)布以后(2022年12月)才開始的。 ChatGPT給出了官方一些的說明,本質(zhì)上其給大模型帶來的價(jià)值可以粗略提煉為:沒有應(yīng)用RAG技術(shù)的大模型在回答問題時(shí)是閉卷考試,而應(yīng)用了RAG技術(shù)的大模型則是——通過外掛了一個(gè)知識(shí)庫來實(shí)現(xiàn)開卷考試。 目前大模型在生成回答時(shí)有3大問題:容易出現(xiàn)幻覺、缺乏專業(yè)知識(shí)、回答缺乏可解釋性,而RAG技術(shù)通過外掛專業(yè)的知識(shí)庫、在生成答案時(shí)結(jié)合知識(shí)庫回答問題、同時(shí)在最終生成結(jié)果中展示知識(shí)庫信息來源,一定程度上有效地解決了這3大問題。 那么,RAG是怎樣解決上面這3大問題的呢? 首先我們來看一下RAG的流程架構(gòu): 上述架構(gòu)簡單理解就是下面這樣一個(gè)步驟: 第一步:建“圖書館”(索引階段): 把海量信息(合同、論文、報(bào)告等)切成“知識(shí)卡片”。 用AI給每張卡片貼上“智能標(biāo)簽”(向量化),存進(jìn)“智能知識(shí)庫”。 第二步:快速找答案(查詢階段): 你提問時(shí),AI助理就用“關(guān)鍵詞+語義”搜索,快速找到最相關(guān)卡片。 舉個(gè)例子 用戶提問:“德陽發(fā)展杯最低需要幾人組隊(duì)報(bào)名” 傳統(tǒng)AI回答:“為了獲得準(zhǔn)確的信息,建議您直接查看賽事官方發(fā)布的報(bào)名須知或競(jìng)賽規(guī)程,或者聯(lián)系賽事主辦方進(jìn)行確認(rèn)。一般來說,團(tuán)隊(duì)項(xiàng)目的最低人數(shù)可能是 3人、5人或更多,具體取決于比賽的性質(zhì)(如籃球、足球、排球等)。 AI的訓(xùn)練數(shù)據(jù)里面并不會(huì)有這樣特定數(shù)據(jù),例如特定的企事業(yè)單位或組織的內(nèi)部制度、活動(dòng)安排等,因此回答會(huì)比較泛。 有了RAG系統(tǒng):立刻查閱相關(guān)知識(shí)庫文檔,然后精準(zhǔn)回答需要8人,并給到引用材料。 有了知識(shí)庫,AI就會(huì)從知識(shí)庫中找到相關(guān)的描述,并根據(jù)知識(shí)庫中的數(shù)據(jù)返回給用戶相對(duì)更準(zhǔn)確的回答。 RAG可以給企業(yè)帶來哪些幫助? 目前,AI在企業(yè)應(yīng)用的幾大經(jīng)典場(chǎng)景分別是智能助手、智能客服、內(nèi)容創(chuàng)作,這些場(chǎng)景無一例外都應(yīng)用到了知識(shí)庫和RAG技術(shù)。 以下就是不少企業(yè)利用RAG技術(shù)的一些經(jīng)典場(chǎng)景~ 專業(yè)問答 在醫(yī)療、金融、法律等領(lǐng)域,RAG系統(tǒng)可以回答各種專業(yè)問題,提供準(zhǔn)確的信息。例如,在醫(yī)療領(lǐng)域,RAG系統(tǒng)可以根據(jù)用戶的癥狀描述,從醫(yī)學(xué)期刊、官方指南等數(shù)據(jù)源中檢索相關(guān)信息,為用戶提供疾病預(yù)防、治療方案等方面的建議。 智能客服 企業(yè)可以利用RAG技術(shù)構(gòu)建智能客服系統(tǒng),快速響應(yīng)客戶咨詢,提高服務(wù)效率和質(zhì)量。例如,電商平臺(tái)可以使用RAG技術(shù),從商品詳情、用戶評(píng)價(jià)等多源信息中抽取相關(guān)段落,輔助生成準(zhǔn)確的答案。 內(nèi)容創(chuàng)作 RAG系統(tǒng)可以自動(dòng)生成新聞報(bào)道、研究報(bào)告、技術(shù)文檔等內(nèi)容,節(jié)省人力成本。例如,新聞機(jī)構(gòu)可以利用RAG技術(shù),從大量的新聞報(bào)道、社交媒體內(nèi)容等數(shù)據(jù)源中檢索相關(guān)信息,幫助記者快速了解背景知識(shí),撰寫更全面、深入的報(bào)道。 文檔摘要 對(duì)于長篇文檔,RAG系統(tǒng)可以自動(dòng)提取關(guān)鍵內(nèi)容和要點(diǎn),生成簡潔明了的摘要。這有助于用戶快速了解文檔的核心內(nèi)容,提高工作效率。 智能助手 RAG系統(tǒng)可以作為手機(jī)語音助手、智能音箱等設(shè)備的后端支持,理解用戶指令并提供相關(guān)信息或執(zhí)行任務(wù)。例如,智能音箱可以使用RAG技術(shù),根據(jù)用戶的語音指令,從網(wǎng)絡(luò)上檢索音樂、新聞等內(nèi)容并播放。 知識(shí)圖譜填充 RAG系統(tǒng)可以識(shí)別和添加新的知識(shí)點(diǎn),完善知識(shí)圖譜的實(shí)體關(guān)系。這對(duì)于構(gòu)建大規(guī)模知識(shí)圖譜、提高信息檢索和推理能力具有重要意義。 企業(yè)為什么選DeepSeek+RAG 由于DeepSeek的開源,讓現(xiàn)在不少企業(yè)都渴望快速部署一套本地化的大模型來解決日常一些個(gè)性化或流程化的需求,但是在實(shí)際操作過程中會(huì)發(fā)現(xiàn),僅僅部署一套大模型還遠(yuǎn)遠(yuǎn)不夠,還需要在此基礎(chǔ)上做一系列的開發(fā)。 目前主流開發(fā)為:大模型微調(diào)、大模型+RAG。但由于大模型微調(diào)技術(shù)要求較高,且存在成本投入,因此當(dāng)下,大模型+RAG技術(shù)的運(yùn)用越來越受到不少企業(yè)的青睞。 這套組合拳有哪些好處呢? 知識(shí)不過期:實(shí)時(shí)查資料,回答不再“跟不上時(shí)代”。 回復(fù)有出處:告別“幻覺胡說”,確保內(nèi)容權(quán)威、可信。 各行各業(yè)都能用:醫(yī)療、教育、法律、金融、政務(wù)……統(tǒng)統(tǒng)適配! 企業(yè)級(jí)安全保障:支持本地化部署,數(shù)據(jù)安全可控,適合金融、醫(yī)療等對(duì)安全有要求的領(lǐng)域。 全自動(dòng)流程:無需懂技術(shù),小白也能輕松上手。從文檔處理到生成答案,全流程自動(dòng)化。 降低人力成本:報(bào)告自動(dòng)生成、客服自動(dòng)應(yīng)答,人力成本大幅縮減。 看完今天這篇文章,是不是對(duì)RAG技術(shù)有了更深入的了解,如果你覺得有用,請(qǐng)給這篇文章”點(diǎn)贊“”收藏“”轉(zhuǎn)發(fā)“。 |