-
用戶隨口一句“講個刺激的歷史故事”,會不會觸發不當內容? -
AI從網上抓取(qu)的(de)信息,是否混進(jin)了賭博、色情或釣魚鏈接? -
聯網搜索功能(neng)加持下,用戶輸入是否(fou)會觸發對(dui)惡(e)意網站的直接調用?
-
一方面,為了保證用戶與(yu)模(mo)型(xing)交互過程(cheng)的(de)流暢性,一句話往(wang)(wang)(wang)往(wang)(wang)(wang)被拆成十幾段流式輸(shu)出(chu)(chu),傳統基于關鍵詞和(he)規則的(de)專(zhuan)家(jia)模(mo)型(xing),面對這類(lei)語(yu)義復雜、上(shang)下文強依(yi)賴的(de)模(mo)型(xing)輸(shu)出(chu)(chu)時,最終結(jie)果往(wang)(wang)(wang)往(wang)(wang)(wang)是“看(kan)得見(jian)字,但不懂意(yi)”; -
另一方面,如(ru)果(guo)全部依(yi)賴(lai)大模(mo)型審核,雖然理(li)解能力強(qiang),但因(yin)推理(li)耗(hao)時(shi)長且成本(ben)高,難以滿足車載場景對(dui)實時(shi)性的嚴苛要(yao)求;
-
所有輸入(ru)/輸出文本實時(shi)切片后,由(you)輕(qing)量級(ji)專家(jia)模型并行執行毫秒級(ji)初篩,快速(su)攔(lan)截明顯風險;
-
同(tong)時,重(zhong)新編排(pai)大(da)模型深度審核(he)鏈路,利(li)用多線程(cheng)智能化調度;
-
通(tong)過唯一(yi)標識關聯一(yi)次完整對話; -
安全護(hu)欄(lan)自動聚合同(tong)一會(hui)話中(zhong)的所有切片,進行(xing)跨(kua)片段語義理解; -
即使敏感內容分散在多輪輸出中(zhong),也(ye)能(neng)精(jing)準識別(bie)并(bing)攔(lan)截;
-
對所(suo)有聯網(wang)請求中的第三(san)方鏈接進行實時掃描(miao); -
精準識別色情信(xin)息、非法賭博(bo)、釣(diao)魚網站、虛(xu)假營銷等風險(xian)類型: -
一旦命中(zhong)高(gao)風險(xian)標簽(qian),立即終止(zhi)(zhi)任務,防止(zhi)(zhi)有害信息(xi)流入(ru)大模型。

