大模型增強(qiáng)
業(yè)務(wù)協(xié)作
行業(yè)解決方案
互聯(lián)網(wǎng) 平臺(tái)互聯(lián)網(wǎng) 垂直互聯(lián)網(wǎng)
企業(yè)服務(wù) 軟件與信息服務(wù)
汽車行業(yè) 汽車行業(yè)
物流快遞 物流快遞
地產(chǎn)家居 房地產(chǎn)行業(yè)
教育 教育行業(yè)
原創(chuàng)
2024/02/23 11:54:45
來源:天潤(rùn)融通
1877
本文摘要
我們一般探討智能對(duì)話,如智能客服、智能助手、無人駕駛、無人超市等。這類應(yīng)用程序中的“智能”不但是由機(jī)器學(xué)習(xí)方法來訓(xùn)練一個(gè)通用模型,并且大語(yǔ)言模型依據(jù)用戶輸入的文本形成回答,并且了解輸入的文本,如語(yǔ)義理解。在理解用戶輸入的文本之后,就需要將這些信息整合起來形成一個(gè)語(yǔ)義網(wǎng)絡(luò)。
我們一般探討智能對(duì)話,如智能客服、智能助手、無人駕駛、無人超市等。這類應(yīng)用程序中的“智能”不但是由機(jī)器學(xué)習(xí)方法來訓(xùn)練一個(gè)通用模型,并且大語(yǔ)言模型依據(jù)用戶輸入的文本形成回答,并且了解輸入的文本,如語(yǔ)義理解。在理解用戶輸入的文本之后,就需要將這些信息整合起來形成一個(gè)語(yǔ)義網(wǎng)絡(luò)。
知識(shí)圖譜是一種能夠敘述知識(shí)系統(tǒng)與信息中間關(guān)系的圖譜,根據(jù)繁雜的測(cè)算得到大量的數(shù)據(jù)。與傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)方法相比,可以更好的挖掘信息中包含的內(nèi)容。
發(fā)展歷程
知識(shí)圖譜可分為發(fā)覺、存儲(chǔ)和運(yùn)用階段。
發(fā)掘階段主要是通過挖掘大量文本中的信息來發(fā)現(xiàn)海量?jī)?nèi)容。
存儲(chǔ)和應(yīng)用階段主要是對(duì)已有的內(nèi)容進(jìn)行存儲(chǔ)和應(yīng)用,比如檢索、推薦、問答等。
知識(shí)圖譜從最早的結(jié)構(gòu)化數(shù)據(jù)開始,再到半結(jié)構(gòu)化數(shù)據(jù)再到現(xiàn)在的非結(jié)構(gòu)化數(shù)據(jù),經(jīng)歷了從簡(jiǎn)單到復(fù)雜的發(fā)展歷程。
概念與特點(diǎn)
知識(shí)圖譜是對(duì)現(xiàn)實(shí)世界中存有的實(shí)體和關(guān)聯(lián)性開展抽象表達(dá)、描述和推理的一種方法。它是一種基于圖結(jié)構(gòu)、圖論和數(shù)據(jù)庫(kù)管理的新式計(jì)算機(jī)應(yīng)用技術(shù),能夠?qū)崿F(xiàn)實(shí)體與實(shí)體中間關(guān)系的形式化表現(xiàn)。
它是一種以圖形結(jié)構(gòu)表明知識(shí)的方式,以圖形方式表明和存儲(chǔ)知識(shí)點(diǎn)與內(nèi)容間的關(guān)系。幫我們更好地機(jī)構(gòu)與理解,及其推理和運(yùn)用知識(shí)。它被應(yīng)用于許多領(lǐng)域,如智能助手、智能客服、智能家居等。
大語(yǔ)言模型知識(shí)圖譜特點(diǎn)主要在于理解和生成自然語(yǔ)言文本,基于深度神經(jīng)網(wǎng)絡(luò)技術(shù),對(duì)大規(guī)模文本數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),以實(shí)現(xiàn)對(duì)給定輸入文本的生成、分類、翻譯等任務(wù)。
實(shí)體抽取
實(shí)體抽取是知識(shí)圖譜中最重要的環(huán)節(jié),實(shí)體抽取的目的是從一段文本中提取出包含特定信息的實(shí)體。實(shí)體抽取的任務(wù)包括實(shí)體分類和關(guān)系分類。
實(shí)體分類可以使用條件隨機(jī),實(shí)體關(guān)系分類主要包括依存關(guān)系抽取、命名實(shí)體識(shí)別等。
依存關(guān)系抽取是將一段文本中的兩個(gè)詞進(jìn)行關(guān)聯(lián),可以提取出其中包含的相關(guān)信息。目前已經(jīng)有很多基于依存關(guān)系的方法在知識(shí)圖譜中進(jìn)行實(shí)體抽取。
關(guān)系抽取
知識(shí)地圖里的關(guān)系提取就是從知識(shí)圖譜中提取實(shí)體間的關(guān)系。比如,一個(gè)實(shí)體是“蘋果”,它對(duì)應(yīng)“水果”,水果對(duì)應(yīng)“蘋果”,這樣一個(gè)實(shí)體就能與其它實(shí)體有關(guān)。提取關(guān)系的目的是使關(guān)系敘述更準(zhǔn)確。
為了精確敘述知識(shí)圖譜中實(shí)體間的關(guān)系,我們應(yīng)該從知識(shí)庫(kù)中提取實(shí)體和關(guān)系的特點(diǎn)。我們可以使用已有的內(nèi)容來構(gòu)建特點(diǎn)關(guān)系,還可以通過機(jī)器學(xué)習(xí)方法來訓(xùn)練特點(diǎn)關(guān)系,或者利用設(shè)計(jì)算法來找到一些方法。
總結(jié)
知識(shí)圖譜適合于描述、推理和管理,以提升知識(shí)學(xué)習(xí)與應(yīng)用效率。我們應(yīng)該首先明確一些重要的界定,例如類型,哪些信息有意義,哪些沒有意義,使用一些已有的知識(shí)來構(gòu)建,并挑選及管理不同種類的知識(shí)。
專屬1v1客服
為您提供最全面的咨詢服務(wù)
掃碼立即咨詢