監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關閉

網(wǎng)絡信息獲取的應用 提高信息獲取的質量

申請免費試用、咨詢電話:400-8352-114

來源:泛普軟件 網(wǎng)絡信息獲取的應用 提高信息獲取的質量

一、高質量信息獲取的背景

互聯(lián)網(wǎng)的發(fā)展,給人們帶來了各個領域、形式多樣的數(shù)字化媒體信息,對這些信息進行有效獲取和使用,將促進人們的學習和工作效率。隨著互聯(lián)網(wǎng)的進一步發(fā)展,各種基于互聯(lián)網(wǎng)的應用也會逐漸產(chǎn)生,大量應用在本質上可以抽象為信息的有效獲取和使用,當信息從發(fā)送者傳遞到需求者的手中時,價值將隨之產(chǎn)生,應用將隨之形成。因此,信息的個性化服務,即如何將信息傳遞到真正需要這些信息的用戶手中,成為互聯(lián)網(wǎng)應用的基礎性研究。

為幫助用戶獲取信息,首先產(chǎn)生了信息獲取的研究,它可以讓用戶根據(jù)自己的信息需求,方便地找到在信息內容上與之匹配的網(wǎng)絡信息資源,例如數(shù)據(jù)庫的網(wǎng)絡檢索系統(tǒng)、網(wǎng)絡目錄、網(wǎng)絡搜索引擎等。用戶每次進行信息獲取時,都要明確地表達自己的需要,通常通過關鍵詞組合。這種方式存在如下不足:一方面,用戶有時難以找到合適的關鍵詞表達自己的需要,另一方面,隨著網(wǎng)絡信息資源的日益膨脹,檢索結果中存在越來越多的非相關信息,信息獲取的精度不足。

信息獲取主要關注用戶的短期信息需求,為提高使用的方便性和信息獲取的質量,就要關注用戶的長線信息需求,因此出現(xiàn)了對信息過濾技術的研究,信息過濾技術假設用戶的興趣將維持一段時間基本不變,利用有關用戶興趣的知識,建立用戶的模型,從大量的動態(tài)信息流中,根據(jù)用戶模型找出用戶感興趣的信息。

通常,我們會將經(jīng)由信息過濾形成的結果主動推薦到用戶手中,從而形成了個性化主動信息推薦,目前主要基于信息Agent進行。通過信息推薦技術,計算機以人為中心,主動向用戶推薦信息,滿足用戶的信息需求,這將節(jié)省用戶的時間,提高其學習和工作效率。

通過信息推薦,各種網(wǎng)絡應用可以將相關的信息主動推薦到需要該信息的用戶手中,這一方面實現(xiàn)了應用的價值,另一方面也提高了用戶的工作與生活質量。例如企業(yè)競爭情報信息的獲取、名人資訊獲取、學術研究資料的獲取。高質量的信息獲取將成為高質量網(wǎng)絡應用的基礎,這既是網(wǎng)絡應用提供者的需要,也是網(wǎng)絡用戶的需要。

二、高質量信息獲取的含義

高質量信息獲取通常包括如下含義:

1、信息要準確:信息推薦系統(tǒng)提供的信息要盡可能地滿足用戶的需求,這就需要對用戶需求的準確把握、對信息內容的準確把握、對信息內容和用戶需求之間相關性的準確把握;

2、信息要及時:網(wǎng)絡的開放式環(huán)境決定了網(wǎng)絡上的信息隨時都在變化,一方面,不斷有新的信息出現(xiàn);另一方面,原有的信息隨時都可能成為過時的信息,因此推薦系統(tǒng)要及時提供用戶關注的信息;

3、用戶為中心:信息推薦系統(tǒng)要以用戶為中心進行服務,這就要方便用戶的使用,例如,系統(tǒng)主動將信息推薦給用戶;用戶可以方便地表達自己的需求;系統(tǒng)要及時適應用戶需求的變化。

三、高質量信息獲取的相關技術

在信息獲取領域,有兩類研究方向:基于內容的信息獲取和基于合作的信息獲取。基于內容的信息獲取通過分析資源的內容建立資源的特征向量,根據(jù)其與用戶需求的相關性,決定是否將該資源推薦給用戶。合作信息獲取基于網(wǎng)上不同用戶之間的相似性進行信息推薦,例如用戶x和用戶y有相似的信息需求,將用戶x感興趣的信息資源推薦給用戶y將比較自然。下面對這兩類信息獲取技術的研究現(xiàn)狀進行簡介。

1、基于內容分析的信息獲取

在基于內容分析的信息獲取中,為判斷用戶是否喜歡某個信息資源,首先需要建立資源的特征向量,通常采用TFIDF (Term Frequency Inverse Document Frequency)方法生成加權關鍵詞向量。目前,有兩種常用的方法來預測用戶是否喜歡某個資源:

1) 關鍵詞匹配法。用戶需求通過加權關鍵詞向量表達,在預測用戶對新資源是否感興趣時,通過計算兩個關鍵詞向量的相似度進行,也稱為矢量相似度法或矢量夾角的余弦值;

2) 向量空間法。通過用戶評價過的資源集來描述用戶的興趣。當要預測用戶對新資源是否感興趣時,需要將資源轉化為向量,在向量空間內進行分類計算(分為用戶感興趣的資源和不感興趣的資源)。這種方法計算量大,但準確率高,一般需要離線進行。

基于內容分析的信息獲取技術通常存在如下障礙:

1) 基于目前的技術,我們對信息資源只有有限的特征提取能力,通常只能對文本內容進行比較簡單的特征提取,在很多領域,目前還沒有有效的特征提取方法,如:圖像、視頻、音樂等;

2) 用戶喜歡一個事物的原因各種各樣,例如對一幅畫,用戶可能由于不同的原因喜歡它,例如“畫中有太陽”、“畫中有大?!?、“畫中是傍晚的景色”、“畫是宋朝的”等等,這種復雜性和多樣性,使得我們難以建立統(tǒng)一的用戶模型及資源模型;

3) 有些需求難以對計算機精確地描述清楚,例如需要的文章的質量、風格或者觀點;

4) 有時用戶雖然明白自己喜歡什么,但是難以清楚地表達自己具體需要什么。

以上障礙影響了信息獲取的質量,為提高獲取質量,我們一方面可以采用新的算法,另一方面,合作信息獲取也有助于解決這些問題。

2、基于合作的信息獲取

人工智能主要通過計算機來模擬人的智能,在機器智能的發(fā)展過程中,我們取得了非常豐碩的成果,但是,人們也發(fā)現(xiàn)其存在固有的缺點,例如難以把握用戶的需求、缺乏聯(lián)想能力和創(chuàng)新性等,機器智能在很多領域難以超越人的智能。基于內容的信息獲取相當于純粹的機器智能。網(wǎng)絡的發(fā)展,使得計算機可以通過網(wǎng)絡相互連接,它們之間的合作將形成多機合作智能。同時計算機的背后是作為用戶的人,計算機的互聯(lián)也體現(xiàn)為人與人之間的互聯(lián),這種互聯(lián)為我們提供了挖掘人的智能的環(huán)境,并將使計算機活起來,此時的智能可能不僅是機器智能,其中大量融合了人的智能,“人工智能”與“真人智能”將全面融合。這種合作智能在信息獲取中的應用,就形成了合作信息獲取。

四、高質量信息獲取的商業(yè)意義

第十一次CNNIC調查結果顯示,就網(wǎng)民上網(wǎng)目的來看,獲取信息是第一位的,53.1%的人將其作為上網(wǎng)最主要的目的。其次是休閑娛樂(24.6%),交友排在第三位(7%)。獲取信息仍然是網(wǎng)民上網(wǎng)最主要的目的。

根據(jù)互聯(lián)網(wǎng)實驗室的一份研究報告,11.5%的網(wǎng)民使用過付費網(wǎng)絡服務(這里所指的付費網(wǎng)絡服務是指除去在線購買書籍、光盤等實物產(chǎn)品之外的服務類網(wǎng)絡消費項目),略高于10.3%的網(wǎng)上購物比例。這表明付費網(wǎng)絡服務已經(jīng)在中國啟動。其中,電子郵箱以54.3%的絕對優(yōu)勢排名第一,網(wǎng)上游戲28.3%排名第二。有償信息獲取的比例幾乎可以被忽略。

這就存在一個巨大反差,53.1%的人將獲取信息作為上網(wǎng)的最主要目的,但是很少有人為之付費。

有人將值得付費的內容劃分為四大類,即:稀缺、獨家的內容;專業(yè)、權威的內容;不可或缺、賴以生活或者工作的內容;精品的授權內容或某一領域的匯總整合內容等。高質量的信息獲取就是通過先進的信息處理技術,將第三類和第四類的信息進行整合,以用戶為中心,及時提供準確的信息,為用戶創(chuàng)造價值,從而推進有償信息服務的發(fā)展。(CBISMB)

發(fā)布:2007-04-24 09:41    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
相關文章:
廣州OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢

泛普廣州OA快博其他應用

廣州OA軟件 廣州OA新聞動態(tài) 廣州OA信息化 廣州OA快博 廣州OA行業(yè)資訊 廣州軟件開發(fā)公司 廣州門禁系統(tǒng) 廣州物業(yè)管理軟件 廣州倉庫管理軟件 廣州餐飲管理軟件 廣州網(wǎng)站建設公司