申請免費試用、咨詢電話:400-8352-114
AMTeam.org
摘要:
智能化訪問所有的信息--你需要弄清楚尋找什么信息,已知什么信息和如何利用信息。
跨越信息訪問的鴻溝!
by AMT方厚政 編譯
什么是“非結(jié)構(gòu)化數(shù)據(jù)”,為什么把非結(jié)構(gòu)化數(shù)據(jù)“結(jié)構(gòu)化”的呼聲越來越高it?非結(jié)構(gòu)化數(shù)據(jù)大量存在,一般公司80%-90%的信息是非結(jié)構(gòu)化數(shù)據(jù)。例如Word和PowerPoint文件,電子郵件和公司內(nèi)部網(wǎng)的時事通訊等都是非結(jié)構(gòu)化數(shù)據(jù)。員工們常常抱怨當開始一個新項目時總得再次從頭開始,以及抱怨要花費大量時間來查找相關(guān)文件?,F(xiàn)在,信息技術(shù)部門正努力幫助用戶獲取和利用組織里的更多的數(shù)據(jù),并把數(shù)據(jù)同廣泛的組織業(yè)務(wù)活動聯(lián)系起來。
本文主要討論如何跨越企業(yè)當前于已有的保存在關(guān)系數(shù)據(jù)庫里的面向記錄的數(shù)據(jù)和存放在電子文檔和文件集里的多如牛毛的網(wǎng)絡(luò)非結(jié)構(gòu)化數(shù)據(jù)之間的鴻溝
。最主要目標是幫助企業(yè)如何充分利用可獲得的信息,從而使企業(yè)行為更為明智:最根本的一點,公司想弄清楚自己已經(jīng)知道了的信息!但是正如許多公司所發(fā)現(xiàn)的那樣,這并不是件容易的事。
首先,要把大量的原始數(shù)據(jù)整理的有條有理是件十分困難的事情。但由于特定的用戶或工作并不需要所有的信息,所以IT部門開始時一般關(guān)注那些盡管只涉及公司信息存儲空間較易處理部分但有很大特定價值的應(yīng)用,更糟糕的是,他們?yōu)檫@類應(yīng)用所設(shè)計的信息訪問方法并不適合訪問所有信息這一更大目標。這些傾向會破壞公司在信息訪問方面長期努力的成果。
可訪問公司所有信息的“智能信息訪問方法”大目標要求該方法支持訪問大量不同任務(wù),方面和項目的信息。知識員工沒有時間或不愿意去熟悉許多不同的訪問界面或到不同的地方去收集他們不同業(yè)務(wù)活動所需的信息。這是我們需要首先解決的問題,不是嗎?
這成為門戶概念和實施發(fā)展的驅(qū)動力。但是,光有門戶是不夠的。這不只是讓所有的文檔通過一個訪問渠道獲得。這一點,我們在通過網(wǎng)絡(luò)瀏覽器訪問網(wǎng)站就做到了。
“在所有文檔搜索”及其效率低下的單調(diào)的逐頁瀏覽方式很難支持公司的即時需求。其他許多功能包括分類,信息可視化,內(nèi)容挖掘和分析等功能都需要安裝以優(yōu)化原始搜索。當這個更為豐富的交互式內(nèi)容訪問工具集安裝后,用戶能以統(tǒng)一的渠道訪問所有的內(nèi)容就顯得尤為重要了。
但是,公司必須首先搞清楚自己在尋找什么信息,已經(jīng)有了什么信息和如何利用信息。
一組需要區(qū)分的概念
為了實現(xiàn)更好的信息訪問,許多相關(guān)概念應(yīng)加以區(qū)分。當然,區(qū)分原來的結(jié)構(gòu)化數(shù)據(jù)(關(guān)系數(shù)據(jù)庫)VS.非結(jié)構(gòu)化數(shù)據(jù)(文本)很重要,但是,公司也需要處理好內(nèi)部(公司)VS.和外部(網(wǎng)站)的需要。通常項目需求分析說明了知識管理系統(tǒng)集成了這些信息分塊。
結(jié)構(gòu)化/非結(jié)構(gòu)化:無疑用戶想通過門戶從關(guān)系數(shù)據(jù)庫獲取數(shù)據(jù)和從內(nèi)容存儲集里獲取文檔,但是,如果只是提供多頁的鏈接是不夠的。用戶需要內(nèi)容分析技術(shù)來揭示和利用有意義的知識。單純搜索的意義并不大,知識員工需要通過搜索后的“發(fā)現(xiàn)”,即獲悉搜索到的信息所蘊含的意義。
內(nèi)部/外部:顯然,組織都需要從外部網(wǎng)站上獲取有價值的內(nèi)容。更難的挑戰(zhàn)在于允許用戶和組織通過公司內(nèi)部渠道獲取外部信息。例如,某一制藥公司的一個研究人員可能很想通過技術(shù)詞匯如醫(yī)藥主題的標題來了解市場消息,或者根據(jù)內(nèi)部的與該制藥公司獨特視角相關(guān)的分類法來了解相關(guān)市場信息。
內(nèi)容/上下文:人們普遍認為一篇文檔的各種相關(guān)上下文線索有助于幫助用戶確定特定資源是否能為其需要服務(wù)。但是由于搜索軟件作為基于內(nèi)容的訪問工具的流行,基于內(nèi)容的元數(shù)據(jù)概念趨向于被局限為“文檔所包含的詞句”的搜索引擎方法。然而,文檔一般以各種關(guān)系和結(jié)構(gòu)涉及多個主題,受到多個方面的影響?;趦?nèi)容的特征包括語言,語調(diào),流派,多個和兩個同時發(fā)生的主題,提及的各種項目(人物,地點,組織)等等。這些基于內(nèi)容衍生的元數(shù)據(jù)當然能幫助用戶更好地挑選文檔,但是隨著時間的推移,這些元數(shù)據(jù)可用于開發(fā)利用大型文檔存儲集也變得同樣重要。
運作/戰(zhàn)略:存儲的內(nèi)容常用來支持特定運營目標(例如,制藥公司的藥品報告文檔)。一旦馬上使用后,這些文檔被保留下來和根據(jù)相關(guān)規(guī)定或別的原因加以嚴格控制。通常,這種面向未來的知識管理會喪失與遺留文檔相關(guān)的機遇。因為“打開”這些營運資料的風(fēng)險性和許多困難,許多項目只是關(guān)注那些容易獲得的信息。這是錯誤的。尋找釋放這些被“封存”起來的信息的功用的方法,從而滿足支持獲取完整知識的要求是很重要的。
對許多公司來說,進行出售其大型IT項目的決策時感到很為難,而且關(guān)注象統(tǒng)一信息訪問方法這樣的最終目標似乎有一定風(fēng)險。但是,我們都知道“知識就是力量”。大部分的CIO和CEO對那些生成后對組織就沒有用的信息十分反感,這將導(dǎo)致競爭性優(yōu)勢的喪失和生產(chǎn)率的下降。
對于有目光長遠的組織,解決辦法是迭代的實施方法。把智能信息訪問方法用于一個接一個的特定項目,充分利用被廣泛使用的工具來訪問和使用各種來自企業(yè)各個部門的信息。
作者聯(lián)系方式:houzheng.fang@amteam.org
|