產(chǎn)品介紹
大數(shù)據(jù)價值的發(fā)現(xiàn)與其所處的應(yīng)用場景密切相關(guān)。概括起來,大數(shù)據(jù)價值發(fā)現(xiàn)可以劃分為三大類:數(shù)據(jù)服務(wù)、數(shù)據(jù)分析和數(shù)據(jù)探索。數(shù)據(jù)服務(wù)是面向大規(guī)模用戶,提供高性能的數(shù)據(jù)查詢、檢索、預(yù)測等服務(wù),通過直接滿足用戶需求而將數(shù)據(jù)價值變現(xiàn)的形式;數(shù)據(jù)分析是分析人員利用經(jīng)驗,通過對大規(guī)模數(shù)據(jù)使用特定的計算模型進行較為復(fù)雜的運算,從而發(fā)現(xiàn)易于人們理解的數(shù)據(jù)模式或規(guī)律所進行的數(shù)據(jù)價值變現(xiàn)的一種運算形式;數(shù)據(jù)探索是一種利用數(shù)據(jù)分析和人機交互的結(jié)合,通過不斷揭示數(shù)據(jù)的規(guī)律和數(shù)據(jù)間的關(guān)聯(lián),引導(dǎo)分析人員發(fā)現(xiàn)并認識其所未知的數(shù)據(jù)模式或規(guī)律,其價值更多地體現(xiàn)在對未知途徑的數(shù)據(jù)模式和規(guī)律的探索。
1.數(shù)據(jù)服務(wù)
數(shù)據(jù)服務(wù)針對用戶非常明確的數(shù)據(jù)查詢和處理任務(wù),以高性能和高吞吐量的方式實現(xiàn)大眾化的服務(wù),是數(shù)據(jù)價值最重要也是最直接的發(fā)現(xiàn)方式。由于要處理大眾化的服務(wù)請求,每個服務(wù)任務(wù)必須能夠被快速地處理掉,因此,數(shù)據(jù)服務(wù)的單個任務(wù)負載不能過于復(fù)雜,單任務(wù)直接處理的數(shù)據(jù)不能太大,任務(wù)對應(yīng)的用戶需求和采用的數(shù)據(jù)處理方法必須是明確的。一些典型的數(shù)據(jù)服務(wù)包括事務(wù)處理、數(shù)據(jù)查詢、信息檢索、數(shù)據(jù)預(yù)測。
2.數(shù)據(jù)分析
?數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計分析方法對大量數(shù)據(jù)進行分析或建模,提取有用信息并形成結(jié)論,進而輔助人們決策的過程。在這個過程中,用戶會有一個明確的目標,通過“數(shù)據(jù)清 理、轉(zhuǎn)換、建模、統(tǒng)計”等一系列復(fù)雜的操作,獲得對數(shù)據(jù)的洞察,從而協(xié)助用戶進行決策。常見的數(shù)據(jù)分析任務(wù)又可以被進一步劃分為描述型分析、診斷型分析、預(yù)測型分析、策略型分析。
4.數(shù)據(jù)探索
?數(shù)據(jù)探索是指針對目標可變、持續(xù)、多角度的搜索或分析任務(wù),其搜索過程是有選擇、有策略和反復(fù)進行的。它將以找到信息為目的的傳統(tǒng)信息檢索模式變?yōu)橐园l(fā)現(xiàn)、學(xué)習(xí)和決策為目的的信息搜尋模式。這樣的搜索模式結(jié)合了大量的數(shù)據(jù)分析與人機交互過程,適合于人們從數(shù)據(jù)中發(fā)現(xiàn)和學(xué)習(xí)更多的內(nèi)容和價值。
北京理工大學(xué)大數(shù)據(jù)搜索與挖掘?qū)嶒炇覐埲A平主任研發(fā)的NLPIR大數(shù)據(jù)語義智能分析技術(shù)是滿足大數(shù)據(jù)挖掘?qū)φZ法、詞法和語義的綜合應(yīng)用。NLPIR大數(shù)據(jù)語義智能分析平臺是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡(luò)采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開發(fā)平臺。