產(chǎn)品介紹
隨著現(xiàn)代信息傳播技術(shù)手段和方式不斷豐富,信息獲取、信息傳遞、信息處理、信息再生、信息利用等功能應用日益多樣化,智能化信息系統(tǒng)逐漸形成一個信息網(wǎng)絡體系,人類社會的生產(chǎn)方式、工作方式、學習方式、交往方式、生活方式、思維方式等發(fā)生了極其深刻的變革,互動化、即時性、全媒體等成為常態(tài)性的信息生態(tài)環(huán)境,傳統(tǒng)的數(shù)據(jù)庫組織架構(gòu)和信息服務模式己經(jīng)難以適應信息社會現(xiàn)實需要,整個信息技術(shù)架構(gòu)的革命性重構(gòu)勢在必行,大數(shù)據(jù)成為信息技術(shù)發(fā)展的必由之路。
在大數(shù)據(jù)時代,數(shù)據(jù)挖掘是最關(guān)鍵的工作。大數(shù)據(jù)的挖掘是從海量、不完全的、有噪聲的、模糊的、隨機的大型數(shù)據(jù)庫中發(fā)現(xiàn)隱含在其中有價值的、潛在有用的信息和知識的過程,也是一種決策支持過程。其主要基于人工智能,機器學習,模式學習,統(tǒng)計學等。通過對大數(shù)據(jù)高度自動化地分析,做出歸納性的推理,從中挖掘出潛在的模式,可以幫助企業(yè)、商家、用戶調(diào)整市場政策、減少風險、理性面對市場,并做出正確的決策。
北京理工大學大數(shù)據(jù)搜索與挖掘?qū)嶒炇覐埲A平主任研發(fā)的NLPIR大數(shù)據(jù)語義智能分析技術(shù)是滿足大數(shù)據(jù)挖掘?qū)φZ法、詞法和語義的綜合應用。NLPIR大數(shù)據(jù)語義智能分析平臺是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開發(fā)平臺。
NLPIR大數(shù)據(jù)語義智能分析平臺主要有采集、文檔轉(zhuǎn)化、新詞發(fā)現(xiàn)、批量分詞、語言統(tǒng)計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索、編碼轉(zhuǎn)換等十余項功能模塊,平臺提供了客戶端工具,云服務與二次開發(fā)接口等多種產(chǎn)品使用形式。各個中間件API可以無縫地融合到客戶的各類復雜應用系統(tǒng)之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統(tǒng)平臺,可以供Java,Python,C,C#等各類開發(fā)語言使用。
大數(shù)據(jù)挖掘已成為大數(shù)據(jù)技術(shù)最重要的應用,它從大數(shù)據(jù)中提取、挖掘?qū)I(yè)務發(fā)展有價值的、潛在的知識,找出趨勢,為決策層提供有力依據(jù),對產(chǎn)品或服務發(fā)展方向起到積極作用,將有力推動企業(yè)內(nèi)部的科學化、信息化管理。在信息管理領(lǐng)域,綜合應用數(shù)據(jù)分析技術(shù)和人工智能技術(shù),獲取用戶知識、文獻知識等各類知識,將是實現(xiàn)知識檢索和知識管理發(fā)展的必經(jīng)之路。