產(chǎn)品介紹
當今,信息技術為人類步入智能社會開啟了大門,帶動了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電子商務、現(xiàn)代物流、網(wǎng)絡金融等現(xiàn)代服務業(yè)發(fā)展,催生了車聯(lián)網(wǎng)、智能電網(wǎng)、新能源、智能交通、智能城市、 裝備制造等新興產(chǎn)業(yè)發(fā)展.現(xiàn)代信息技術正成為各行各業(yè)運營和發(fā)展的引擎.但這個引擎正面臨著大數(shù)據(jù)這個巨大的考驗.各種業(yè)務數(shù)據(jù)正以幾何級數(shù)的形式爆發(fā),其格式、收集、儲存、檢索、分析、應用等諸多問題,不再能以傳統(tǒng)的信息處理技術加以解決,對人類實現(xiàn)數(shù)字社會、網(wǎng)絡社會和智能社會帶來了障礙.大數(shù)據(jù)處理技術就應用而生了。
大數(shù)據(jù)因為它所蘊含的潛在價值,正在成為企業(yè)的隱形“金礦”.隨著生產(chǎn)、運營、管理、監(jiān)控、銷售、客服等各個環(huán)節(jié)的數(shù)據(jù)不斷累積和增長,以及用戶數(shù)的不斷上升,通過從龐大的數(shù)據(jù)中分析出相關模式以及趨勢,可以實現(xiàn) 管理、準確營銷,成為企業(yè)打開這一“金礦”的鑰匙.然而傳統(tǒng)的IT基礎架構和數(shù)據(jù)管理分析方法已經(jīng)不能適應大數(shù)據(jù)的快速增長.大數(shù)據(jù)的爆發(fā)是我們在信息化和社會發(fā)展中遇到的棘手問題,需要我們采用新的數(shù)據(jù)管理模式,研究和發(fā)展新一代的信息技術才能解決.
北京理工大學大數(shù)據(jù)搜索與挖掘實驗室張華平主任研發(fā)的NLPIR大數(shù)據(jù)語義智能分析技術是滿足大數(shù)據(jù)挖掘對語法、詞法和語義的綜合應用。NLPIR大數(shù)據(jù)語義智能分析平臺是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯(lián)網(wǎng)內容處理的全技術鏈條的共享開發(fā)平臺。
NLPIR大數(shù)據(jù)語義智能分析平臺主要有采集、文檔轉化、新詞發(fā)現(xiàn)、批量分詞、語言統(tǒng)計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索、編碼轉換等十余項功能模塊,平臺提供了客戶端工具,云服務與二次開發(fā)接口等多種產(chǎn)品使用形式。各個中間件API可以無縫地融合到客戶的各類復雜應用系統(tǒng)之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統(tǒng)平臺,可以供Java,Python,C,C#等各類開發(fā)語言使用。