介 紹
一站式解決客戶的中文語義分析需求。多個語義分析API,從情感傾向、實體、分類、聚類等多種維度助客戶分析海量非結構化文本,最大化數據的商業價值。
功 能
-
關鍵詞提取
綜合考慮詞語在文本中及背景數據中的頻率,選擇出最具有代表性的關鍵詞并給出相應權重。
-
實體識別
基于自主研發的結構化信息抽取算法,F1分數達到81%,相比于StanfordNER高出7個百分點。
-
情感分析
情感分析引擎提供行業領先的篇章級情感分析,經過行業數據標注學習后準確率可達85%~90%。
-
文本聚類
機器自動對文本進行話題聚類,將語義上相似的內容歸為一類,有助于海量文檔、資訊的整理,和話題級別的統計分析。
-
信息分類
將文本按照預設的分類體系進行自動區分,商業應用前景廣泛。如,通過社交網絡挖掘商業情報和潛在銷售機會,企業內文本數據分析,海量數據篩選,資訊分類和自動標簽預測等。
-
語義聯想
將輸入文本進行詞際關聯的計算,可用于文本聚類中關鍵詞的擴展,智能推薦,檢索查詢中智能提示以及關鍵詞預測等。 該算法在國內首創,是我們的專利產品。
-
文本傳播監測
用于監測文本在互聯網的傳播情況?;谧灾餮邪l的多特征大規模文本相似性計算算法,用戶可以自定義監控時間窗口范圍,引擎可快速的返回整個互聯網的傳播信息。
-
專家觀點抽取
將文本中觀點進行單句級別的語義聚合,提取出有代表性的意見??捎糜谥菐祛愇恼掠^點調研、國家政策發布后專家解讀分析和社會熱點事件的意見整理等。與人工整理相比更加快速、準確 。
優 勢
專注文本挖掘、中文語義分析技術,經驗豐富。至今積累數億級中文語料庫,為精準和深度的文本挖掘分析提供堅實基礎。 強大的半監督機器學習引擎,結合獨特的語義聯想、句法分析等技術,將中文語義分析的準確度提升到商業應用級別。 可根據需求定制數據分析模型和解決方案,快速滿足您業務的需求。