<optgroup id="fegnq"><em id="fegnq"><del id="fegnq"></del></em></optgroup>
  1. <optgroup id="fegnq"><li id="fegnq"></li></optgroup>
    1. <em id="fegnq"></em>
    2. <dd id="fegnq"></dd>
    3. <optgroup id="fegnq"><li id="fegnq"></li></optgroup>
      <span id="fegnq"></span>
      <track id="fegnq"></track><samp id="fegnq"></samp>

    4. 歡迎您訪問廣州瞬速信息科技有限公司
      非結構化數據背后的真相
      發表時間:2017/2/25 14:45:18

      隨著大數據概念的流行,非結構化數據已經逐漸成為了大數據的代名詞。Soltius公司的工程師Ram Subramanyam今天發表了一篇文章,對非結構化數據進行了解讀。

      相比于交易型數據,非結構化數據(Unstructured Data)的增長速度要快很多。整理、組織并分析非結構化數據,能夠為企業帶來更多的競爭優勢。每一個數據元素都有它的意義,盡管有些是和你不那么相關的。在本文中,我就將解釋一些常見的非結構化數據問題。

      非結構化數據包括以下幾個類型:


      文本:在掌握了元數據結構時,機器生成的數據,如傳感器等就一定能夠進行解譯。當然,流數據中有一些字段需要更加高級的分析和發掘功能。


      交互數據:這里指的是社交網絡中的數據,大量的業務價值隱藏其中。人們表達對人、產品的看法和觀點,并以文本字段的方式存儲。為了自動分析這部分數據,我們需要借助實體識別以及語義分析等技術。你需要將文本數據以實體集合的形式展現,并結合其中的關系屬性。


      圖像:圖像識別算法已經逐漸成為了主流。此外,這些技術也會產生實體,盡管獲取關系以及輿情分析更加具有挑戰性。


      音頻:目前有許多研究是針對于解譯音頻流數據的內容,并能夠判斷說話者的情緒。然后在利用文本分析技術對這部分數據進行分析。


      視頻:毫無疑問,視頻是最具挑戰性的數據類型。圖像識別技術可以對每一幀圖像進行抽取,當然,要真正做到對視頻內容進行分析還需要技術的進一步發展。而視頻中又包括音頻,可以用上述的技術進行解譯。

      根據上述內容,我們需要一些新的數據處理與分析功能,來獲得這些數據類型的價值,下面就是其中一部分技術:


      動態元數據發現:該技術主要針對文本數據,它能夠動態地將元數據從結果集中抽取出來,比如新的REST結束點。在持續基礎上維護和控制元數據。在運行時間,從大量可用選項中,選擇適當的最佳匹配的元數據集。


      分類設置:你需要能夠針對其他分析層捕獲并表現你的業務及其實體,以對輸入的數據進行注釋和參考。由于業務元素的加入,這一分類將變得更加普遍。


      實體提取和語義分析:它能夠將分類利用到任何數據流當中,并將數據流中表達的實體和關系進行提取。這種分析可以存儲在一個關系型數據庫當中,也可以以圖表的形式進行存儲。


      多媒體識別技術:如上述所言,進行非結構化數據分析,我們就需要各種解譯圖片、音頻視頻的技術。


      其層級如下所示:





      我們看到,目前許多動作還都停留在最上層,但逐漸也會滲透到音頻和視頻層面。


      關閉窗口
      • 地址:
        廣州市天河區科韻路石東大廈4樓
      • 電話:
        020-2903 9615
      • 手機:
        13533909695
      • QQ:
        747484429
      • 郵箱:
        support@sunshotsoft.com
      廣州瞬速信息科技有限公司 版權所有 粵ICP備10220963 Copyright © 2017 SunShotTech. All Rights Reserved
      13533909695
      020-29039615
      WWW.QYL444,COM