<tfoot id="kyoiw"></tfoot>
  • <strike id="kyoiw"></strike>
  • <strike id="kyoiw"></strike>
  • 資訊頻道
    下載手機APP
    當前位置: 首頁 ? 資訊頻道 ? 樂收生意寶資訊 ? 正文

    樂收生意寶訊:大數據“軼事”:數據不夠用,“偽”數據來湊數

    來源:全球起重機械網??人氣:3045
    |
    |
    |

    原標題:大數據“軼事”:數據不夠用,“偽”數據來湊數

    樂收生意寶 令人稱奇的大神級AI,都曾經歷過無數次訓練,AI訓練的核心是數據,盡管數據驅動并不是AI算法訓練的唯一方式,但不能否認的是,相對來說,擁有海量數據的領域,是AI滋生的更好溫床。

    舉一個簡單的例子,與其他多個小語種翻譯比起來,英漢翻譯器的翻譯能力往往會更強,就是因為英漢互譯的使用頻率遠遠高于其他各語種的互譯。同理,人臉識別技術應用率遠高于虹膜識別,因為人臉數據更方便收集。

    數據匱乏或是采集成本高,是阻礙AI發展的一個重要原因。面對這種情況,數據增強技術應運而生。

    所謂數據增強技術,就像是數據的繁殖皿,可以讓數據進行“有絲分裂”,增強樣本擴大數據集。

    就拿圖像數據來說,當圖像數據不足時,可以對原圖像做一些改動,例如裁剪、旋轉、鏡像反轉、輕微的扭曲、增加噪點、增加遮擋物等等。也許對人類來說,被改動過的圖像很容易被識別,看出與原圖的差異。但對于AI來說,即使幾個像素點的變動,也是一個全新的數據樣本。

    而應用于文本數據,則有互譯和詞向量替換兩種方法。通過機器翻譯,將一句話從中文翻譯成英文,再由英文翻譯成中文,就可以實現語序、同義詞等等的調整替換,得到語料乘二的效果。以及通過自然語言生成技術,將一句話中的不同對象進行劃分并替換生成新的句子,就像同義詞、近義詞替換。

    令人驚喜的是,這些數據增強技術也開始通過深度學習的加持逐漸提升效率。

    去年4月,谷歌的AutoAugment技術,設計了一個自動搜索空間,利用搜索算法來確定適合數據集的圖像增強策略,制定執行的順序并且自動執行。比如將一個動物或植物照片數據集輸入給AutoAugment,AutoAugment通過計算會確定出先平移再剪裁是讓AI對于數據“陌生感”最大化的解決方案,然后開始自動執行。是不是很精妙?
          -----本文轉自網絡,如有侵權請聯系我們及時刪除處理。
    樂收生意寶-是樂收網旗下精準、便捷的采購信息和供應信息發布平臺,樂收生意寶用簡單的理念,致力于為中國4000萬中小企業和商業人士提供便捷的采供信息服務!
    gg-1
     

    文中內容、圖片均來源于網絡,如有版權問題請聯系本站刪除!
    ?

    移動版:樂收生意寶訊:大數據“軼事”:數據不夠用,“偽”數據來湊數

    相關信息

    ?
    主站蜘蛛池模板: 中文国产成人精品久久亚洲精品AⅤ无码精品| 亚洲色精品88色婷婷七月丁香 | 亚洲AV永久无码精品一百度影院| 欧美精品第一页| 亚洲精品国产首次亮相| 精品国产亚洲一区二区在线观看| 国产精品高清一区二区人妖| 性欧洲精品videos| 蜜臀久久99精品久久久久久| 93精91精品国产综合久久香蕉| 久久99国内精品自在现线| 人妻少妇精品系列| 国产精品福利电影一区二区三区四区欧美白嫩精品 | 91精品国产综合久久精品| 国产三级国产精品国产普男人 | 国产成人精品日本亚洲专| 久久久无码精品亚洲日韩蜜臀浪潮| 午夜三级国产精品理论三级| 无码精品一区二区三区免费视频 | 国产成人久久精品激情| 熟妇人妻VA精品中文字幕| 亚洲а∨天堂久久精品9966| 国产欧美日本亚洲精品一5| 四虎精品8848ys一区二区| 99精品高清视频一区二区| 国产午夜精品久久久久免费视| 中文国产成人精品久久不卡| 欧美日韩成人精品久久久免费看 | 91精品国产91久久久久福利| 亚洲av永久无码精品网站 | 久久精品国产亚洲av麻豆色欲 | 日本精品一区二区三区在线视频| 久草视频精品在线| 国产一区二区三区精品视频| 国产精品九九九| 99久久婷婷国产综合精品草原| 87国产私拍福利精品视频| 成人国产精品一区二区视频| 99久久www免费人成精品| 国产精品免费在线播放| 国产精品永久久久久久久久久|