<video id="kldpx"></video>
    <rp id="kldpx"><menuitem id="kldpx"></menuitem></rp>
        <video id="kldpx"></video><video id="kldpx"></video>
          <video id="kldpx"></video>
          <video id="kldpx"><input id="kldpx"><dl id="kldpx"></dl></input></video>
            公司新聞

            遙感樣本庫建設還沒頭緒?不妨來這看看...

            2022-08-19 391

            近年來,全國多個省份地區已經開始著手建設屬于自己的遙感樣本庫,這一良好的趨勢表明了各方政府正在積極響應并落實關于推廣“人工智能”這一新興技術的科技政策,也肯定了國家對于發展AI技術與各行各業深度融合的決心和愿景。

             

            利用深度學習技術進行遙感圖像智能解譯已成為當前自然資源部在面臨國土問題作出精準快速決策的重要手段。深度學習技術當前主要依賴“監督學習”分類方式,即必須有海量樣本數據參與訓練,最終的模型也就是從這些樣本蘊含的信息中進行的抽象結果。因此,如何構建一套完整、穩定、合理的樣本庫體系成為模型訓練前期最重要的任務和難題。

             

            由于遙感數據的復雜性及遙感業務成果需求的多樣性,遙感樣本庫的建成往往需要綜合考慮多方面因素,究其本質也就是致力于平衡“AI算法、遙感影像特性、業務規則、標注成本及效率”幾者之間的沖突。因此,這對于建設者提出了較高的要求,需要其對AI基本原理、遙感專業知識、項目管理能力等要有一個基本的掌握。我們一直倡導“授人以漁”的理念,從解決實際問題的角度出發,盡管全國不同的地區對于遙感解譯業務關注的重點有所區別,實施方案也都別具一格,但是“萬變不離其宗”,絕大多數AI算法對于訓練樣本的質量追求都是一致的,只要掌握樣本庫建設的底層邏輯,在面對各種復雜的業務場景時,也能夠形成一套適用于自身業務的獨特且合理的建設方案。下面根據作者自身的理解和經驗列舉出樣本庫建設的幾個關鍵環節:

             

            明確分類體系

            明確分類體系是樣本庫建設工作的基礎,其主要目的是標準化 “”的認知思維。

             

            制定標準規則

            制定出既適合AI算法原理又適合業務需求的標注規則,其主要目的是標準化“”的作業成果質量,讓“計算機”清晰地知道我們需要的是什么。

             

            樣本選擇

            在有限的樣本數量之內,如果有對特征分析處理的意識有助于提高模型的泛化能力。

             

            樣本庫管理

            制定出一套能容納所有遙感業務類型的樣本庫管理系統或方案,其主要目的是有序積存海量遙感數據,便于未來發揮潛在價值。

             

             

             

            01.
            明確分類體系 CLASSIFICATION SYSTEM

             

             

             “分類體系”的概念官方定義比較抽象,如果思維深度不夠,很難對它有一個全面的認知。簡單來說,“分類體系”可以理解為是針對于體系下的所有個體,按照某種特定的規律(如根據視覺、觸覺、聽覺等感官能力...)發現其可區分、可信的特征差異,從而進行分類。不同的分類體系對于同一個體可能會有不同的定義。  為什么說AI和遙感圖像具有天然的耦合性?因為不管是AI視覺算法還是傳統遙感圖像解譯,都是通過視覺能力的特性尋找要素的特征差異來實現分類。分類體系內的類別越多、區分度越低,對應樣本數量就需要越多、模型訓練難度就會越大,所以如何編制出一套簡潔自洽、貼合業務的分類體系,是樣本庫建設中最重要的工作之一。而建設者需要“拉齊認知”,也就是需要將自身知識經驗的無序狀態變為經過分類的有序狀態,以完成標準統一的認知過程。

             

            遙感業務場景多樣,不同的業務場景對于最終的成果需求也會有所不同,建設者需對業務規則充分了解,使之與AI算法有機結合,從而明確出適合業務的分類體系。遙感行業常見的分類體系有地理國情普查分類體系和三次國土調查分類體系,作為兩項重大的國情國力調查,目的都是為了查清我國自然資源家底,并且年度地理國情監測調查年度國土變更調查分別是這兩項重大調查工作的年度信息更新手段,確保我國的自然資源數據的實時性。這兩項調查工作都對土地利用情況進行了分類,但是兩者在側重點上各有不同:

             

            地理國情普查側重于反映土地的植被覆蓋及使用情況,從土地本身的自然特征著手,其分類偏向于自然屬性;

            第三次國土調查(土地利用現狀)側重于從管理的屬性出發,目的是真實的反映土地的利用狀況及潛力,其分類偏向于社會經濟屬性。 

             

            兩種分類體系的異同分析可參考【地理國情普查與三調數據的共享探析】

             

            當然,有的業務規則可能會將兩種分類體系結合使用,或者在此基礎上延伸出其它變種分類體系。究其根本,不管使用何種分類體系,都須要滿足這樣幾點原則:

             

            Ⅰ.所有類別能通過目視區分,不摻雜人為主觀判斷力和經驗;

            Ⅱ.分類體系應自洽、客觀,避免“同物異類”情形;

            Ⅲ.分類體系應涵蓋所有業務關注的地類,凡能精簡、歸并的地類盡量歸并;

            Ⅳ.分類體系一旦確定,盡可能不改、小改。

             

             

             

            02.
            制定標注規則 STANDARD RULES
             

             

            沒有明確分類體系的業務規則都是“耍流氓”,分類體系是業務規則的根基。明確分類體系后,我們再來談談業務規則。不同的遙感業務對于其規則的制定也有所不同,比如土地衛片執法、國土變更調查、重要生態空間人類活動變化監測、城市違建監測等。大多數情況下,最終制定出的標注規則=AI原則+業務規則(+特殊場景說明),即站在AI算法的角度先約束幾條原則,再按照業務規則的作業要求去標注,有些復雜的業務場景下還需要補充一些特殊說明,防止邏輯混亂。要遵循的AI原則主要有如下幾點:

             

            Ⅰ.所見即所得

            標注員僅通過目視影像標注,不參考影像之外的其他數據(如三調數據庫),不摻雜人為主觀的經驗和知識標注。

            Ⅱ.統一可區分

            標注員之間應形成對規則統一的理解和認知,避免相互沖突;標注員自身時刻也要統一一套作業準則,避免自相矛盾。

            Ⅲ.標簽完整性

            用作訓練的影像,盡量避免 “漏標注”和“錯標注”,以免降低模型效果。

            Ⅳ.變化可逆性

            所有變化圖斑可逆,不區分前后影像類別先后順序,如“建筑變耕地”和“耕地變建筑”可理解為是同一類變化。

             

             

             

            03.
            樣本選擇 SAMPLE SELECTION

             

             

            樣本的選擇一定程度上關乎著樣本標注的成本和最終模型的效果,按照一個正確的思路去進行樣本的選擇,是整個樣本庫建設工作的基礎保障。關于樣本的選擇,如不考慮影像獲取的難度和矢量采集成本,在適合標注規則的前提下本著“越多越好”的原則;如果考慮成本,關于樣本的選擇可遵循以下原則:

             

            Ⅰ.充分分析業務場景范圍內的影像各維度特征,優先選擇強代表性的樣本;

            (影像維度包括:傳感器、時空分辨率、地區、地形地貌等等,強代表性指的是最貼合實際業務場景各維度的影像)

            Ⅱ.綜合考慮分類體系下的類內多樣性、類間差異性問題,更多選擇分類難度大的樣本。
             

            ①類內多樣性:類內多樣性越多,訓練難度越高;反之越低。比如耕地,受不同季節、分辨率、地區、成像條件等因素影響,會出現多種特征形態;而像一些形態單一的特定類別比如籃球場、風車等,故訓練難度低。

            ②類間差異性:類間差異性越大,訓練難度越低;反之越高。比如耕園林草之間差異性較小,建筑和道路差異性較大,礦石開采與尾礦堆放地差異性較小等等;對于差異性較小的地類間,首先確定人類能夠目視可區分,其次可以額外增加此類樣本。

            Ⅲ.適當選擇制作在實際業務場景中對模型檢出干擾性較強的負樣本,如陰影、季節性差異、自然氣象、人類臨時性活動.......

             

            當然了,當你的樣本量足夠多足夠大,以上這些類似于“特征工程”的工作其重要性占比就越小,這也是深度學習的優勢之一。所以更多時候,樣本數量的優先級往往要高于樣本質量,當樣本數量多出一個量級時,是能夠遠遠彌補在樣本質量上落后的那幾個點。

             

             

             

            04.
            樣本庫管理 SAMPLE LIBRARY 

             

             

            以上三個環節是針對某一個具體的遙感業務或項目所闡述的樣本標注思路,樣本標注的最終目的也就是訓練出一個適合業務生產的高精度AI模型。而隨著業務的逐漸增多,樣本庫的管理也成了一項繞不開的難題。樣本庫管理是一個長期的工作,需要有顧全局的意識,其主要目的是讓所有多樣化的樣本能夠有條不紊的分類入庫,并且形成規范,以容納未來更多的樣本,便于在后續調用的時候,能夠滿足快速、方便、靈活等特點。樣本庫管理方式可以依托于智能化的平臺、系統,也可以采用最樸素的文件夾存儲管理方式,不管哪種方式,其管理的底層邏輯一般都按以下三個層級去劃分:

             

            層級1——按樣本類型

             


            層級2——按分類體系/業務

             


            層級3——按影像屬性

             

             

            除此之外,樣本庫建設工作還包括數據預處理、標注團隊組建、質量控制、樣本規格統一等等,這些內容也都不可或缺,但對于經歷過測繪遙感相關項目的人員來說這些都不算難題。將以上所有內容串聯起來,再結合建設者自身對行業的理解,就可以構建出一套完整的樣本庫方案了。

             

             

            注:此篇文章內容均為作者主觀闡述總結,請各位讀者批判性吸收,歡迎一起交流學習!

             

            中文人妻无码一区二区三区信息_国产在线视频无码不卡免费_国产亚洲中文日韩欧美综合网_992看看电影网
              <video id="kldpx"></video>
              <rp id="kldpx"><menuitem id="kldpx"></menuitem></rp>
                  <video id="kldpx"></video><video id="kldpx"></video>
                    <video id="kldpx"></video>
                    <video id="kldpx"><input id="kldpx"><dl id="kldpx"></dl></input></video>