數智水電平台驅動的空間迷信試驗研討:AI4S范式下的新摸索

中國網/中國發展門戶網訊 人工智能(AI)技術的迅猛發展正催生出科學發現的全新范式,極年夜地促進了對各種空間和時間標準下天然現象的懂得,從而推動了科學的進步與創新。

隨著AI的不斷演進,新的科學研討范式AI4S(AI for Science)的突起為科學研討開辟了新的途徑。特別是在AI4S范式下的空間科學實驗領域信義區 水電行的研討,將無力促進空間科學實驗領域獲得嚴重科學結果,推動AI與空間科學穿插學科的繁榮發展。

本文聚焦中國空間站空間科學實驗(以下簡稱“空間科學實驗”)領域,在回顧AI4S在空間科學實驗領域發展的基礎上,深刻剖析了AI4S在微重力條件下空間科學實驗多模態數據智能表征、復雜空間現象的形式識別、領域知識的智能提取及多來源、跨學科數據融會剖析等方面所台北 水電 行面臨的問題和挑戰。針對這些大安區 水電行挑戰,本文圍繞數智驅動在空間科學實驗數據形式發掘、領域知識發現與推理、跨學科認知智能,以及年夜模子構台北 市 水電 行建與應用等方面提出AI4S在空間科學實驗領域的發展與思慮。希冀通過加強領域優勢、樹立開放生態等舉措,配合推動空間科學實驗領域年夜數據發掘與智能認知的不斷發展。

我國空間站空間科學實驗領域研討概況

中國空間科學與應用技術蓬勃發展,已開展并將持續開展一系列空間科學與應用任務和計劃,產生的空間科學數據與日俱增,并呈迅猛增長態勢。在AI4S范式的佈景下,結合微重力條件下空間科學實驗的領域數據特點,充足發掘空間科學實驗數據蘊含的高價值信息,將無力促進科學發現與認知發展。

多學科年夜規模的先進空間科學實驗項目

作為空間科學研討發展的主要陣地,中國空間站是我國未來10—15年規模最年夜的空間綜合研討實驗平臺,將建成國際先進程度的國家太空實驗室,高效開展體系化的空間科學與應用研討和新技術試驗,不斷產出嚴重科技結果,持續獲取綜合應用效益。作為我國航天史上規模最年夜、長期有人照顧的空間實驗平臺(圖1),中國空間站在空間性命科學與生物技術、微重力流體物理與燃燒、空間資料科學、空間基礎物理等多個科學領域,支撐開展近千項先進性和前瞻性研討項目,將獲取海量、多源、高價值的科學數據,為開展AI賦能的跨學科智能認知供給中正區 水電基礎。

空間實驗全周期多來源多模態年夜數據資源

中國空間站科學實驗項目獲取的數據產品種類超2 000種,數據體量預計將達近百PB級。數據資源具有全周期多來源、多學科跨領域、多模態多角度等特點。

全周期多來源海量空間科學實驗數據。空間科學實驗覆蓋地基培養實驗、空中婚配實驗、在軌微重力環境下空間實驗、六合同步比對實驗、空中前往實驗等全周期的空間科學實驗過程和台北 水電 行階段,并采集、處理、剖析、存檔和共享相應階段和過程的實驗數據,以及來自空中鏡像平臺實驗數據、數字孿生數據和微重力模擬實驗數據等來源廣泛、長時間獲取的海量、豐富數據(圖2)。

多學科跨領域水電網數據。空間科學實驗數據涵蓋空間性命科學與生物技術、微重力流體物理與燃燒科學、空間資料科學、空間基礎物理等多學科領域的實驗數據,觸及覆蓋面廣且多樣(圖2)。

台北 市 水電 行

多模態多角度數據。空間科學實驗數據包括圖像、視頻、語音、文本、數值等。此中,圖像數據又包括可見光、熒光、紅外、X射線、顯微等涵蓋多種模態多樣情勢。如燃燒科學實驗柜、流體科學實驗柜等實驗柜,還設置了多角度的觀測設備對統一實驗過程進行多個角度的同步觀測。

數智驅動的空間科學實驗研討

基于中國空間站的空間科學實驗年夜數據作為信息的主要載體,蘊含了空間科學實驗領域內在規律、形式與知識。面向空間科學實驗年夜數據開展數據發掘與智能認知的研討,將推動空間科學實驗領域新理論、新方式與新知識的高效產出。空間科學實驗領域內的跨學科一起配合,學科內知識的穿插融會,將加快領域內普通性規律的嚴重科學發現,也將推動整個空間科學實驗領域朝著加倍開放、協同和智能化的標的目的邁進,對空間科學實驗研討的新形式摸索與高質量發展具有主要意義。

空間科學實驗領域AI4S研討的問題與挑戰

空間科學實驗領域AI4S的研討旨在聚焦摸索AI與空間科學實驗領域的深度融會,應用AI技術學習、模擬、預測和優化空間科學實驗領域各種現象和規律以解決各種科學問題,構建以AI支撐基礎和前沿的空間科學實驗數據研討的新形式,加快空間科學實驗領域科研范式變革和才能晉陞,從而推動領域科學新發現和創新。空間科學實驗領域AI4S研討面臨的問題與挑戰如下。

空間科學實驗多模態數據信息提取的復雜與困難,使得數據表征、特征融會更具挑戰。空間科學實驗開展過程中,針對特定研討領域的實驗對象產生的實驗數據,往往以分歧的模態情勢存在,如物理量參數、圖像、視頻等數據,這些數據都隱含了研討對象在空間特別環境和實驗條件下的科學規律。多模態表征通過應用多模態數據之間的互補性,剔除模態間的冗余性,從而學習并提取分歧模態數據的特征表現。空間科學實驗產生的多模態實驗數據的復雜處理方法、六合差異、異質性等原因,使得構建周全準確的表征極具挑戰性(圖3)。多模態語義對齊識別多模態信息之間的跨模態連接和彼此感化。例如,剖析空間科學實驗的物理參量和圖像視頻數據時,需求將特定的物理參量與圖像或視頻對齊。模態之間的對齊在技術上存在良多困難,因為分歧模態之間能夠存在隱含關聯與長距離的依賴關系,觸及含混的朋分,并且能夠是一對多、多對多的關聯性,需求處理分歧模態之間的歧義,以精準大安區 水電婚配跨模態信息,并最年夜水平下降信息損耗。多模態信息融會抽取自空間科學實驗中山區 水電分歧模態的信息,整分解多模態特征信息,應用多個來源分歧模態的互補信息執行剖析與預測。分歧模態的信息能夠具有分歧的預測才能和噪聲拓撲,一方面分歧模態之間的關聯信息有互補感化,另一方面模態本身的特異性又有很強的標識效能。同時,根據待融會模態信息的特點可以分為異質多模態融會(如文本與圖像)和同質多模態融會(如深度圖與灰度圖)等多種情況,獲取分歧模態實驗數據間的個性和模態內的特徵信息,具有極年夜的計水電行算復雜度。

多約束條件下的空間科學實驗數據多樣化與復雜關聯,使得形式識別與剖析變得更為困難。在空間科學實驗領域,進行科學實驗時遭到多種約束條件的影響,包含宇宙低溫、強輻射、微重力等多重原因。這些約束條件導致獲取的實驗數據呈現出極年夜的多樣性和復雜性,使得數據的形式識別和剖析變得困難。一方面,需求應對數據中的噪聲、不確定水電行性及多模態數據之間的復雜關中山區 水電聯。在處理這些多重約束下的數據時,科學家們面臨著挑戰,需求開發出具有魯棒性的算法,以確保準確性和周全性,推動對復雜空間實驗現象的深刻懂得和科學實驗數據的有用剖析。別的一方面,長期微重力條件下科學實驗數據的剖析發掘不僅需求從復雜數據中發現形式與關聯,更需求結合分歧的環境變量及實驗變量、先驗知識輔助支撐有興趣義、有價值的形式發掘與科學發現。是以,若何將這些把持變量、先驗知識進行有用編碼,融進深度神經網絡,支撐多元數據的形式發掘與關聯建模面臨挑戰。

多來源、跨學科知識關聯復雜,使得跨領域知識穿插融會剖析極具挑戰。在空間科學實驗研討領域,多學科穿插的佈景使得AI4S有機會打破學科間的壁壘,推動分歧領域間的深度融會與協同創新。例如,流體力學中常用的粒子圖像測速方式。可在空間生物實驗頂用于追蹤細胞的運動,也可在微重力物理實驗頂用于追蹤流化床內顆粒的運動。但是,分歧學科及來源的數據和知識既具有各自獨特的結構體系,又有錯綜復雜的關系,這使得借助AI技台北 水電行術實現數據的有用關聯和知識的深度融會成為一項至關主要的挑戰。

具體而言,空間科學實驗研討的跨領域信息融會面臨3個難點:異構數據標準化。分歧領域的空間科學實驗數據具有迥異的結構和內涵。為促進數據共享,需求樹立統一的數據標準,并努力實現高效的異構數據標準化。多源數據關聯。空間科學實驗剖析觸及多來源的數據:傳感器測量值、視頻圖像、文獻書籍等。多源數據之間的關系(如燃燒實驗中視頻像素大安區 水電值與溫度值的對應關系)復雜、隱晦而多變,難以被通用算法所預測。需求結合科學實驗數據的物理模子與AI的學習才能,實現準確高效的數據關聯剖析。跨領域知識關聯。一方面,需求中正區 水電行構建領域知識圖譜,刻畫學科自己的知識體系;另一方面,需求消解多學科之間的專業隔閡,提醒跨領域知識的內在聯系與類似性。例如,空間流化床實驗的科學家盼望實現對大批顆粒的群體追蹤,需求AI模子供給其他領域內相關的知識和方式。而年夜語言模子通過將海量數據信息映射至配合的語義空間,有才能通過語義類似性、發掘分歧學科知識之間的聯系。

空間科學實驗領域發展與思慮

空間科學實驗數據形式發掘與剖析

針對空間科學實驗領域的數據形式發掘與剖析,重點包含時序數據形式發掘和科學實驗圖像/視頻智能剖析娘坐在轎子上,一步步被抬到未知的新生活無關。兩方面。

在時序數據形式發掘方面。空間科學實驗載荷產生海量結構化遙測時序數據,通過整合分歧來源的數松山區 水電行據進行發掘,應用基于深度學習的數據預測模子,結合在線學習方法實時調整模子,可以深刻剖析實驗載荷系統的關鍵參數和主要的特征表征因子,提醒復雜形式、趨勢和關聯,進步實驗載荷毛病風險預測的才能。同時,融會領域知識圖譜進行因果關系發掘,進步模子結果的可托度和可解釋性,為毛病根因定位和復雜現象懂得供給主要技術支撐。

在空間科學實驗圖像/視頻智能剖析方面。通過研討實驗目標檢測、實例朋分、實驗目標追蹤、實驗目標行為和形式剖析及實驗目標三維重建等眾多關鍵技術,可以實現對空間生物、動物、植物實驗圖像的高效剖析和懂得。這些技術支撐了定量剖析和可視交互剖析,為科學家供給了豐富的數據基礎和更立體的觀察視角。結合領域知識的增強,可以實現更高層次的推理與實驗目標行為、生長等形式發掘,進而推動空間科學實驗領域的深刻研討和創新發現。

通過整合時序數據形式發掘和科學實驗圖像/視頻智能剖析,結合領域知識增強方式,可以實現對領域新知識的發掘,推動空間科學實驗研討和創新的發展。

空間科學實驗領域知識的發現與推理

空間科學實驗海量數據中蘊含了豐富的、散亂的、待發掘的領域知識。空間科學實驗領域知識的發現與推理旨在整合多源數據,融會剖析多源數據中的關鍵信息并智能提取領域知識,樹立領域知識體系,以促進更周全的空間實驗現象懂得和提醒深層次規律水電網

針對領域數據多源異構特徵,基于統一表征學習方式,將在軌實驗、空中培養與同步實驗、空中鏡像等產生的多源信義區 水電數據進行表征信息提取,將分歧的特征映射到統一的知識表現空間中。結合實體識別、關系抽取等領域知識抽取方式,提取空間科學實驗領域知識,并基于知識表現、知識融會、知識推理方式,完成分歧來源知識的消歧和對齊,將對齊的多源數據和獲取的領域知識從概念層和實例層對齊后再次融會到全局視圖的知識圖譜中,構建空間實驗領域知識圖譜,樹立領域知識概念和體系。同時,基于已有知識基礎,應用知識推理技術方式推導出新的未知的知識,提醒未知領域的潛在知識與關聯信息,促進空間科學實驗領域新的科學發現。

空間科學實驗多來源、跨學科數據智能融會與協同創新

在空間科學實驗研討中,信息的標準化共享、數據的關聯剖析與知識的融會推理配合構成了跨領域協同創新的基礎。多源異構數據標準化與管理。為確保數據的標準化共享,需求構建空間科學實驗領域統一的數據標準和規范,明確各類數據的格局、結構、存取方法等。在此基礎上,結合AI算法與模子,實現多源異構數據的自動標準化與高效管理。基于AI的多源數據剖析。結合人類認知與AI技術,通過圖像、可視化等手腕展現數據,并供給AI算法的演算結果,提醒多源數據中復雜的關系,引導科學家深刻摸索實驗規律。跨學科知識融會與推理。應用AI模子從科技文獻中提取知識實體與關系,構建學科知識圖譜,通過算法婚配分歧圖譜中的類似實體與關系,提醒各領域科學道理與思緒方式的類似性,以促進跨領域的結果共享與協同創新。

空間科學實驗領域年夜模子的應用

領域年夜模子能夠晉陞領域數據特征表現的才能。通過構建統一的、跨場景、多任務的多模態空間科學實驗領域基礎年夜模子,樹立空間科學實驗物理量、文本、圖像、視頻等多模態數據間的語義關聯,發掘潛在關聯關系,摸索多模態科學實驗數據剖析與懂得的技術前沿,為科學實驗年夜數據發掘、知識圖譜構建、圖水電像/視頻智能剖析與懂得、智能輔助決策等供給可計算的關于多模態數據的結構化表現,為面向空間科學實驗領域多模態數據的智能化剖析與應用供給有用的技術支撐。構建強年夜的空間科學實驗剖析年夜模子基座,圍繞空間科學實驗領域年夜模子可以構建“平臺協作式”的AI4松山區 水電行S科研形式,適應不斷變化的數據和實驗場景,年夜幅進步科學研討效力,有用晉陞實驗數據處理、知識庫構建、復雜形式發掘、可視化與可視剖析等才能,促進多學科知識深度穿插融會和嚴重科學發現。

基于年夜模子的圖像智能剖析。中國空間站將在空間性命科學與生物技術、微重力流體物理與燃燒科學、空間資料科學、水電 行 台北微重力基礎物理等領域展開上千項研討項目。年夜模子在圖像智能剖析應用中具有主要感化,助力“作坊式”個性化的研發形式向“平臺協作式”轉型。年夜模子通過在海量圖像/視頻數據上進行預訓練,實現通用特征提取網絡,為特定實驗專業需求的子任務供給智能輔助剖析支撐,實現下流多任務的靈活自適應,下降單一任務的數據標注本錢和算法研發周期。例如,基于年夜模子的空間性命實驗對象實例朋分算法,依賴海量領域數據的預訓練,無望實現零樣本或少樣本的新實驗數據剖析的應用。

基于年夜模子的領域知識圖譜。年夜模子可以增強空間科學實驗領域知識圖譜的構建與應用才能。應用年夜模子的自監督表征學習空間科學實“你婆婆只是個平民,你卻是書生家的千金,你們兩個的差距,讓她沒那麼自信,她待你自然會平易近人,和藹可親。”女兒驗有關的多模態數據,實現多源數據的整合、信息互補和語義周全表達,并進行實體、關系、事務等領域知識提取,構建空間科學實驗領域內的知識圖譜;知識圖譜智能問答、知識關聯剖析等應用將進步知識圖譜智能化應用的機能和後果信義區 水電行,為解決領域專業性強、復雜度高的知識發現與應用問題奠基堅實基礎。

基于年夜模子的信息關聯與跨模態檢索。空間科學領域實驗包括文本、圖像、視頻、語音等多模態數據,使得科學家難以高效搜刮感興趣的信息。年夜模子,尤其是基于對比學習的模子如CLIP(contrastive language-image pretraining)等,通過自監督學習方法構建,能夠統一表征空間科學領域實驗多模態數據語義信息,進步數據跨模態檢索機能,這有助于科學家從海量數據中疾速、準確地找到有價值的信息,有用進步數據應用效力。

基于年夜模子的空間科學實驗載荷在軌運行毛病預測。基于具有空間科學實驗載荷毛病風險預警與根因定位才能的基礎年夜模子,應用其強年夜的數據表征、整合和剖析才能,深刻發掘實驗載荷多源工程遙測數據之間的關系,識別異常形式和變化趨勢。通過年夜模子在語義懂得、數據整合方面的技術優勢,進步科學實驗載荷的運行毛病預測精度與效力,保證各空間科學實驗載荷的平安、穩定在軌運行。

基于年夜模子的空間科學實驗數據可視化與可視剖析應用。年夜模子結合天然語言懂得與天生才能,使科學家能夠通過對話方法驅動高效的數據檢索與處理。結合可視剖析,通過天然語言描寫天生可視化結果,構成可視剖析系統。應用“CUI+GUI”的形式發揮年夜模子在科學家意圖懂得和數據智能剖析方面的才能台北 水電 行,充足應用可視剖析在數據直觀展現和關聯剖析方面的獨特優勢,是一種創新且高效的空間科學實驗數據剖析形式如在微重力空間科學實驗領域將發揮主要感化。

以上有關應用示例展現了年夜模子在空間科學實驗領域的多個方面的潛在感化,為科學研討、實驗數據剖析和實驗載荷在軌運行決策等供給了新的能夠性和技術支撐。

總結與瞻望

中國空間站是我國最年夜的空間綜合研討實驗平臺,將開展近千項先進性和前瞻性研討項目,并獲取海量、多源、高價值的科學數據,為開展AI賦能的跨學科智能認知供給基礎。本文聚焦中國空間站空間科學實驗領域,總結了領域的多學科優勢以及年夜數據特點,剖析了領域所面臨的問題和挑戰,提出了發展與思慮。最后,希冀通過加強領域優勢、樹立開放生態等舉措,配合推動空間科學實驗領域年夜數據發掘與智能認知的不斷發展。

空間科學實驗領域研討已成為AI4S領域的主要前沿陣地。空間科學實驗作中山區 水電行為AI4S科學的主要領域,擁有年夜規模實驗數據,尤其隨著中國空間站建成國家太空實驗室,將長期在軌開展各個學科領域的空間科學實驗,蘊含著眾多的機遇,在科技前沿方面具有顯著的優勢。空間科學實驗領域是AI4S的主要試驗陣地。空間科學實驗領域橫跨多個學科,包含空間性命科學與生物技術、微重力流體物理與燃燒科學、空間資料科學、微重力基礎物理等,為AI4S范式的研討供給了豐富的試驗場;空間科學實驗領域數據生態將為AI4S的研討供給主要支撐。該領域的數據通過統平生態平臺下載和分發,呈現較好的統一性、規范性。相對于空中各科學領域數據共享水平缺乏的問題,空間科學更不難構建統一的面向AI就緒(Ready4AI)的數據中間,為新型AI范式的摸索供給無力支撐;空間科學實驗的跨學科協同將無力推動AI4S的發展。空間科學實驗領域屬于系統工程,需求載荷專家、技術專家和科學家配合協作,團隊具備跨學科的協同優勢,更有利于推動新型科研范式的摸索。是以,以AI驅動信義區 水電行的空間科學實驗研討在AI4S中擔當著先鋒腳色,為推動科學研討和應用領域的創新發展貢獻著獨特的氣力。

數據驅動的空間科學實驗研討需求空間科學實驗和AI領域的穿插人才。空間科學實驗領域科學家與AI專家的專業佈景、學科差異年夜,彼此懂得水平低,彼此相互促進的障礙依然較年夜。可是,AI4S屬于穿插學台北 市 水電 行科,需求專業領域科學家提出科學問題,AI專家發揮技術才能,同時還需求摸索已有知識若何融進智能模子,抽象出AI擅長的科學剖析場景,彼此協作,才有能夠在科學領域促進認知智能的涌現。

構建AI4S的空間科學實驗領域開放共享生態的需要性。近年來,AI領域的技術發展之所以這般之快,很年夜水平得益于其開放的年夜規模公開數據集,以及開源的算法研發形式。可是,AI在科學智能領域存在必定瓶頸,這與科學數據加倍專業、準松山區 水電行進門檻更高、通用性更低有必定關系。為了促進AI4S領域的發展,構建開放共享數據生態非常需要,這有助于領域科學家、AI專家更便捷獲取數據,更多的團隊參與進來,配合促進、加速領域的發展非常無益。此外,AI算法的研發需求更多的數據、更年夜的算力支撐,單一的科學實驗室較難滿足數據與資源的需求。通過構建基于云計算的年夜算力基座、海量豐富場景數據、開源共享協同算法的空間科學實驗研討生態和支撐平臺,促進傳統“作坊式”的科研形式向新一代AI4S范式轉變。

(作者:李盛陽、劉康、劉云飛,中國科學院空間應用工程與技術中間 中國科學院太空應用重點實驗室 中國科學院年夜學航空宇航學院;賴楚凡,中國科學院空間應用工程與技術中間 中國科學院太空應用重點實驗室。《中國科學院院刊》供稿)

Tags :

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *