每日經濟新聞 2021-07-13 15:01:37
◎脈沖星是宇宙中較為暗淡的星體,肉眼不可見,信號暗弱,且容易被人造電磁波干擾。之前,天文學家們每天需要從FAST拍攝的海量信號圖中,肉眼識別出脈沖星。
◎而借助AI+云計算的技術能力,3天就可以處理完原來需要人工用1年才能完成的數據工作量,照此計算,AI的數據處理效率比人工提升了120倍。
◎AI在天文領域的應用的確是基礎,有了AI的能力,脈沖星數據預處理和信號的發現效率會越來越高,準確率也會不斷提高。
每經記者|劉玲 每經編輯|文多
3月27日,工作人員在“中國天眼”總控室內。圖片來源:新華社
7月10日,2021世界人工智能大會(WAIC)在上海落下帷幕。在經歷過三次潮起潮落后,人工智能已然褪去了神秘的外衣,這屆大會似乎也更加“務實”了。正如華為輪值董事長胡厚崑逛完展覽后的最大感受:“酷炫”的技術少了,實際落地的AI應用多了。
比如在開幕式上,李彥宏分享了AI在共享無人車、智慧助老領域的落地——計劃未來2~3年將共享無人車服務推廣到30個城市,同時會推出“更像機器人“的汽車;又如董明珠提到的AI對制造業帶來的顛覆性革命,可幫助打造“黑燈工廠”等等。
而騰訊則把AI的目光放到了137億光年外,與國家天文臺聯合啟動“探星計劃”,幫助中國天眼FAST尋找脈沖星。AI行業人士表示,經過多年的發展,AI技術的服務邊界不斷在拓寬,已從“腳踏實地”發展到“仰望星空”,越來越多行業將被重新定義。
大會結束后,《每日經濟新聞》記者采訪了中國科學院國家天文臺研究員、FAST首席科學家李菂,騰訊云副總裁、騰訊優圖實驗室總經理吳運聲,騰訊優圖實驗室副總經理黃飛躍,深入探討了AI在天文探索中的應用和難題,以及如何拓寬AI服務邊界。
FAST的全稱為“500米口徑球面射電望遠鏡”(Five-hundred-meter Aperture Spherical radio Telescope),是世界上最大的射電天文望遠鏡,也是中國有史以來最大的天文工程,工程的核心目標在于搜尋與發現射電脈沖星。
據了解,脈沖星會周期性發射電磁波,被稱作宇宙中的燈塔,是研究宇宙演化的理想天體。然而如何發現和確定脈沖星的存在,一直是天文領域難度較高的研究:脈沖星是宇宙中較為暗淡的星體,肉眼不可見,信號暗弱,且容易被人造電磁波干擾。
圖片來源:騰訊提供
上圖是“中國天眼”FAST捕捉到的一張“脈沖星”信號圖,普通人很難從信號圖中看到星星的痕跡。李菂告訴《每日經濟新聞》記者,天文學家們每天需要從FAST拍攝的海量信號圖中,肉眼識別出脈沖星。
肉眼識別的工作量有多大呢?吳運聲表示,FAST每天將會產生500TB的數據,它在一周內產生的脈沖星觀測數據,大約是3000多萬張信號圖,如果完全由人工肉眼處理,即使不吃不喝,1秒一張審核,也需要一年時間才能才能處理完。
“數據是對電磁場的高速采量,在這上面做信號處理和頻譜分析,得到一個視頻動態譜。一個維度是時間,一秒鐘700轉,有1萬個點;另一個維度是頻率,1秒鐘1萬譜。”李菂說道,“人眼是沒辦法處理的,因為太快了,(所以)我們處理的大多數情況是照片,把它截出來。但截出來以后可能量還是太大了,所以要做進一步地信息提取。”
如此巨大的數據量困擾著天文學家們。在距離FSAT一千多公里的深圳,騰訊優圖實驗室的研究員們也在進行頭腦風暴,試圖尋找更多AI落地的場景。
黃飛躍向記者回憶道,今年初,騰訊優圖實驗室的幾位天文愛好者提出,可以將計算機視覺技術用于天文學中對脈沖星的搜索。于是,騰訊優圖實驗室便聯系了國家天文臺,雙方一拍即合,達成了合作意向。
“我們是一個很小的行業,雖然目前也有運用機器學習和人工智能技術,但我們缺乏一線的,在底層做開發的能力,這就是為什么我們愿意跟有專業背景和架構的單位合作,這種合作產生的效益也比較快。”李菂表示。
據吳運聲透露,借助AI+云計算的技術能力,3天就可以處理完原來需要人工用1年才能完成的數據工作量,照此計算,AI的數據處理效率比人工提升了120倍。黃飛躍表示,AI在天文領域的應用的確是基礎,有了AI的能力,脈沖星數據預處理和信號的發現效率會越來越高,準確率也會不斷提高。
3月29日,晚霞中的“中國天眼”全景。圖片來源:新華社
雖然AI的加入,讓脈沖星的探索效率大幅提升。但是黃飛躍告訴《每日經濟新聞》記者,利用人工智能探星并沒有那么容易,還有幾大難點需要克服。
首先,AI需要進行深度學習訓練,其核心需求便是:擁有海量已標注的數據作為訓練數據,用它們來調整優化算法模型。但天文研究里,帶有標注的訓練數據相對偏少,會給模型訓練帶來困難。
其次,同樣的天體信號,用不同望遠鏡、不同的觀測設備,得到的數據和展現形式并不相同。“缺少標注的數據,我們可以用自監督的學習方法。不同設備得到的數據,我們可以用跨域學習的方式來訓練模型。”黃飛躍表示。
雙方合作后,騰訊優圖實驗室第一步便是對FAST采集的數據進行預處理。黃飛躍介紹,FAST一天采集到的數據大約有500T,如何將這500T數據轉換成更有效的數據呢?實際上就是要做一系列的原始信號處理,處理后就能夠大幅加速篩選的效率。
“另外,對信號我們會用機器學習的方式來尋找疑似樣本,再交給專業的人員看是不是真正發現了信號。后續我們的新算法將會進一步提高準確率,降低后期專業人士的人為篩選的工作量。”黃飛躍表示。
據了解,除了脈沖星,騰訊還將通過AI重點輔助搜索輻射模式更特殊、天體運動更復雜的天文現象,例如“近密雙脈沖星”和“快速射電暴”等。其中,“近密雙脈沖星”是特殊的天體系統,由于其復雜的運動模式很難被現有算法發現。
探索難度大、AI投入高,騰訊與國家天文臺“探星計劃”能不能實現商業化呢?對此,吳運聲坦言,此次合作并沒有考慮收益點,“不管是優圖還是騰訊,我們不是每件事情都要考慮它的經濟價值,從之前的AI尋人到這次的探星計劃,跟實際的經濟收入都沒有什么關系,都是促進社會的可持續發展”。
應用于智能美育的作畫機器人 圖片來源:每經記者 夏冰 攝
過去幾年間,在技術進步和規模化應用的推動下,AI芯片算力成本不斷下降:TOPS(每秒可進行一萬億次運算)的成本從千元降到了幾百元。而進入2020年,AI芯片算力成本更是步入100元級。
在AI芯片算力成本降低的同時,算法的效率卻大幅提升。在應用層面上,龍頭企業在近幾年商業落地的過程中,不斷積累了大量的行業know-how,也大大開拓了AI的智能化應用場景和邊界。
在2021世界人工智能大會現場,可以看到坐擁130000詞條的“云上辭海”、可以體驗探知AIWIN賽事前世今生的AR眼鏡、也可以觀摩技藝嫻熟的調酒機器人,人工智能的應用場景已經滲透到我們生活的方方面面。
正如李彥宏在演講中提到,人工智能將會是影響未來40年人類發展的變革力量。這個力量今天正在不斷地積蓄,在交通、金融、工業、能源、媒體等各行各業,人工智能技術的應用,都給出了行業數字化升級的新思路和新解法。甚至,它已經開始重塑整個行業的面貌,進而影響人類社會的未來。
不管是百度推出的新一代共享無人車Apollo moon,還是格力的“黑燈工廠”,抑或是騰訊與國家天文臺的“探星計劃”,實質上都是在不斷拓寬AI的服務邊界。
胡厚崑也在演講中提出,“大膽運用技術手段去突破當前AI普惠的瓶頸”。不過,在他看來,當前的瓶頸不是在技術和應用的需求上,而是在開發的效率上,“現在AI開發的效率太低,嚴重阻礙了技術和需求的結合,現在的模式還是比較傳統的手工作坊的模式”。
對此,吳運聲稱,AI落地的前提是要深入行業。不同的行業信息化程度不同,因此解決方案也需要調整。例如,金融客戶的信息化水平較高,無需提供完全的解決方案,而一些傳統的工業企業由于信息化能力較弱,則需要直接解決問題的方案。“各個行業的階段不太一樣。我們要在不同行業洞察其適用AI的特點。”吳運聲說道。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP