飛象網(wǎng)訊(易歡)數(shù)字化時代,開源已逐漸成為軟件開發(fā)的重要模式,已成為賦能數(shù)字經(jīng)濟高質(zhì)量發(fā)展的原動力,是推動數(shù)字技術創(chuàng)新的重要抓手,對于技術創(chuàng)新、產(chǎn)業(yè)開放、經(jīng)濟提振、全球可持續(xù)發(fā)展具有重要價值。與此同時,新一代人工智能、大數(shù)據(jù)、云計算、工業(yè)互聯(lián)網(wǎng)、區(qū)塊鏈等技術領域正結合開源,呈現(xiàn)出技術與產(chǎn)業(yè)協(xié)同共進共融的態(tài)勢。那么,目前開源究竟進展如何,下一代開源具備哪些特性,開源又面臨哪些風險,在近日舉辦的2023 OSCAR開源產(chǎn)業(yè)大會上,我們得到了一些答案。
全球開源生態(tài)穩(wěn)中向好,持續(xù)突破圈層向邊界滲透
毫無疑問,開源已成為賦能數(shù)字經(jīng)濟高質(zhì)量發(fā)展的原動力。中國信息通信研究院云計算與大數(shù)據(jù)研究所副所長栗蔚表示,在過去一年,全球開源生態(tài)穩(wěn)中向好,全球開源生態(tài)持續(xù)突破圈層并實現(xiàn)邊界滲透,形成項目、技術、區(qū)域、社會四個層面的跨越式發(fā)展趨勢,有力激發(fā)社會科技創(chuàng)新突破,有效提升社會經(jīng)濟體量,幫助全社會形成多邊而緊密的全球化合作分工格局,全面助力數(shù)字社會發(fā)展。
在項目層面,開源生態(tài)逆勢上揚。全球開源軟件項目數(shù)量增速逆勢上揚,2022年GitHub托管倉庫已達3.5億,新增倉庫9000萬個,增長率達33%,近三年內(nèi)首次增速提升。同時,全球項目方面開源生態(tài)異常活躍,生態(tài)規(guī)模持續(xù)擴大。此外,開源軟件項目“馬太效應”凸顯,頭部項目“斷層式領先”。值得一提的是,開源工具和平臺融合前沿技術,變革開源開發(fā)過程,如GitHub推出Copilot X計劃,將chatGPT-4引入IDE,使得開發(fā)者在整個開發(fā)流程中獲得更多全新體驗,如語音生成代碼、自動發(fā)現(xiàn)bug、自動解釋輸入代碼、自動完善Pull Request等變革性開發(fā)功能。
在技術層面,開源生態(tài)具備差異化發(fā)展路徑。開源已成為全球多技術領域創(chuàng)新主流模式,2022年在全球核心技術領域生態(tài)體系中,大前端領域開源軟件項目占比高達97%,人工智能、區(qū)塊鏈、操作系統(tǒng)等領域開源軟件項目占比也超過80%,開發(fā)工具和環(huán)境、云計算領域開源軟件項目占比超60%。開源逐漸改變軟件領域的競爭方式和市場格局,但在主流技術領域,開源生態(tài)發(fā)展階段差異較大,各自優(yōu)勢明顯。
在區(qū)域?qū)用妫_源熱點地區(qū)發(fā)展成熟。目前,美歐仍是開源主導力量,引領開源生態(tài)高速增長。其中,美國開源項目全球占比超四成,是開源軟件項目主要供應大國。根據(jù)中國信息通信研究院統(tǒng)計分析,截至2023年2月,在全球活躍度排名前100的開源軟件項目中,美國開源軟件項目占比45%,牢據(jù)第一。中國開源軟件項目占比17%,排名第二。此外,全球新興經(jīng)濟體國家紛紛投入開源生態(tài)建設。
在社會層面,開源生態(tài)公共價值凸顯。開源模式助推數(shù)字公共產(chǎn)品成為數(shù)字時代社會公共基礎設施,各國紛紛出臺相關政策以在未來競爭中搶占先機。
開源從通用向場景化轉(zhuǎn)化 更需與現(xiàn)實世界適配
“如今開源已取得巨大成功。從生態(tài)規(guī)?,全球開源生態(tài)成熟繁榮,全球開源軟件項目高速增長,覆蓋當前主流技術領域,全球開源貢獻者儲備規(guī)模龐大。從行業(yè)應用看,全球行業(yè)開源逐步興起,各行業(yè)應用開源模式建立產(chǎn)業(yè)開放供應鏈,提升生產(chǎn)效能。” 中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏講到。他表示,開源模式正在引領科技實現(xiàn)越來越多的突破。
近年來,開源的經(jīng)典定義面臨著新的挑戰(zhàn)與重構,尤其是來自云計算、大數(shù)據(jù)、大模型和AIGC的挑戰(zhàn),讓開源早已不在局限于通用領域,更多轉(zhuǎn)向聚焦于數(shù)據(jù)、服務等場景化開源。隨著大數(shù)據(jù)尤其是數(shù)據(jù)資產(chǎn)化,開放數(shù)據(jù)和數(shù)據(jù)流通成為一種新“開源”模式。數(shù)據(jù)通常是事實和信息的表達,而版權通常適用于原創(chuàng)創(chuàng)作的表達形式,版權通常不適用于數(shù)據(jù)資產(chǎn)。AI大模型涉及的開放許可證類型更為復雜。僅Hugging Face上開源的人工智能模型就超過28萬,涉及66個開源協(xié)議。何寶宏指出,開放許可協(xié)議的基石可分為幾個階段:軟件著作權—>著作權—>知識產(chǎn)權—>知識產(chǎn)權+。涉及到開放數(shù)據(jù)和開源大模型許可協(xié)議,更需要考慮使用場景、商業(yè)收益和科技倫理問題。
當軟件從產(chǎn)品成為服務,當開放的對象從代碼延展到數(shù)據(jù)和模型,當開放許可的法律基礎從版權延展所有權,當代碼生成主體從自然人的程序員延展到AIGC,當開源與現(xiàn)實中的法規(guī)制度、隱私保護和科技倫理日益密切時,下一代開源將更需要與現(xiàn)實世界適配。
開源軟件促進會OSI(open source initiative)對于開源提出了十個條款,包括:自由再發(fā)布、源代碼公開、允許派生作品、作者源代碼完整性、不能歧視任何個人或團體、不能歧視任何領域、許可協(xié)議的發(fā)布、許可協(xié)議不能只針對某個產(chǎn)品、許可協(xié)議不能約束其他軟件、許可協(xié)議必須獨立于技術。目前,OSI已啟動Open Source AI的定義討論工作,定義了開放數(shù)據(jù)和人工智能系統(tǒng)的基本原則,涉及數(shù)據(jù)安全、版權所屬、監(jiān)管要求、道德倫理、責任認定等多個方面。
總體而言,何寶宏認為,下一代開源需要從兩方面進行規(guī)范:一方面,開源應該與現(xiàn)實社會深度融合,遵守現(xiàn)實治理規(guī)則,如:監(jiān)測統(tǒng)計、自律公約、責任邊界、安全防護;另一方面,開源的發(fā)展也需要跟隨社會長期性和周期性的發(fā)展規(guī)律。
開源風險日益復雜,治理體系有待完善
盡管開源有力激發(fā)了科技創(chuàng)新突破,構建了產(chǎn)業(yè)發(fā)展新格局,但開源安全、供應鏈、合規(guī)等風險在行業(yè)應用過程中日益復雜,企業(yè)治理現(xiàn)狀差,60%的企業(yè)缺少開源治理規(guī)劃或目標、53%的企業(yè)缺乏開源軟件評估模式、60%的企業(yè)無開源合規(guī)管理流程。
栗蔚表示,當前,開源風險狀況未見明顯改善,仍需各行業(yè)高度重視。開源安全漏洞風險日益加劇,部分行業(yè)高風險漏洞修復緊迫性凸顯;開源許可證風險問題顯著,亟需提升開源使用者版權意識;軟件供應關系日趨復雜多元,開源供應網(wǎng)絡風險問題不斷升級。因此,企業(yè)開源治理進入高速發(fā)展期,諸多領域仍待完善。例如:企業(yè)缺乏開源治理戰(zhàn)略性規(guī)劃和制度指導,內(nèi)部存量軟件管控力度不足;開源軟件評估模式尚待完善,開源治理顆粒度仍需細化;企業(yè)開源合規(guī)管理能力相對薄弱,第三方軟件管理有待規(guī)范等。
此外,數(shù)字公共產(chǎn)品的發(fā)展和使用面臨多方面風險挑戰(zhàn),如:隱私和數(shù)據(jù)安全風險、數(shù)據(jù)質(zhì)量和準確性風險、法律和道德風險、可持續(xù)性風險、社會影響風險,因此數(shù)字公共產(chǎn)品的風險治理需要多方參與和合作。通過多角度綜合治理,能夠推動數(shù)字公共產(chǎn)品的可持續(xù)發(fā)展實現(xiàn)社會利益最大化。
栗蔚指出,放眼未來,全球開源生態(tài)將呈現(xiàn)四大趨勢:一是開源項目的繁榮發(fā)展將遵循技術螺旋發(fā)展的本質(zhì)脈絡;二是新技術應用將擴充軟件開發(fā)方式,進而提升開源協(xié)作效率;三是行業(yè)開源將從開源軟件應用到開源模式應用;四是開源治理落地將經(jīng)歷長周期發(fā)展,開源風險在集中暴露之后趨于平穩(wěn)。
對于我國開源發(fā)展,栗蔚也提出了建議,項目運營方面,我國應通過大力發(fā)展多樣化社區(qū)運營組織形式繁榮開源生態(tài);基礎設施方面,我國應不斷提升基礎設施生態(tài)影響力及安全保障能力,優(yōu)化開源生態(tài)發(fā)展環(huán)境;風險治理方面,我國應加快以開源安全標準帶動開源治理體系落地;行業(yè)應用方面,我國應以軟件開源帶動行業(yè)開源,形成全社會開源產(chǎn)業(yè),提升開源生態(tài)價值;人才培養(yǎng)方面,我國應完善人才培育與激勵機制,充分發(fā)揮個體的主觀能動性,支撐開源生態(tài)建設。