互聯網標準文檔RFC之于互聯網用戶,如同空氣之于普通人,它透明、隱形,讓人意識不到其存在,但同時它又無比關鍵、必要,賦予了互聯網真正的生命與活力,使其在幾十年的發展中愈發蓬勃。
RFC的概念與意義
RFC(Request for Comments),即征求意見稿,是由互聯網工程任務組(簡稱IETF,是世界上唯一的國際性、非政府、開放性的互聯網技術開發和標準制定組織)發布的一系列備忘錄,包含了關于互聯網的重要文字資料??梢哉f,如果一項技術想要成為全世界軟件開發商、硬件制造商以及網絡運營商自愿實施的標準和遵守的規范,那么成為RFC是它的必經之路。
IETF表示,但凡在“電線之上和應用程序之下”(above the wire and below the a pplication)的內容,都屬于他們的工作范圍,而RFC的研究范疇亦是如此。從數據鏈路層、網絡層、運輸層、會話層到表示層、應用層,互聯網的各個層級都是它的研究目標。得益于網絡層中的IP地址、路由和應用層中的域名系統,互聯網大廈從此有了穩固、堅實的基礎。而在應用層HTTP、HTTPS協議相關RFC與傳輸層WebRTC等協議RFC出現后,全世界幾十億人才可以每天安全地瀏覽網頁、收發電子郵件并參加線上會議。
第一篇RFC誕生于1969年,那時互聯網還尚不存在,只有阿帕網四大研究中心(加州大學洛杉磯分校、斯坦福研究所、加州大學圣芭芭拉分校和鹽湖城猶他大學)的四臺計算機連接成的ARPA網。
而就在這一互聯網的孕育階段,加州大學洛杉磯分校的學生斯蒂芬·克羅克撰寫了第一篇RFC。RFC 1定義了ARPA網上主機間通信所使用的“IMP軟件”,真正實現了軟件可移植性的設想,是日后互聯網標準化工作的基石。而克羅克也成為發起RFC的第一人,RFC也正式成為說明、記錄、分享互聯網標準與協議的文檔。
RFC通常起始于由個人或多人共同編寫的互聯網草案。這些草案需要被IETF的某個工作組采納,之后,工作組需要與互聯網工程指導組(IESG)及IETF進行多輪商議,并根據反饋對草案進行改進與修訂。最終,當草案得到所有IESG的成員認可后(no comment),便可送交給RFC編輯部,授予RFC編號,進行文字編輯和格式協定,最終成為RFC發布。從始至終,都有一套定義明確的流程指導著草案的審議和進展,同時并非每一個草案都可以成為RFC。
近二十年RFC的變化趨勢
任何人都可以從https://www.rfc-editor.org/rfc-index.html這個網頁上看到迄今為止所有的RFC。
截至2023年5月31日,一共有9411個RFC。從2003到2023年這二十年,RFC的產生數量起伏不定。2006年,RFC的數量達到二十年以來的高峰,共計459篇RFC在該年發布;而在2019年,RFC的數量又走向了二十年中的最低點,僅有180篇RFC在該年發布。
實際上,當我們一同回顧互聯網的歷史,就會發現RFC的數量與互聯網的發展 “同氣連枝”:前者“哺育”了后者,同樣,后者也促進了前者的誕生。
2006年,互聯網進入一個應用創新高峰。短短一年中,視頻網站YouTube成立,其出現徹底改變了互聯網視頻分享的方式,開創了視頻社交新時代;同年,Facebook成為流行,雖然Facebook在2004年就已成立,但直到2006年,它才突然成為主流社交媒體,吸引了大量新用戶,并從僅限高中和大學生使用的軟件,轉變為覆蓋所有人的全球性社交網絡,與Facebook相似的社交網站Twitter也同樣廣受歡迎;在此基礎上,搜索引擎和社交網絡上的廣告內容也大幅增加,網絡廣告開始取代印刷廣告,互聯網經濟也由此萌發。
受到社交軟件、網站用戶量迅速增長的刺激,2006年,很大一部分RFC以各類與信息傳輸相關的互聯網協議為主題,例如LDAP協議、SRTP協議與IMAP協議。具體來說,LDAP協議用于從目錄服務器中查詢和更新目錄信息,而目錄服務器中存儲有關各種對象(通常是網絡資源)及其屬性的信息。因此,LDAP常用來查詢用戶、計算機及其他網絡資源的信息,如名稱、電話號碼、地址、權限等,而這些信息正是社交網站上用戶的基礎信息。
而SRTP協議則是一種用于VOIP和視頻通話的安全傳輸協議。它提供了加密、消息認證和會話密鑰管理的功能,用于保護更為基礎的實時傳輸協議RTP中的報文內容。由于RTP本身沒有安全機制,傳輸內容可能被竊聽或篡改,因此,若想保障社交網站中信息交流的安全,SRTP協議的存在必不可少。
圖1 每年RFC發布數量
從折線圖1中可見,2006年后,2011年的RFC數量又出現了明顯的上升趨勢,而2011年也發生了轟動互聯網的大事件——前CIA雇員愛德華·斯諾登向媒體泄露了有關美國國家安全局大規模監控計劃的信息,進而引發全球對網絡監控與隱私保護的廣泛關注。因此,在2011年,討論IP、加密與信息安全等相關問題的RFC數目明顯有所增加。
更重要的是, 在2011年前后,全球IPv4地址已經基本分配完畢。然而,當時IPv6還無法做到廣泛部署,IPv4和IPv6需要共同存在以支撐互聯網的正常運行,在此基礎上,雙協議棧、NAT64等技術成為該年RFC中的重要主題。同時,雖然當時大部分互聯網仍運行在IPv4之上,但是IPv6的部署也在同步增長,美國、歐洲等地的大公司已開始試點部署IPv6,因此,有關IPv6推廣、部署以及相關標準的RFC的數量也有所增加,使2011年的RFC數量攀上了又一個高峰。
我國主要的RFC貢獻者
1996年3月,在第一個RFC出現27年后,清華大學提交的《互聯網消息的漢字編碼》(Chinese Character Encoding for Internet Messages)被IETF通過為RFC 1922,成為中國大陸第一個被認可為RFC文件的協議,也是我國的第一個信息類RFC。該RFC中提出了適應不同國家和地區中文編碼的漢字統一傳輸標準,解決了當時存在的三種漢字編碼方案不統一的問題。
此后,中國研究人員和單位所撰寫的RFC數量漸次增加,我國作者對互聯網技術開發與標準制定中的貢獻也逐漸凸顯。尤其是自2013年第88屆IETF會議以來,中國始終是參會人數第二多的國家。這些參與既給中國為互聯網核心技術發展貢獻力量提供了機會,也激勵中國作者發表了越來越多的RFC。
圖2 各國家/地區每年發表RFC的作者數量
由圖2可見,美國、歐盟作者數量始終處于高位,而在2003至2010年之間,中國作者的數量每年都在緩慢增加,并在2008年至2011年時逐漸超越了日本、英國、德國、加拿大和法國等國家,成為年發表作者數量第二高的國家。特別地,在2010年北京召開第79屆IETF大會后,直到2019年的9年之間,中國作者的數量都始終保持在75名之上,且直到2022年,中國依舊是每年作者人數第二高的國家。
經統計后可得,過去20年以來,我國發表過RFC的機構共有23家(表1)。其中,不管是參與撰寫的RFC數量,還是作為第一作者撰寫的RFC數量,又或是撰寫過RFC的作者數量,華為、清華大學、中興、中國移動以及中國電信這五家機構均位于前五位,在不同排名中僅順序有些變化,其研究實力與貢獻程度可見一斑。
如果把RFC的主題聚焦于IPv6,那么每一機構的發表量亦有所變化。
在官方網站(https://www.rfc-editor.org/search/rfc_search.php)進行高級檢索,將關鍵詞設置為IPv6,時間范圍設置為2003年1月-2023年5月,如圖3所示。我們得到相關RFC的全部數量為484篇,篩選出第一作者為中國人并來自中國機構的篇目,共計26篇。
圖3 查找IPv6相關RFC時的網站
從統計圖4中可知,26篇RFC的作者中,共有12人來自于清華大學,占比最高;其次有9人來自華為,占比第二;有2人來自于中國移動,中興、中國電信與中國互聯網絡信息中心(CNNIC)各有1人。
圖4 以IPv6為主題的RFC第一作者機構分布
RFC的引用率可以側面反映該RFC的重要性,某一RFC的引用率越高,既說明其重要性越高,也說明其作者的貢獻程度更大。每篇RFC的被引用量可通過官方datatracker(https://datatracker.ietf.org/doc/rfc6052/referencedby/)查閱獲知,如圖5所示。
圖5 曾引用過RFC6052的部分RFC截圖
值得注意的是,引用率既體現了RFC本身的重要性,又代表單位以及作者對研究領域做出的貢獻大小。
與發布量的分布相同,在IPv6領域,清華大學作為第一作者機構的RFC被引用次數最多(表2),共計收到了164次引用,遠超其余機構。此外,來自于華為的RFC得到了29次引用,中國移動得到了8次引用,中興與中國電信各得到1次引用,如圖6所示。在引用率最高的19篇文章中,清華大學為一作單位的有10篇,占52%,華為為5篇,占26%,其他機構為22%。引用率排名前5的RFC中,除并列第五的RFC6264來自華為外,其余都來自清華大學。引用率最高的作者包括清華大學包叢笑、李星、崔勇、吳建平,北京郵電大學蔣勝等。
表2 引用率大于0.1的19篇RFC
RFC與IETF
一個RFC之所以能成為RFC,與 IETF緊密相連。IETF是全世界最重要的互聯網技術標準機構。其使命就是通過出版高質量的技術文檔,影響人們設計、運行、使用和管理互聯網的方式,使互聯網更好地運作。
IETF每年舉行3次會議,與國際電信聯盟等相關組織不同,IETF的參與主體是工程師個人,不代表其所在國家或企業,真正發揮了工程師的創新精神。
IETF第一次來到中國,是其第79次大會,于2010年在北京召開。這是IETF歷史上第一次在中國舉行大會,也意味著在中國互聯網技術的不斷進步下,參加IETF大會的中國互聯網專家和技術人員越來越多,中國也從最開始的跟隨、參與,走向了組織與主導。來自世界65個國家和地區的國際知名互聯網技術專家、多項互聯網技術的創始人、以及互聯網學者和工程技術人員共計1200余人參加大會。
互聯網不斷在挑戰中創新,在創新中演進,與IETF息息相關。IETF為一線的科研人員開辟了一塊自由、開放、平等的土壤,以開放包容的精神吸引了全球互聯網科研人員協同創新?,F在,IETF匯聚了大量的關注互聯網體系結構發展和運行的網絡設計者、運營商、供應商和研究人員,形成了一個大型的開放式國際技術社區。因此,中國作為一個世界大國和網民最多的國家,更需要積極參與IETF,培養大量互聯網人才,在未來的技術研究和政策制定中占據主動地位,為全球互聯網發展貢獻中國智慧與中國方案。
注:
近20年第一作者撰寫的RFC數量、參與撰寫的RFC數量以及撰寫過RFC的作者數量統計方法:
為具體量化我國各機構的貢獻程度,首先,統計自RFC出現以來,參與撰寫過RFC的我國機構的數量與名稱。在IETF官網上(https://datatracker.ietf.org/stats/document/author/affiliation/?type=rfc)可以查閱2001年后曾發表過RFC的所有機構的名稱,以及每一機構曾參與發表RFC的作者數及其占全部作者數量的比重,名稱按字母順序進行排列。經人工查閱全部信息后,將來自中國的機構信息挑選并記錄下來,形成表1第3列。
其次,查閱RFC Editor網站(https://www.rfc-editor.org/rfc-index2.html)后可得,第一篇發表日期為2003年1月的RFC序號為3435,而今年最新一篇RFC的序號為9411,因此選取3435-9411序號內的所有RFC作為統計對象,并用python爬取每一篇RFC的序號、名稱、所有作者與其所屬機構等信息形成excel表格。在excel表格中,對上述出現過的中國機構進行文本篩選操作,并由此統計出近20年來其參與發表過的RFC數量與作為第一作者單位的RFC數量。以華為公司為例,在對作者與機構信息進行文本篩選時,篩選條件設置為包含Huawei字段,進而得到華為人員參與撰寫過的RFC數量。對所有已知發表過RFC的中國機構進行相同操作,便可得到最終統計結果。
參考資料——
RFC的分類與特點
所有的互聯網標準都是RFC,但是,并非所有的RFC都是互聯網標準。根據自身成熟度及內容特征,RFC可被分為不同的類型。首先RFC可分為標準類與非標準類兩個大類。而標準類RFC可進一步分為最佳實踐(Best Current Practices)、提案標準(Proposed Standard)、草案標準(Draft standard)與互聯網標準(Internet standard)四種類型;非標準類RFC又可進一步分為實驗類(experimental)、信息類(informational)和歷史類(historical)等類型。
互聯網標準是標準類RFC的最終形式,它的演化進程是從提案標準到草案標準再到互聯網標準。由于技術發展速度較快,但從提案標準到草案標準再到互聯網標準的流程相對漫長,因此目前全球互聯網實際上正基于提案標準運行。
具體來說,當一個RFC被標注為提案標準后,說明此文檔已通過較為深入的審查,并且大多數人認可了它的價值,但是它仍需要通過更多實驗和測試,并且在成為互聯網標準之前,文檔內容還可能出現較大的變化。
進一步地,如果RFC被認可為草案標準,說明大多數人都能很好理解它的內容,其內容也更加穩定,可被用作現實中開發的基礎。在這個階段,它還需要更多具體的RFC測試和注釋。在成為最終標準前,其內容仍有可能被改變。
最后,當RFC經過了有效的實踐和成功的運行,并且達到了較高技術成熟度后,IESG便會把此文檔設為官方的標準協議。此時,RFC終于到達了演化的終點,成為了所有人都應遵守的互聯網標準,同時,每一個互聯網標準都會被分配唯一一個STD號碼。
最佳實踐類RFC則不在標準的演化過程中。簡單來說,最佳實踐指在實際應用一個標準或協議時的推薦做法,是基于實際部署和運維總結出來的經驗。它涵蓋了運營、規劃、實施等各個方面,目的是指導大家采用比較適當、成熟的方式來部署和使用一個標準,避免重復出現已有問題。
此外,并非每個RFC都在標準化的軌道上。一項RFC可能并不打算成為互聯網標準,或者它未來有可能被標準化,只是尚未做好準備。那么,此類RFC就會被歸到非標準的類型中。
在非標準類RFC中,實驗類RFC起到了研究與開發工作備忘錄的作用,記錄著實踐過程中的必要信息。而信息類RFC則為互聯網社群提供了來源廣泛的、可靠的內容,但并不代表其得到了互聯網組織的推薦和認可。歷史類RFC的定義更為直接,即該RFC已經被更新的RFC所取代,所以其內容已成為歷史。
撰文:王雅靜
責編:項陽