4月15日,斯坦福大學(xué)發(fā)布了《2024年人工智能指數(shù)報(bào)告》。這份報(bào)告廣泛地涵蓋了人工智能的技術(shù)進(jìn)步、公眾對該技術(shù)的看法以及圍繞其發(fā)展的地緣政治動態(tài)等基本趨勢。
整體情況
圖1 全球授予的人工智能專利比例
報(bào)告按地理區(qū)域劃分對人工智能專利進(jìn)行了分析,數(shù)據(jù)顯示全球授予的人工智能專利主要來自中國(61.1%)和美國(20.9%)(圖1)。來自美國的人工智能專利的比例從2010年的54.1%有所下降。
圖2 機(jī)器學(xué)習(xí)模型的類別及數(shù)量
2014年以前,機(jī)器學(xué)習(xí)模型的發(fā)布由學(xué)術(shù)界主導(dǎo)。2014年以后,產(chǎn)業(yè)界就一直處于領(lǐng)先地位。在2023年,產(chǎn)業(yè)界產(chǎn)生了51個(gè)重要的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界只有15個(gè)(圖2)。2023年,21個(gè)行業(yè)/學(xué)術(shù)合作產(chǎn)生了21個(gè)顯著的模型,創(chuàng)下了歷史新高。
圖3 機(jī)器學(xué)習(xí)模型的參數(shù)數(shù)量
機(jī)器學(xué)習(xí)模型中的參數(shù)是在訓(xùn)練過程中學(xué)習(xí)到的數(shù)值,它決定了模型如何解釋輸入數(shù)據(jù)并做出預(yù)測。在更多數(shù)據(jù)上訓(xùn)練的模型通常比在更少數(shù)據(jù)上訓(xùn)練的模型有更多的參數(shù)。同樣地,具有更多參數(shù)的模型通常優(yōu)于那些參數(shù)較少的模型。圖3展示了機(jī)器學(xué)習(xí)模型的參數(shù)數(shù)量。
自2010年代初以來,參數(shù)數(shù)量急劇上升,反映出人工智能模型設(shè)計(jì)的任務(wù)越來越復(fù)雜,數(shù)據(jù)可用性更大、硬件改進(jìn)和更大模型已證明的有效性。高參數(shù)模型在行業(yè)領(lǐng)域尤其引人注目,這凸顯了OpenAI、Anthropic, 和 Google公司等公司承擔(dān)大量數(shù)據(jù)培訓(xùn)的計(jì)算成本的能力。
圖4 GitHub人工智能項(xiàng)目來源地區(qū)
圖4展示了自2011年以來按地理區(qū)域劃分的GitHub人工智能項(xiàng)目。截至2023年,GitHub人工智能項(xiàng)目的很大一部分比例來源于美國,占貢獻(xiàn)的22.9%。印度以19.0%的比例位居第二位,緊隨其后的是歐盟和英國,占比為17.9%。值得注意的是,自2016年以來,來自位于美國GitHub上的開發(fā)商的人工智能項(xiàng)目的比例一直在穩(wěn)步下降。
2023 年人工智能行業(yè)的 10 大主要趨勢
1.人工智能在某些任務(wù)上勝過人類,但并非在所有任務(wù)上。
人工智能已在多項(xiàng)基準(zhǔn)測試中超越人類,包括在圖像分類、視覺推理和英語理解方面。然而,它在競賽級數(shù)學(xué)、視覺常識推理和規(guī)劃等更復(fù)雜的任務(wù)上依然落后于人類。
2.產(chǎn)業(yè)界繼續(xù)主導(dǎo)人工智能前沿研究。
2023 年,產(chǎn)業(yè)界產(chǎn)生了 51 個(gè)著名的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界只貢獻(xiàn)了 15 個(gè)。2023 年,產(chǎn)學(xué)合作還產(chǎn)生了 21 個(gè)著名模型,創(chuàng)下新高。此外,108 個(gè)新發(fā)布的基礎(chǔ)模型來自工業(yè)界,28 個(gè)來自學(xué)術(shù)界。
3.前沿模型變得更加昂貴。
根據(jù) AI Index 的估算,最先進(jìn)的人工智能模型的訓(xùn)練成本已經(jīng)達(dá)到了前所未有的水平。例如,OpenAI 的 GPT-4 估計(jì)使用了價(jià)值 7800 萬美元的計(jì)算資源進(jìn)行訓(xùn)練,而谷歌的 Gemini Ultra 的計(jì)算成本則高達(dá) 1.91 億美元。相比之下,幾年前發(fā)布的一些最先進(jìn)的模型,即原始 transformer 模型(2017 年)和 RoBERTa Large(2019 年),訓(xùn)練成本分別約為 900 美元和 16 萬美元。
4.美國成為頂級人工智能模型的主要來源國。
2023 年,61 個(gè)著名的人工智能模型源自美國的機(jī)構(gòu),超過歐盟的 21 個(gè)和中國的 15 個(gè)。美國也仍然是人工智能投資的首選之地。2023 年,美國在人工智能領(lǐng)域的私人投資總額為 672 億美元,是中國的近 9 倍。然而,中國依然是美國最大的競爭對手,中國的機(jī)器人安裝量居世界首位;同樣,全球大多數(shù)人工智能專利(61%)都來自中國。
5.嚴(yán)重缺乏對 LLM 責(zé)任的可靠和標(biāo)準(zhǔn)化評估。
AI Index 的最新研究顯示,負(fù)責(zé)任的人工智能嚴(yán)重缺乏標(biāo)準(zhǔn)化。包括 OpenAI、谷歌和 Anthropic 在內(nèi)的領(lǐng)先開發(fā)商主要根據(jù)不同的負(fù)責(zé)任人工智能基準(zhǔn)測試他們的模型。這種做法使系統(tǒng)地比較頂級人工智能模型的風(fēng)險(xiǎn)和局限性的工作變得更加復(fù)雜。
6.生成式人工智能投資激增。
盡管去年人工智能私人投資整體下降,但對生成式人工智能的投資激增,比 2022 年(約 30 億美元)增長了近八倍,達(dá)到 252 億美元。生成式人工智能領(lǐng)域的主要參與者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都獲得了一輪可觀的融資。
7.數(shù)據(jù)顯示,人工智能讓打工人更有生產(chǎn)力,工作質(zhì)量更高。
2023 年,多項(xiàng)研究評估了人工智能對勞動力的影響,表明人工智能可以讓打工人更快地完成任務(wù),并提高他們的產(chǎn)出質(zhì)量。這些研究還表明,人工智能有可能縮小低技能和高技能工人之間的技能差距。還有一些研究警告說,在沒有適當(dāng)監(jiān)督的情況下使用人工智能可能會起到負(fù)面作用。
8.得益于人工智能,科學(xué)進(jìn)步進(jìn)一步加速。
2022 年,人工智能開始推動科學(xué)發(fā)現(xiàn)。然而,2023 年,與科學(xué)相關(guān)的更重要的人工智能應(yīng)用啟動——使算法排序更高效的 AlphaDev、促進(jìn)材料發(fā)現(xiàn)過程的 GNoME、可在一分鐘內(nèi)提供極其準(zhǔn)確的 10 天天氣預(yù)報(bào)的 GraphCast、成功對 7100 萬種可能的錯(cuò)義突變中的約 89% 進(jìn)行分類的 AlphaMissence。如今,人工智能現(xiàn)在可以完成人類難以完成的、但對解決一些最復(fù)雜的科學(xué)問題至關(guān)重要的粗暴計(jì)算。在醫(yī)療方面,新的研究表明,醫(yī)生可以利用人工智能更好地診斷乳腺癌、解讀X射線和檢測致命的癌癥。
9.美國的人工智能法規(guī)數(shù)量急劇增加。
2023 年,全球立法程序中有 2175 次提及人工智能,幾乎是上一年的兩倍。美國人工智能相關(guān)法規(guī)的數(shù)量在過去一年大幅增加。2023 年,與人工智能相關(guān)的法規(guī)有 25 項(xiàng),而 2016 年只有 1 項(xiàng)。僅去年一年,人工智能相關(guān)法規(guī)的總數(shù)就增長了 56.3%。其中一些法規(guī)包括生成式人工智能材料的版權(quán)指南和網(wǎng)絡(luò)安全風(fēng)險(xiǎn)管理框架。
10.人們對人工智能的潛在影響有了更深刻的認(rèn)識,同時(shí)也更焦慮。
來自市場研究公司 Ipsos 的一項(xiàng)調(diào)查顯示,在過去一年中,認(rèn)為人工智能將在未來 3-5 年內(nèi)極大地影響他們生活的人,比例從 60%上升到 66%。此外,52% 的人對人工智能產(chǎn)品和服務(wù)表示焦慮,比 2022 年上升了 13 個(gè)百分點(diǎn)。在美國,來自皮尤研究中心(Pew)的數(shù)據(jù)顯示,52% 的美國人表示對人工智能的擔(dān)憂多于興奮,這一比例比 2022 年的 38% 有所上升。