預訓練大模型是過去幾年AI發(fā)展主旋律,但是主要集中于自然語言處理領域。視覺領域 在2021年開始迎來進展。谷歌構建了一個擴展的ViT模型,擁有18億參數(shù),并使用30億的 標注圖像進行訓練,在ImageNet上取得了新的記錄(90.45%)。這一工作還表明,在視覺領 域上,模型同樣符合Scaling Lawo即:模型越大、性能越好。
SwinV2則進一步證明了視覺大模型(30億參數(shù))在廣泛視覺問題上的有效性,其在圖像 分類、物體檢測、語義分割和視頻分類等任務上均達到了 SoTA性能。這一工作也驗證了自監(jiān) 督學習對于驅(qū)動大模型訓練的有效性,基于SimMIM方法,SwinV2用相比谷歌小40倍的標 注數(shù)據(jù)(7000萬)達成了十億級視覺模型的訓練。
OpenAI提出DALLE模型,可以根據(jù)用戶輸入的文本生成對應的圖像,Imagen模型,CogView,VQ-Diffusion 模型以及 NUWA-infinity 等效果同樣出色
告立足于算法的技術趨勢和行業(yè)應用現(xiàn)狀,從法律監(jiān)管,倫理治理,技術治理三個層面梳理總結(jié)國內(nèi)外在算法治理方面的實踐做法,保障算法技術創(chuàng)新與應用健康
受基層影像醫(yī)師學歷偏低和經(jīng)驗不足等因素影響,基層影像設備診療能力并未被完全釋放,為人工智能醫(yī)學影像產(chǎn)品在基層落地提供巨大市場機遇
第一級銀行業(yè)金融機構未在任何業(yè)務建立模型分級方法/流程;第二級銀行業(yè)金融機構從業(yè)務和技術層面;第三級銀行業(yè)金融機構明確模型分級原則方法和操作要求
多模態(tài)數(shù)據(jù)具有異構性 多模態(tài)數(shù)據(jù)的關聯(lián)難度表示較大 多模態(tài)知識融合困難 多模態(tài)問答大多只能處理簡單的問題 多模態(tài)知識問答推理能力弱 可解釋性差
我國新一代人工智能治理工作框架應整合社會各界對AI社會技術復合體的離散性認知,突破AI包容審慎實踐的探索,建立基于“邏輯-秩序-監(jiān)管“的人工智能治理工作框架
高增長:未來五年全球人工智能市場規(guī)模平均增速將超過20%;高集中:軟件占比近40%硬件產(chǎn)品占比接近35%;高壁壘:滲透率還不到4%
在規(guī)劃設計階段機器學習場景中固有的不可預測性,傳達實施偏差會進一步加劇;在研發(fā)部署階段模型運行之后的動態(tài)更新缺乏足夠驗證等挑戰(zhàn)
構建面向可持續(xù)發(fā)展的人工智能技術體系,推動人工智能技術可用、可靠、可信,其內(nèi)涵包括提升技術安全和構建技術管理機制兩個層面工作
企業(yè)作為落實人工智能治理原則的重要主體,形成覆蓋人工智能產(chǎn)品全生命周期的風險管理機制,提出了面向可持續(xù)發(fā)展的人工智能治理基本框架
數(shù)據(jù)不完備和濫用風險突出而損害用戶的權益;人工智能算法存在固有缺陷在可解釋性魯棒性偏見歧視等方面尚存在局限;企業(yè)人工智能管理體系不完善
調(diào)度決策外賣調(diào)度系統(tǒng)困住騎手;個性化推薦電商場景下的信息繭房和馬太效應;內(nèi)容治理如何守護清朗健康的網(wǎng)絡環(huán)境;人工智能可以放心使用嗎
全球人工智能市場收支規(guī)模達850廳美元,預測,2022年該市場規(guī)模將同比增長約20%至 1017廳美元,并將于2025年突破2000廳美元大關, CAGR 達24.5%
頭部科技企業(yè)先后發(fā)布了AI治理戰(zhàn)略和治理體系,成立了相關委員會和工作組,聚焦企業(yè)層面的AI治理和風險管理體系,可信AI技術和保障工具也在蓬勃發(fā)展
智能文檔處理、智能會議、知識管理、智能客服等各類企業(yè)智能應用不斷發(fā)展,全面賦能企業(yè)辦公、管理、決策、風控、營銷、服務等各個環(huán)節(jié)
AI軟件設施在近兩年成為產(chǎn)業(yè)焦點,AI開源框架生態(tài),預訓練大模型體系,AI軟件平臺生態(tài)等內(nèi)容都得到了長足的發(fā)展,像水電一樣成為觸手可得的普惠資源