技術(shù)趨勢:視頻生成正在由檢索生成、局部生成走向依靠自然語言提示詞的全量生成,生成內(nèi)容更加靈活豐富,應(yīng)用空間廣闊
檢索生成主要是對現(xiàn)有的視頻素材根據(jù)關(guān)鍵詞和標(biāo)簽進行檢索匹配,再進行相應(yīng)的拼接和排列組合
特點
1 采用傳統(tǒng)的跨模態(tài)視頻檢索技術(shù),通過視頻標(biāo)
簽的或者視頻語義理解的方式從數(shù)據(jù)庫中的檢
索,再將這些素材進行剪輯、組合拼接在一起,
本質(zhì)上還是鍵值對匹配的邏輯
2 例如短視頻平臺的知識類視頻、解說類視頻, 通過文本關(guān)鍵字在數(shù)據(jù)庫中進行素材檢索,然 后在進行拼接組合生成
3 創(chuàng)意空間有限,沒有貢獻增量素材,但成本極 低,生成速度極快
僅針對視頻的一部分進行生 成,例如視頻中人物角色、 動作、背景、風(fēng)格化、特殊 效果等
特點
1 采用傳統(tǒng)的計算機視覺(Cv)、計算機圖形學(xué) (CG)技術(shù),但生成功能有限,主要是一些局
部的垂點功能
2 例如效果生成,在現(xiàn)有視頻上添加多種效果, 如濾鏡、光影、風(fēng)格化、美顏特效等。也可以 做局部動態(tài)化,如人物的面部表情生成、搞笑 表情、爆款特效、舞蹈動作生成等
3 有一定創(chuàng)意空間,生成部分新元素,成本低但 應(yīng)用的場景有限
通過文字、圖片、視頻作為提示 詞來進行憑空生成,不依賴外部 素材,核心在于大模型的能力
特點
1 采用基于Transformer或者擴散模型的大模型路 線,可以通過自然語言或者指導(dǎo)圖進行全局生成 (但也可以嵌入已有內(nèi)容),視頻的內(nèi)容、風(fēng)格、 長短、分辨率、寬高比都可以進行靈活調(diào)整
2 例如生成天馬行空的創(chuàng)意視頻、藝術(shù)視頻、卡通 視頻等等,非常靈活
3 創(chuàng)意空間無限,所有的元素都是全新生成,現(xiàn) 階段成本高昂,但天花板高,應(yīng)用場景廣泛
附件:AI視頻生成研究報告-由檢索生成、局部生成走向依靠自然語言提示詞的全量生成
中國在AI基礎(chǔ)設(shè)施和軟件層面嚴(yán)重依賴國際廠商,特別是在計算芯片和存儲芯片領(lǐng)域;在軟件層面,依賴程度更加嚴(yán)重,軟件仍是中國各大企業(yè)的常用工具占比達59%
以注意力機制為核心的Transformer架構(gòu)賦能AI在文本、圖像、視頻生成、文字交互、智能語音和計算機視覺 領(lǐng)域的技術(shù)能力增強和應(yīng)用范圍拓寬
生成式人工智能服務(wù)管理暫行辦法,算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃,關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見,國家新一代人工智能創(chuàng)新 發(fā)展試驗區(qū)建設(shè)工作指引
中國多年來在人工智能論文發(fā)表數(shù)量和專利授權(quán)數(shù)量方面均居世界首位;顯著領(lǐng)先于其他國家,中國人工智能專利授權(quán)的數(shù)量在全球范圍內(nèi)占比達61.3%,位居全球榜首
我國智能算力占比已經(jīng)超過通用算力,成為整體算力增長的主要驅(qū)動力;國算力結(jié)構(gòu)為通用算力:智能算力:超級算力=40%:59%:1%智能算力占比已較大幅度超過通用算力占比
分析了大模型發(fā)展趨勢挑戰(zhàn)的基礎(chǔ)上,提出了大模型安全實踐總體框架,并從安全性、可靠性、可控性以及評測四個角度對大模型安全技術(shù)進行了深度剖析
白皮書將聚焦中國未來核心產(chǎn)業(yè)的發(fā)展方向,從人工智能、智能制造、大消費、生命科學(xué)、碳中和等五大產(chǎn)業(yè)出發(fā),探討中國將如何迎接下一波增長浪潮
大模型領(lǐng)域人才供需比為1.76,整體供大于求,但高端技術(shù)崗位如云計算和算法仍緊缺,薪酬漲幅保持在30%-50%,65.79%每周工作超50小時,從業(yè)者中82%因技術(shù)和前景而主動加入
設(shè)備精度提升以及對更精準(zhǔn)診斷的追求使得我國醫(yī)學(xué)影像數(shù)據(jù)大量積累人工智能可以充分利用這些數(shù)據(jù)進行模型訓(xùn)練;提高了醫(yī)學(xué)診斷效率, 減輕了醫(yī)生工作負(fù)擔(dān)、促進了醫(yī)療資源均衡分配
智能體將深入復(fù)雜任務(wù)處理,手機和電腦智能體將引發(fā)應(yīng)用生態(tài)變革;報告討論了AIAgent產(chǎn)品的構(gòu)建方式和市場策略,強調(diào)了大模型技術(shù)基礎(chǔ)和行業(yè)數(shù)據(jù)的重要性
AI生產(chǎn)力工具市場快速發(fā)展,用戶規(guī)模和產(chǎn)品類型激增,以AI搜索、寫作、翻譯等應(yīng)用為核心的工具正推動工作效率和創(chuàng)造力的提升,生成式AI市場預(yù)計將達到4000億元
國內(nèi)AI大模型行業(yè)迅速發(fā)展,形成“6+2”競爭格局,產(chǎn)品覆蓋C端和B端,聚焦金融、教育等行業(yè),報告概括了AI大模型行業(yè)的主要參與者、核心競爭力、產(chǎn)品與服務(wù)、融資情況以及未來趨勢