品牌策劃、網站設計、網站建設行業的國際化企業
設計時間:2025-06-07
設計師:
網站類型:
AIGC,也就是人工智能生成內容(Artificial Intelligence Generated Content)是人工智能1.0時代進入2.0時代的重要標志。
GAN、CLIP、Transformer、Diffusion、預訓練模型、多模態技術、生成算法等技術的累積融合,催生了AIGC的爆發。算法不斷迭代創新、預訓練模型引發AIGC技術能力質變,多模態推動AIGC內容多邊形,使得AIGC具有更通用和更強的基礎能力。
從計算智能、感知智能再到認知智能的進階發展來看,AIGC已經為人類社會打開了認知智能的大門。通過單個大規模數據的學習訓練,令AI具備了多個不同領域的知識,只需要對模型進行適當的調整修正,就能完成真實場景的任務。
AIGC對于人類社會、人工智能的意義是里程碑式的。短期來看AIGC改變了基礎的生產力工具,中期來看會改變社會的生產關系,長期來看促使整個社會生產力發生質的突破,在這樣的生產力工具、生產關系、生產力變革中,生產要素——數據價值被極度放大。
AIGC把數據要素提到時代核心資源的位置,在一定程度上加快了整個社會的數字化轉型進程。
生成式人工智能——AIGC(Artificial Intelligence Generated Content),是指基于生成對抗網絡、大型預訓練模型等人工智能的技術方法,通過已有數據的學習和識別,以適當的泛化能力生成相關內容的技術。
AIGC技術的核心思想是利用人工智能算法生成具有一定創意和質量的內容。通過訓練模型和大量數據的學習,AIGC可以根據輸入的條件或指導,生成與之相關的內容。例如,通過輸入關鍵詞、描述或樣本,AIGC可以生成與之相匹配的文章、圖像、音頻等。
麥肯錫的定義:生成式人工智能旨在通過以一種接近人類行為,(與人類)進行交互式協作。
Gartner的定義:生成式人工智能是一種顛覆性的技術,它可以生成以前依賴于人類的工件,在沒有人類經驗和思維過程偏見的情況下提供創新的結果。
BCG的定義:生成式AI是一種突破性的人工智能形式,它使用對抗網絡(GANs)的深度學習技術來創建新穎的內容。
TE智庫的定義:生成式人工智能,將徹底改變人機交互的關系,并創造新的產能輸出結構。它將在第四維度實現與人的思維同調,類似移動設備以人類外器官形態存在,AIGC將以外腦的形式存在于人類認知中。
南京大學數據智能與交叉創新實驗室:為伴隨著網絡形態演化和人工智能技術變革產生的一種新的生成式網絡信息內容。
信通院的定義:AIGC既是從內容生產者視角進行分類的一類內容,又是一種內容生產方式,還是用于內容自動化生成的一類技術集合。
1950年,艾倫?圖靈(Alan Turing)在其論文《計算機器與智能(Computing Machinery and Intelligence )》13中提出了著名的“圖靈測試”,給出了判定機器是否具有“智能”的試驗方法,即機器是否能夠模仿人類的思維方式來“生成”內容繼而與人交互。
某種程度上來說,人工智能從那時起就被寄予了用于內容創造的期許。經過半個多世紀的發展,隨著數據快速積累、算力性能提升和算法效力增強,今天的人工智能不僅能夠與人類進行互動,還可以進行寫作、編曲、繪畫、視頻制作等創意工作。
2018年,人工智能生成的畫作在佳士得拍賣行以43.25萬美元成交,成為世界上首個出售的人工智能藝術品,引發各界關注。隨著人工智能越來越多地被應用于內容創作,人工智能生成內容 (Artificial Intelligence Generated Content,簡稱AIGC)的概念悄然興起。
人工智能的發展歷史大致可以被劃分為5個階段。(1950~1974)人工智能概念的出現;(1974~1980)神經網絡遇冷,研究經費減少;(1980~1987)專家系統流行并商用;(1987~1993)專家系統潰敗,研究經費大減;(1993~至今)深度學習理論和工程突破。
使用計算機生成內容的想法自上個世紀五十年代就已經出現,早期的嘗試側重于通過讓計算機生成照片和音樂來模仿人類的創造力,生成的內容也無法達到高水平的真實感。結合人工智能的演進改革,AIGC的發展可以大致分為以下三個階段:
受限于科技水平,AIGC僅限于小范圍實驗。1957年,萊杰倫·希勒(Lejaren Hiller)和倫納德·艾薩克森(Leonard Isaacson)通過將計算機程序中的控制變量改為音符,完成了歷史上第一部由計算機創作的音樂作品——弦樂四重奏《依利亞克組曲(Illiac Suite)》。1966年,約瑟夫·韋岑鮑姆(JosephWeizenbaum)和肯尼斯·科爾比(Kenneth Colbv)共同開發了世界上第一個機器人“伊莉莎(Eliza)”,其通過關鍵字掃描和重組來完成交互式任務。80年代中期,IBM基于隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉(Tangora)”,能夠處理兩萬個單詞。
AIGC從實驗性向實用性逐漸轉變,深度學習算法、圖形處理單元(GPU)、張量處理器(TPU)和訓練數據規模等都取得了重大突破,受到算法瓶頸的限制,效果有待提升。2007年,紐約大學人工智能研究員羅斯·古德溫(Ross Goodwin)裝配的人工智能系統通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智能創作的小說《1 The Road》。2012年,微軟公開展示了一個全自動同聲傳譯系統,通過深度神經網絡(DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。
深度學習模型不斷迭代,AIGC取得突破性進展。尤其在2022年,算法獲得井噴式發展,底層技術的突破也使得AIGC商業落地成為可能。其中主要集中在AI繪畫領域:2014年6月,生成式對抗網絡(Generative Adversarial Network,GAN)被提出。2021年2月,OpenAI推出了CLIP(Contrastive Language-Image Pre-Training)多模態預訓練模型。2022年,擴散模型Diffusion Model逐漸替代GAN。
AIGC是建立在多模態之上的人工智能技術,即單個模型可以同時理解語言、圖像、視頻、音頻等,并能夠完成單模態模型無法完成的任務,比如給視頻添加文字描述、結合語義語境生成圖片等。
現階段國內AIGC多以單模型應用的形式出現,主要分為文本生成、圖像生成、視頻生成、音頻生成,其中文本生成成為其他內容生成的基礎。
文本生成(AI Text Generation),人工智能文本生成是使用人工智能(AI)算法和模型來生成模仿人類書寫內容的文本。它涉及在現有文本的大型數據集上訓練機器學習模型,以生成在風格、語氣和內容上與輸入數據相似的新文本。
圖像生成(AI Image Generation),人工智能(AI)可用于生成非人類藝術家作品的圖像。這種類型的圖像被稱為“人工智能生成的圖像”。人工智能圖像可以是現實的或抽象的,也可以傳達特定的主題或信息。
語音生成(AI Audio Generation),AIGC的音頻生成技術可以分為兩類,分別是文本到語音合成和語音克隆。文本到語音合成需要輸入文本并輸出特定說話者的語音,主要用于機器人和語音播報任務。到目前為止,文本轉語音任務已經相對成熟,語音質量已達到自然標準,未來將向更具情感的語音合成和小樣本語音學習方向發展;語音克隆以給定的目標語音作為輸入,然后將輸入語音或文本轉換為目標說話人的語音。此類任務用于智能配音等類似場景,合成特定說話人的語音。
視頻生成(AI Video Generation),AIGC已被用于視頻剪輯處理以生成預告片和宣傳視頻。工作流程類似于圖像生成,視頻的每一幀都在幀級別進行處理,然后利用 AI 算法檢測視頻片段。AIGC生成引人入勝且高效的宣傳視頻的能力是通過結合不同的AI算法實現的。憑借其先進的功能和日益普及,AIGC可能會繼續革新視頻內容的創建和營銷方式。 AI產業鏈主要由基礎層、技術層、應用層三大層構成。其中基礎層側重于基礎支撐平臺的搭建,包含傳感器、AI芯片、數據服務和計算平臺;技術層側重核心技術的研發,主要包括算法模型、基礎框架、通用技術;應用層注重產業應用發展主要包含行業解決方案服務、硬件產品和軟件產品。 調研歸納發現,國內AIGC產業鏈結構主要由基礎大模型、行業/場景中模型、業務/領域小模型,AI基礎設施、AIGC配套服務五部分構成,并且已經形成了豐富的產業鏈。 通過大量無標簽或通用公開數據集,在數百萬或數十億參數量下,訓練的深度神經網絡模型。這種模型經過專門的訓練過程,能夠對大規模數據進行復雜的處理和任務處理。大模型需要占用大量的計算資源、存儲空間、時間和電力等資源來保證它的訓練和部署。 基于行業/場景專有數據,在較小參數量下訓練的深度神經網絡模型。面向特定場景和行業,該模型運行速度更快,也更加輕便。 代表供應商類型:行業頭部數字化供應商、AI廠商、行業巨頭、基礎大模型廠商、數據服務供應商。 基于少量、特定領域或企業獨有數據,在小規模參數下訓練的深度神經網絡模型。適用于解決一些簡單的、小規模的問題,可以在低功耗設備上運行,具有更快的推理速度。 代表供應商類型:垂直領域數字化服務供應商(包含SaaS服務供應商)、行業巨頭、AI廠商、基礎大模型廠商。 為模型廠商提供算力、算法、數據服務三大套件支持,包括服務器、芯片、數據湖、數據分析能力。 圍繞大模型,提供建模工具、安全服務、內容檢測、基礎平臺等服務。 AIGC產業鏈上游主要提供AI技術及基礎設施,包括數據供給方、數據分析及標注、創造者生態層、相關算法等。中游主要針對文字、圖像、視頻等垂直賽道,提供數據開發及管理工具,包括內容設計、運營增效、數據梳理等服務。下游包括內容終端市場、內容服務及分發平臺、各類數字素材以及智能設備,AIGC內容檢測等。 實現AIGC更加智能化、實用化的三大要素是:數據、算力、算法。 AIGC人有我優的核心基礎,包括存儲(集中式數據庫、分布式數據庫、云原生數據庫、向量數據庫)、來源(用戶數據、公開域數據、私有域數據)、形態(結構化數據、非結構化數據)、處理(篩選、標注、處理、增強…) 為AIGC提供基礎算力的平臺,包括半導體(CPU、GPU、DPU、TPU、NPU)、服務器、大模型算力集群、基于IaaS搭建分布式訓練環境、自建數據中心部署。 通過模型設計、模型訓練、模型推理、模型部署步驟,完成從機器學習平臺、模型訓練平臺到自動建模平臺的構建,實現對實際業務的支撐與覆蓋。視頻生成
基礎大模型
行業與場景中模型
業務與領域小模型
AI基礎設施
AIGC配套服務
數據
算力
算法