拳打谷歌ChatGPT火出圈!投資人稱更需警惕投資泡沫化跟風
一夕之間,ChatGPT突然火了。
所謂ChatGPT,是在今年11月30日,由人工智能實驗室OpenAI上線的新模型,其網(wǎng)頁應用允許用戶免費使用,目前用戶與ChatGPT之間的對話互動包括了普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等,甚至令用戶產(chǎn)生ChatGPT能否取代谷歌等搜索引擎的疑慮。
一位技術領域人士認為,讓ChatGPT 類平臺、以及短視頻平臺或購物社交平臺來取代搜索引擎,容易讓知識來源單一化,這是危險的。東吳證券團隊也認為,ChatGPT模型仍無法很好解決虛假信息的問題,甚至過度猜測用戶意圖導致回答偏差較大,因此其本質仍偏向AIGC內容生產(chǎn)工具,而非搜索引擎。
此外,ChatGPT火速出圈,但對話過程中也經(jīng)常會發(fā)生因語料積累不足而產(chǎn)生的“事故”。多位AI界行業(yè)人士對第一財經(jīng)記者表示,無需因ChatGPT的智能而對AI產(chǎn)生恐懼,ChatGPT的出圈本質是算力與樣本量提升后得到的自然結果,更需警惕的是將ChatGPT歸屬于AIGC賽道后引發(fā)的創(chuàng)業(yè)與投資泡沫。
“上癮”的聊天AI
據(jù)官網(wǎng)介紹,計算模型GPT-3.5支持的通用聊天機器人ChatGPT,能回答連續(xù)性的問題、承認自己的錯誤、質疑不正確的假設,甚至拒絕不合理的需求。從寫劇本、寫詩、設計游戲,到給程序找bug,乃至制定一份“毀滅人類”的計劃,這個AI能做的事情超乎想象。
美國企業(yè)家馬斯克詢問了ChatGPT如何設計Twitter,AI回答稱:“為了使用戶更容易查看線程互聯(lián)網(wǎng)對話并與之交互,你可以將線性一維界面轉換為二維無限網(wǎng)格。”
有人認為,ChatGPT的出現(xiàn)堪比AlphaGo打敗李世石。12月5日,OpenAI創(chuàng)始人兼CEO阿爾特曼(Sam Altman)發(fā)布推文表示,ChatGPT用戶數(shù)已突破了100萬。在這條推特下,馬斯克詢問“每次聊天的平均費用是多少”, 阿爾特曼回復表示,“用戶平均每次聊天所花費的可能是個位數(shù)美分?!?/p>
目前ChatGPT仍處于免費測試階段,不限量向公眾開放,基于其破百萬的用戶數(shù),平臺所花費的成本不算小。不過,在使用過程中,用戶提供的反饋對OpenAI也是最有價值的信息,可以不斷訓練語言模型,修正錯誤答案。
第一財經(jīng)記者注冊并體驗了一下ChatGPT對話。雖然目前ChatGPT并沒有開放給中國地區(qū)的用戶,但界面仍可使用中文。記者首先讓AI自我介紹,其回復,“我是Assistant,一個由 OpenAI 訓練的大型語言模型。我的工作是幫助人們回答各種問題,盡可能提供準確和詳細的信息。我可以回答各種問題,無論是關于歷史、科學、人文還是其他話題?!?/p>
計算機領域從業(yè)人士高毅對第一財經(jīng)表示,試用ChatGPT的體驗很奇妙,一個聊天AI 能寫代碼,能用“意念”分析代碼,甚至能用“意念”分析一個超時程序的運行結果,“一開始以為他打開了個gcc 或者 python 之類的外部進程輔助分析,但試下來感覺并不是這樣,而是他真的像人一樣在試圖理解這些代碼?!?/p>
高毅故意提供了一些有問題的輸入程序,使其根本無法正確執(zhí)行,還故意給了個有生之年無法運行結束的程序,而ChatGPT像人而非機器一樣,無視了上述這些不重要的問題,轉而專注于問題的核心點,并在有限時間內給出了解答,“雖然他回答有小的錯誤,但能夠做到這一步真的已經(jīng)非常厲害了。”
東吳證券研報分析認為,ChatGPT的模型經(jīng)歷從GPT到GPT3的升級,優(yōu)化主要來自算力增加。GPT、GPT-2和GPT-3在算法模型并沒有太大改變,但參數(shù)量從1.17億增加到1750億,預訓練數(shù)據(jù)量從5GB增加到45TB,其中GPT-3訓練一次的費用是460萬美元,總訓練成本達1200萬美元。雖然訓練數(shù)據(jù)量和算力大幅增加使GPT-3有顯著優(yōu)化,但高額投入也使其只能走B端變現(xiàn)。
此次ChatGPT出圈,其技術模型最大變化出現(xiàn)在2022年推出的GPT3.5,技術迭代成優(yōu)化來源于1月發(fā)布的InstructGPT模型中增加了人類對模型輸出結果的演示,并在對結果進行排序的基礎上訓練,加上指令調整的幫助,雖然其只有13億個參數(shù),但回答準確率、道德表現(xiàn)卻好于GPT-3。
ChatGPT雖然強大,仍然有其局限性,比如偶爾會犯錯誤,有一定的誤導性;作為一個AI,它也不能提供對人或事件的判斷和評價。但基于其反饋強化學習系統(tǒng),ChatGPT也在不斷學習完善。有用戶表示,前幾天問ChatGPT的時候提供的錯誤答案,過了一天之后就已經(jīng)被修正,或許是很多用戶的反饋幫助ChatGPT對正確的答案進行了排序。
日常對ChatGPT進行調戲逗樂僅是娛樂項目,一旦作為嚴肅工作內容,則需要嚴謹對待。據(jù)了解,程序員交友網(wǎng)站Stack Overflow上已出現(xiàn)大量通過ChatGPT自動生成的內容,給Stack Overflow的質量管理造成影響。Stack Overflow方面發(fā)布公告稱,由于從ChatGPT中獲得正確答案的平臺比率太低,發(fā)布由ChatGPT創(chuàng)建的答案對網(wǎng)站和詢問者以及尋找正確答案的用戶都有很大危害。“禁止用ChatGPT直接生成垃圾答案,否則封號。這是一個臨時性規(guī)定,目的是應對目前論壇上ChatGPT生成內容的泛濫之勢?!?/p>
對此,ChatGPT回應稱,“因為AI生成的答案不總是準確或相關的,可能會導致Stack Overflow上混淆錯誤答案,誤導在尋求幫助的用戶。”“Stack Overflow禁止用AI生成答案是合理的。”阿爾特曼也表示,正試圖阻止ChatGPT隨機編造,現(xiàn)階段讓其與當前技術保持平衡是很棘手的。隨著時間的推移,會根據(jù)用戶反饋來改進。
對AI無需過分恐慌
開發(fā)出ChatGPT的公司是何來頭?公開信息顯示,ChatGPT由人工智能公司OpenAI開發(fā),成立至今已經(jīng)七年,坊間傳言其最新估值已達到兩百億美元。
OpenAI最初是由馬斯克、阿爾特曼等六人在2015年聯(lián)合創(chuàng)辦,最初為非營利性機構。2018年馬斯克宣布退出,2019年,OpenAI宣布重組為一家“有限營利(capped-profit)企業(yè)”,并接受了微軟10億美元的投資,雙方表示將合作替Azure云端平臺服務開發(fā)人工智能技術。此次推出的ChatGPT也是在微軟Azure AI服務器上完成的訓練。
阿爾特曼在12月6日發(fā)布的推文中感謝微軟和Azure,他表示,微軟和Azure做了大量的工作,構建了迄今為止最好的AI 基礎設施,但目前并沒有因為OpenAI 推出的東西而獲得足夠的榮譽。
此次ChatGPT的火熱出圈也引發(fā)外界對AI是否即將戰(zhàn)勝人類的恐慌。但多位AI界面人士對記者稱,目前ChatGPT更多是算力與語料調教后的正常結果。
據(jù)國盛證券研報,ChatGPT的背后離不開大模型、大數(shù)據(jù)、大算力,其技術底座使用的是微調后的GPT-3.5系列模型,有著多達1750億個模型參數(shù),OpenAI主要使用的公共爬蟲數(shù)據(jù)集有著超過萬億單詞的人類語言數(shù)據(jù)集。GPT-3.5在微軟Azure AI超算基礎設施上進行訓練,總算力消耗約3640PF-days(即每秒一千萬億次計算,運行3640個整日)。
針對外界認為ChatGPT可以取代搜索引擎的觀點,前Google總部科學家、出門問問創(chuàng)始人李志飛認為,相對于語音助手和搜索引擎,ChatGPT目前還有很多不能干或干不好的實情,如不能查詢附近的川菜館,不能進行打電話、定日歷、播放歌曲等手機本地操作。此外,ChatGPT大概率不能回答訓練時它沒有看到的最新網(wǎng)頁知識,不一定能正確回答一個五年前政治人物今年的年齡,大概率不能做對簡單的邏輯題和加減乘除題。
總結來說,李志飛認為,ChatGPT的“認知”建立在虛擬訓練文本上,沒有跟實時的數(shù)據(jù)庫或信息連接,也沒有顯式的邏輯推理,仍有些“空中樓閣”的味道,所以特別適合插科打諢。
雖有不少聲音將ChatGPT與谷歌等搜索引擎對比,但東吳證券團隊認為,由于ChatGPT模型仍無法很好解決虛假信息的問題,甚至過度猜測用戶意圖導致回答偏差較大,因此其本質仍偏向AIGC內容生產(chǎn)工具。搜索引擎核心是海量信息集合,而非信息創(chuàng)造;但在“存在標準答案”的編碼、數(shù)學計算等領域,ChatGPT或將對搜索引擎產(chǎn)生一定沖擊。其次,相比更多面向B端客戶的GPT-3,C端學習和使用成本低、產(chǎn)出效果好的ChatGPT有望助力AIGC破圈,并在接收海量用戶反饋的過程中繼續(xù)迭代,推動AIGC文字內容生產(chǎn)走向全民化。
不少游戲人士和插畫人士也開始關注ChatGPT,但不少用戶在使用之后反饋表示ChatGPT并沒有想象中那么智能。有一位游戲行業(yè)人士發(fā)現(xiàn),ChatGPT對于2021年之后發(fā)生的事情似乎了解得并不多,“問它《原神》,它不知道稻妻(原神的一個地名)是哪里?!痹撚脩粽f。另有用戶向ChatGPT提問“《原神》的開發(fā)公司是哪家”,得到的回應不是米哈游而是騰訊。
對此,另一位用戶表示,目前ChatGPT的學習的數(shù)據(jù)樣本只截止到2021年,等到訓練的人數(shù)增加了,反饋內容的質量便會有所提升。此外,部分用戶向記者反饋認為,ChatGPT在不同語種的識別和解讀上存在差異,使用中文和同樣內容轉譯成的英文輸入得到的反饋結果并不相同。
盡管目前ChatGPT僅能實現(xiàn)文字應答,但是不少插畫人士也開始利用ChatGPT工作。一位插畫師告訴記者,對于目前市面上流行的AI繪畫軟件stablediffusion,插畫師常苦于反復修改提示語但仍無法得到理想的結果。不過ChatGPT提供了一個新的思路:用于生成指導AI作畫的提示語模板,即利用AI告訴AI如何作畫?!跋喈斢诎袰hatGPT當成一個人類慣用語和ai繪畫能理解的語言中間的翻譯器,只需要在它生成的模板中填寫幾個關鍵詞然后粘貼到stablediffusion就好了,經(jīng)過ChatGPT轉換后的指令成的圖比原先手動輸入的內容相比要好很多?!?/p>
相較而言,人工智能研究專家、創(chuàng)新工場人工智能工程院執(zhí)行院長王詠剛持有更謹慎的態(tài)度,他表示,其一,AI創(chuàng)作目前在知識教育領域爭議很大,例如王詠剛杜撰了一個學術概念“鏡像等離子規(guī)范場”,但ChatGPT竟然真的一本正經(jīng)地進行了解讀。
王詠剛稱,ChatGPT的模仿能力和文筆越好,這個未來風險就越值得重視且需要提前應對。今天的AI生成理論,還沒辦法保證生成內容的邏輯正確與合理;建立人類領域專家參與的AI訓練過程,發(fā)展與正確性相關的增強學習算法可能會是未來的一個AI科研熱點。
其二的擔憂點在于AI/CS專業(yè)人需保持冷靜,王詠剛認為,面對大幅提升多輪對話能力的ChatGPT,越是AI/CS的從業(yè)者越是不能一味地頂禮膜拜;最起碼,應該有測試和驗證的精神,不斷探索新模型的能力上限,甄別模型生成答案時真正的“記憶認知”和基于特征相似性的“模仿游戲”。
警惕盲目跟風
ChatGPT的火爆讓國內創(chuàng)投圈再次熱議AIGC的投資價值,AIGC 全稱AI-Generated Content,指利用AI技術尋找數(shù)據(jù)規(guī)律并泛化生成的內容。
國泰君安研發(fā)分析稱,AI繪畫是AIGC的一大重要分支,目前處于由簡單的降本增效向創(chuàng)造額外價值升級的階段,跨文字和圖像的多模態(tài)內容成為關鍵的發(fā)展節(jié)點。2022年8月,Stable Diffusion、Midjourney等AI繪畫應用因《太空歌劇院》作品的獲獎而在海外迅速出圈,此后熱度蔓延至國內,無界版圖AI、意間AI等應用于9月底相繼上線,其中意間AI用戶數(shù)在42天內突破百萬。此次ChatGPT僅用5天便實現(xiàn)百萬用戶數(shù),AI問答及其他分支應用的熱度有望持續(xù)攀升。
就技術層面而言,國泰君安稱,模型效率、素材庫豐富度是AIGC應用的核心競爭力。以AI繪畫為例,此前流行的GAN模型存在一定局限性,包括從噪聲/條件到最終結果的一步到位式生成方式難度較高,面對復雜數(shù)據(jù)時容易訓練失敗,跨模態(tài)生成效果較差等。但2022年出現(xiàn)的Diffusion模型在這三方面均有改善,模型迭代驅動多個AI繪畫應用出圈。
并且此次OpenAI發(fā)布的ChatGPT模型較前代而言有較大進步,如減少不真實回答、避免有害回答、挑戰(zhàn)用戶問題前提等,同時還具備連續(xù)對話的記憶能力,人機交互體驗更為逼真。豐富的內容素材庫保障模型得到充分訓練,并最終生成高質量內容,是AIGC應用的另一核心競爭力。
因此,浙商證券研報認為,ChatGPT模型的出現(xiàn)對于文字模態(tài)的AIGC應用具有重要意義。從下游相關受益應用來看,包括但不限于代碼機器人、小說衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等。從上游增加需求來看,包括算力、數(shù)據(jù)標注、自然語言處理(NLP)等。
至于ChatGPT加入后對行業(yè)造成的“威脅”,高毅表示,ChatGPT不一定能完全替代所有人,但可能是相對基礎的那部分,“具體到軟件行業(yè),今天能離譜地生成和分析代碼,那明天很有可能 PRD 文檔都能直接生成軟件產(chǎn)品,僅需少量資深產(chǎn)品研發(fā)測試等人力介入。作為從業(yè)者,平時還是得多想想,哪些技能是更深的、不那么容易被替代的。”
就目前ChatGPT存在的問題而言,主要是來自于訓練過程和數(shù)據(jù)集的局限性,此次面向用戶免費開放能夠進一步強化訓練,從而完善模型質量。國盛證券研究所發(fā)現(xiàn),目前OpenAI等巨頭已著手自建計算集群來滿足AIGC的要求,這種集中式的訓練對GPU、存儲、機房、供電等基礎設施均有巨大需求。國內部分創(chuàng)業(yè)團隊目前基于公有云訓練,隨著需求的增加,也有望轉向自建集群。
今年以來,我國“東數(shù)西算”戰(zhàn)略自上而下快速推進,作為數(shù)字經(jīng)濟的基礎,“算力即權力”,其重要性不言而喻,此前國內廠商的更多互聯(lián)網(wǎng)應用聚焦于“存”而非“算”,隨著AIGC技術在全球的興起,“東數(shù)西算”的算力需求將越來越顯著。
未來隨著深度學習模型不斷完善、開源模式的推動、大模型探索商業(yè)化的可能,AIGC有望加速發(fā)展。但針對此次ChatGPT再次點燃創(chuàng)投圈內AIGC賽道的火熱,王詠剛持有謹慎態(tài)度。2022年11月,王詠剛前往硅谷,拜訪了多家投資公司、科技公司、創(chuàng)業(yè)團隊,他發(fā)現(xiàn)科技圈里幾乎人人都在談論AIGC,似乎沒有AIGC包裝的創(chuàng)業(yè)項目就不是好項目,沒有AIGC概念的科研就發(fā)不出好論文。
但實情的確如此嗎?在后續(xù)與OpenAI兩位聯(lián)合創(chuàng)始人的交流中,王詠剛發(fā)現(xiàn),對方會通過非常技術化、務實的心態(tài)談論其工作計劃與技術思考,但他們并不知道AIGC到底是什么意思,這令王詠剛非常詫異,思考之后王詠剛認為,“從科技上開創(chuàng)AIGC這個新領域的OpenAI創(chuàng)始人,其實并不需要知道類似AIGC之類純粹用來包裝科技概念的新名詞。他們要研究的是大模型結構、并行訓練加速、神經(jīng)網(wǎng)絡優(yōu)化等等具體科學與技術。這樣的人才是真正的創(chuàng)建者和領航者?!?/p>
目前國內AIGC一片火熱,在王詠剛看來,其中一部分創(chuàng)業(yè)者、投資者、或將AIGC快速包裝成應用產(chǎn)品的大多數(shù),其實只是并無能力決定科技大方向的跟風者?!捌谕L者在AIGC這個大舞臺上,不要過于頭腦發(fā)熱,還是要多判斷一下,自己構建的所謂‘產(chǎn)品’,到底是有益于人類進步的,還是向已經(jīng)碎片化的內容世界繼續(xù)灌水或傾倒垃圾的?!蓖踉亜偙硎?。
經(jīng)濟新聞精選:
- 2024年12月23日 16:37:37
- 2024年12月23日 16:34:03
- 2024年12月23日 16:30:08
- 2024年12月23日 15:50:18
- 2024年12月23日 14:33:45
- 2024年12月23日 14:19:12
- 2024年12月23日 14:13:12
- 2024年12月23日 10:04:20
- 2024年12月18日 15:20:42
- 2024年12月18日 10:03:30