OpenAI在官網(wǎng)宣布,美國陸軍退役四星上將、前美國網(wǎng)絡(luò)司令部司令、前國家安全局局長、前中央安全局局長,Paul M. Nakasone(中曾根)加入董事會和安全委員會。
41%的人正通過生成式AI獲取旅行靈感或行程規(guī)劃,這一比2023年8月的34%提升了7%,并且82%使用過的生成式AI用戶會再次通過它來進(jìn)行旅游方面的應(yīng)用。
Imagen3在理解文本提示方面比前兩代更好,可捕捉長文本提示中的很多細(xì)微細(xì)節(jié),對圖片的嵌入文字生成也更加準(zhǔn)確、穩(wěn)定。
微軟發(fā)布了Copilot+ PC,這是全球首個專為AI設(shè)計(jì)的Windows PC,也是Windows史上最強(qiáng)版本。
Veo支持文本生成超過1分鐘的1080P超高清視頻,在文本語義還原、視頻動作一致性方面、運(yùn)鏡、幀與幀之間的連貫性、場景切換、光影效果等,可媲美OpenAI的Sora。
根據(jù)OpenAI最新的SSL證書日志顯示,已經(jīng)創(chuàng)建了search.chatgpt.com子域名(目前無法訪問),將會進(jìn)軍搜索引擎全面挑戰(zhàn)該領(lǐng)域的全球霸主谷歌。
OpenAI首席執(zhí)行官Sam Altman在社交平臺提及GPT-2模型,引發(fā)猜測是否為即將發(fā)布的新模型。Altman否認(rèn)了這些猜測,但GPT-2的性能表現(xiàn)令人關(guān)注。OpenAI可能正在開發(fā)適用于移動設(shè)備的高性能、低消耗模型,以應(yīng)對硬件限制和提高推理效率。這種模型可能會被用于蘋果iOS 18中,以增強(qiáng)用戶體驗(yàn)。
OpenAI聯(lián)合創(chuàng)始人Sam Altman在斯坦福大學(xué)演講,強(qiáng)調(diào)AI技術(shù)未達(dá)極限,OpenAI致力于實(shí)現(xiàn)AGI。Altman認(rèn)為開源非實(shí)現(xiàn)AGI最佳途徑,需商業(yè)回報(bào)以資助創(chuàng)新。OpenAI領(lǐng)先生成式AI領(lǐng)域,發(fā)布影響力巨大的產(chǎn)品如Sora,同時免費(fèi)提供ChatGPT以造福人類。Altman還回憶了與英偉達(dá)的合作歷史,展望雙方友誼。
據(jù)悉,Phi-3-mini是微軟Phi家族的第4代,有預(yù)訓(xùn)練和指令微調(diào)多種模型,參數(shù)只有38億訓(xùn)練數(shù)據(jù)卻高達(dá)3.3T tokens,比很多數(shù)百億參數(shù)的模型訓(xùn)練數(shù)據(jù)都要多,這也是其性能超強(qiáng)的主要原因之一。
Meta發(fā)布開源大模型Llama-3,具有80億和700億參數(shù)版本,性能在推理、數(shù)學(xué)、代碼生成等方面有顯著提升。Llama-3采用了分組查詢注意力、掩碼等技術(shù),提高了計(jì)算效率。預(yù)訓(xùn)練數(shù)據(jù)達(dá)15T tokens,支持多語言。測試顯示Llama-3性能超過多個知名模型。
馬斯克旗下AI公司x.ai推出Grok-1.5 Vision,具備視覺功能,能深度理解真實(shí)世界并進(jìn)行數(shù)據(jù)解讀、轉(zhuǎn)換。Grok-1.5 V在多模態(tài)模型測試中超過GPT-4V等競品,展示了強(qiáng)大的理解、數(shù)據(jù)轉(zhuǎn)換和檢索能力,如將圖片翻譯成Python代碼。即將向早期測試者和現(xiàn)有用戶推出。
4月7日,CNN消息,美國伊薩卡學(xué)院-戰(zhàn)略傳播學(xué)教授Diane Gayeski,正在使用ChatGPT批改學(xué)生的論文。
OpenAI在官網(wǎng)宣布新增6個全新微調(diào)API功能,以擴(kuò)展自定義模型,幫助企業(yè)、開發(fā)人員更好地構(gòu)建特定領(lǐng)域、精細(xì)化的ChatGPT應(yīng)用。
據(jù)悉,Command R+有1040億參數(shù),支持英語、中文、法語、德語等10種語言。最大特色之一是,Command R+對內(nèi)置的RAG(檢索增強(qiáng)生成)進(jìn)行了全面強(qiáng)化,其性能僅次于GPT-4 tubro,高于市面上多數(shù)開源模型。
在大模型領(lǐng)域英語一直是訓(xùn)練數(shù)據(jù)最重要的語言,但由于中英文的結(jié)構(gòu)和文化差異,直接將英文數(shù)據(jù)集翻譯成中文并不理想。所以,為了填補(bǔ)高質(zhì)量中文數(shù)據(jù)集的空白,研究人員開發(fā)出了COIG-CQIA數(shù)據(jù)集。
華爾街日報(bào)科技專欄作家Joanna Stern專訪OpenAI首席技術(shù)官M(fèi)ira Murati,討論全球爆火的文生視頻模型Sora。訪談中,Mira回應(yīng)了Sora的缺點(diǎn)、訓(xùn)練數(shù)據(jù)來源、上市時間以及生成內(nèi)容的安全性等問題。Sora存在諸如理解提示文本不準(zhǔn)確、物體控制不穩(wěn)定等問題,且算力需求巨大,短期內(nèi)不會上市。Sora的訓(xùn)練數(shù)據(jù)來自Shutterstock,未來可能推出視頻修復(fù)功能。
2023年大眾對AI的看法從懷疑到認(rèn)可,AGI(通用人工智能)的發(fā)展迅速,大模型展現(xiàn)出驚人的想象力和取悅能力。應(yīng)用層尚未出現(xiàn)獨(dú)角獸,創(chuàng)業(yè)者面臨官方技術(shù)迭代的挑戰(zhàn)。
Meta宣布了兩個新的24K H100 GPU集群,用于訓(xùn)練大模型Llama-3,預(yù)計(jì)4月末或5月中旬上線。集群使用RoCEv2網(wǎng)絡(luò)和基于Tectonic/Hammerspace的存儲解決方案,支持PyTorch。
馬斯克宣布將開源其公司xAI發(fā)布的生成式AI產(chǎn)品Grok,一款類ChatGPT產(chǎn)品,提供文本、代碼生成等功能,性能超GPT-3.5但弱于GPT-4。Grok-1在多個測試平臺表現(xiàn)優(yōu)異,但仍有局限性,如需內(nèi)容審核,無獨(dú)立搜索能力。
阿里巴巴技術(shù)團(tuán)隊(duì)推出AtomoVideo,一種文本+圖片生成高保真視頻的模型。AtomoVideo通過融合多粒度圖片注入和時間建模技術(shù),使用預(yù)訓(xùn)練的Stable Diffusion 1.5和CLIP編碼器,提高視頻與原始圖片的一致性。