大型科技公司因反壟斷違規(guī)、侵犯隱私以及對工人、消費者和競爭造成損害而受到聯(lián)邦監(jiān)管機構(gòu)日益嚴(yán)格的審查。與此同時,兩黨的立法者都表示支持對科技平臺進(jìn)行監(jiān)管,認(rèn)識到目前科技領(lǐng)域還沒有一套全面的規(guī)則。
Copilot Chat除了支持的傳統(tǒng)的文本生成、文件分析(PDF、Word等)、圖像生成之外,最大亮點便是支持AI Agent功能,并且集成在了Microsoft 365商業(yè)版中,可直接調(diào)用企業(yè)自有數(shù)據(jù),執(zhí)行夸端到端的超復(fù)雜自動化業(yè)務(wù)流程。
同時開發(fā)者對AI Agent自動化行為的可觀測性、控制能力、多層級Agent之間的協(xié)作有了更高的需求。所以,微軟對AutoGen 進(jìn)行了大更新,發(fā)布0.4版本一次性解決所有問題。
OpenAI特別指出,芯片、數(shù)據(jù)、能源和人才是贏得這場AI競賽的4大關(guān)鍵元素,而中國受到芯片限制是這4大元素中最弱的環(huán)節(jié),也是美國領(lǐng)先的優(yōu)勢。
Cosmos能從數(shù)據(jù)整合、訓(xùn)練再到定制各個開發(fā)階段的,大規(guī)模模擬、構(gòu)建物理世界的基礎(chǔ)模型,同時支持自定義微調(diào)。
AGI的核心本質(zhì)就是將不同的業(yè)務(wù)流程實現(xiàn)自動化,把人類從枯燥、無意義的業(yè)務(wù)流程中解放出來,將時間、精力用在商業(yè)價值更高的業(yè)務(wù)上。
目前,Transformer架構(gòu)的預(yù)訓(xùn)練大模型在存儲、查詢數(shù)據(jù)時,隨著參數(shù)的變大對算力的需求呈指數(shù)級增長!坝洃泴印碧岢隽诵碌母咝Р樵儥C制替代了傳統(tǒng)的查詢方法,通過比較查詢鍵與兩個較小集合中的鍵,可以快速找到最相關(guān)的鍵,而無需遍歷模型的整個記憶層。
研究人員在著名開源文生圖像模型FLUX進(jìn)行了實驗。結(jié)果顯示,成功將FLUX的模型量化到1.58位權(quán)重,僅用{-1, 0, +1}三種值就能表示而不是更高精度的浮點數(shù)。
DeepSeek僅用了280萬小時的GPU算力,就訓(xùn)練出了比Llama-3 405B(使用3080萬小時GPU)更強的前沿模型,整體成本節(jié)省了11倍左右,將算力發(fā)揮到了極致。
AGI(通用人工智能)、Agents(智能體)、更好的GPT-4o升級版、更好的記憶存儲、更好的上下文窗口、成人模式、深度研究特色功能、更好的Sora、更好的個性化定制。
RVT雖然解決了PerAct的一些功能缺陷,但在處理需要高精度的任務(wù)時仍存在困難。所以,英偉達(dá)的研究人員在RVT基礎(chǔ)之上研發(fā)出了第二代,訓(xùn)練效率比第一代快6倍,推理效率快2倍,僅10次示范學(xué)習(xí)就能執(zhí)行各種高精度任務(wù)。
根據(jù)發(fā)布的o3測試數(shù)據(jù)顯示,美國AIME數(shù)學(xué)競賽中達(dá)到了96.7分,大幅度超過了o1預(yù)覽版的56.7和o1的83.3%,僅錯了一道題相當(dāng)于一名頂級數(shù)學(xué)家的水平。
偏好微調(diào)特別適合那些對回答格式、語氣或者抽象特質(zhì)(如友好度、創(chuàng)造力)有較高要求的應(yīng)用場合。例如,在構(gòu)建金融咨詢聊天機器人時,開發(fā)團隊不僅希望模型能夠提供專業(yè)且準(zhǔn)確的財務(wù)建議,還期望它能保持友好和易于理解的溝通方式。
ChatGPT還與超級應(yīng)用WhatsApp完成了集成,同樣是這個號碼可以直接發(fā)短信咨詢各種內(nèi)容,使用方法和web、移動版本一樣。
新增的功能包括,實時搜索,OpenAI對搜索的算法進(jìn)行了深度優(yōu)化,可在用戶提出問題后獲取實時內(nèi)容(分鐘級別),包括股票、新聞等;高級語音,在高級語音模式下,用戶可以與ChatGPT進(jìn)行更自然的多輪搜索對話,更像是一位語音搜索管家;
Phi系列模型自今已經(jīng)發(fā)布了5代,Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。但在GPQA研究生水平、MATH數(shù)學(xué)基準(zhǔn)中,分別達(dá)到了56.1和80.4超過了GPT-4o,同時也超過了同類型的開源模型Qwen 2.5 -14B和Llama-3.3-70B。
現(xiàn)在ChatGPT已經(jīng)從一個單一的AI對話,演變成一個高效率的協(xié)作平臺,無論是開發(fā)代碼、分析文件、搜索新聞都非常方便,成為提升工作效率的利器。
Canvas直接內(nèi)置在ChatGPT中,提供了一個單獨的窗口,主要用于編程、寫作任務(wù),會提供意見、審核和執(zhí)行具體的功能,可以提供更細(xì)致的服務(wù)。
Sora的核心技術(shù)之一便是對Patch的應(yīng)用。它允許Sora在大量的圖像和視頻數(shù)據(jù)上進(jìn)行密集訓(xùn)練。從每一個存在的視頻中剪出的Patch,可以被堆疊起來并輸入到模型中。
谷歌DeepMind研究人員則直接把這項技術(shù)集成到AI Agent中開發(fā)了Talker-Reasoner框架,讓其具備“快”、“慢”兩種擬人化思考方式。這對于解決復(fù)雜、冗長的任務(wù)來說幫助巨大,也突破了傳統(tǒng)AI Agent執(zhí)行業(yè)務(wù)流程的方法,極大提升了效率。