
OpenAI發(fā)布了最新大語言模型GPT-5。OpenAI在上周四表示,新款生成式AI模型將免費(fèi)提供給消費(fèi)者使用,并為廣受歡迎的聊天機(jī)器人ChatGPT的最新版本提供支持,它代表了“我們迄今為止最智能、最快速、最實(shí)用的模型,其內(nèi)置的思考能力讓每個(gè)人都輕松擁有專家級智能”。
如果你想知道OpenAI為何對該模型如此自信,以及與該公司之前的GPT模型(或與Claude、Gemini或Llama等競爭對手的AI模型)相比,GPT-5有哪些更出眾的特性或不同之處,下文簡要介紹了GPT-5中一些最重要的新特性和功能:
更容易使用
OpenAI 產(chǎn)品的近期版本曾強(qiáng)迫用戶為不同任務(wù)選擇要使用的模型類型——是選擇 OpenAI的o系列“推理”模型用于復(fù)雜研究,還是選擇標(biāo)準(zhǔn)GPT模型快速得出結(jié)果。GPT-5 使用了一個(gè)“實(shí)時(shí)路由器”來自動(dòng)化這一過程,為合適的任務(wù)挑選合適的工具,因此用戶無需再手動(dòng)選擇。
專屬個(gè)性
ChatGPT將允許用戶在與它互動(dòng)時(shí)從四種預(yù)設(shè)的“個(gè)性”中選擇,分別是:“憤世嫉俗者”、“機(jī)器人”、“傾聽者”和“書呆子”。這些個(gè)性旨在讓使用聊天機(jī)器人的感覺更自然、更符合語境。如果你想要多一點(diǎn)諷刺,就選擇“憤世嫉俗者”;而如果你是為了工作使用,“高效而直率”的“機(jī)器人”個(gè)性可能更合適。
更少幻覺
OpenAI聲稱GPT-5不太可能編造信息或產(chǎn)生“幻覺”。據(jù)OpenAI稱,在啟用網(wǎng)絡(luò)搜索并使用匿名提示的測試中,GPT-5出現(xiàn)事實(shí)錯(cuò)誤的可能性比GPT-4o低 45%;在“思考”時(shí),GPT-5出錯(cuò)的可能性比OpenAI o3低80%。但這仍未根除幻覺現(xiàn)象,正如Mashable網(wǎng)站所解釋的那樣,這意味著在處理常見任務(wù)時(shí),GPT-5每十次仍會(huì)出現(xiàn)一次幻覺。
更出色的寫手
據(jù)OpenAI稱,GPT-5的寫作能力遠(yuǎn)超前代模型,能創(chuàng)作出更具“吸引力、更能引起共鳴、具有文學(xué)深度和韻律”的文字。該公司并列對比了GPT-5與GPT-4o在婚禮祝酒詞和詩歌創(chuàng)作等領(lǐng)域的文筆表現(xiàn)。
更優(yōu)秀的編程工具
雖然之前的GPT版本已具備軟件編程能力,但OpenAI表示,GPT-5使其“氛圍編程”功能在易用性和成熟度上均有所提升,允許用戶通過單一提示“創(chuàng)建美觀且響應(yīng)迅速的網(wǎng)站、應(yīng)用程序和游戲”。
智能體能力
GPT-5與谷歌郵箱(Gmail)和谷歌日歷(Google Calendar)集成,可協(xié)助處理日程安排、提醒、郵件跟進(jìn)和其他效率管理任務(wù)。(此功能初期將僅限于該公司付費(fèi)“專業(yè)版”會(huì)員使用。)
健康領(lǐng)域
大語言模型已成為人們獲取醫(yī)療信息和健康建議的一種流行方式。OpenAI表示,在HealthBench測試中,GPT-5的得分高于其任何前代模型,并且它的表現(xiàn)更像“一個(gè)積極的思考伙伴,會(huì)主動(dòng)標(biāo)記潛在問題,并通過提問來生成更有幫助的答案”。當(dāng)然,OpenAI 也指出它并不能替代專業(yè)醫(yī)療人士。
效果因人而異
以上只是部分新特性和改進(jìn),它們將為消費(fèi)者和企業(yè)提供大量機(jī)會(huì)來試驗(yàn)最新模型,并將其與當(dāng)前常用的模型進(jìn)行比較。該模型究竟是代表了一次重大飛躍,還是一次迭代改進(jìn),在未來幾天和幾周內(nèi),隨著外部專家對該模型的測試以及真實(shí)用戶的使用體驗(yàn),情況會(huì)逐漸明朗。路透社采訪的早期測試者表示,從GPT-4到GPT-5的改進(jìn)“不如”從GPT-3到GPT-4的改進(jìn)幅度大。AI專家、常持懷疑態(tài)度的加里·馬庫斯表示:“粉絲們?nèi)詴?huì)找到值得欣喜之處,但GPT-5并非人們期待已久的巨大飛躍。” (財(cái)富中文網(wǎng))
譯者:劉進(jìn)龍
審校:汪皓
OpenAI發(fā)布了最新大語言模型GPT-5。OpenAI在上周四表示,新款生成式AI模型將免費(fèi)提供給消費(fèi)者使用,并為廣受歡迎的聊天機(jī)器人ChatGPT的最新版本提供支持,它代表了“我們迄今為止最智能、最快速、最實(shí)用的模型,其內(nèi)置的思考能力讓每個(gè)人都輕松擁有專家級智能”。
如果你想知道OpenAI為何對該模型如此自信,以及與該公司之前的GPT模型(或與Claude、Gemini或Llama等競爭對手的AI模型)相比,GPT-5有哪些更出眾的特性或不同之處,下文簡要介紹了GPT-5中一些最重要的新特性和功能:
更容易使用
OpenAI 產(chǎn)品的近期版本曾強(qiáng)迫用戶為不同任務(wù)選擇要使用的模型類型——是選擇 OpenAI的o系列“推理”模型用于復(fù)雜研究,還是選擇標(biāo)準(zhǔn)GPT模型快速得出結(jié)果。GPT-5 使用了一個(gè)“實(shí)時(shí)路由器”來自動(dòng)化這一過程,為合適的任務(wù)挑選合適的工具,因此用戶無需再手動(dòng)選擇。
專屬個(gè)性
ChatGPT將允許用戶在與它互動(dòng)時(shí)從四種預(yù)設(shè)的“個(gè)性”中選擇,分別是:“憤世嫉俗者”、“機(jī)器人”、“傾聽者”和“書呆子”。這些個(gè)性旨在讓使用聊天機(jī)器人的感覺更自然、更符合語境。如果你想要多一點(diǎn)諷刺,就選擇“憤世嫉俗者”;而如果你是為了工作使用,“高效而直率”的“機(jī)器人”個(gè)性可能更合適。
更少幻覺
OpenAI聲稱GPT-5不太可能編造信息或產(chǎn)生“幻覺”。據(jù)OpenAI稱,在啟用網(wǎng)絡(luò)搜索并使用匿名提示的測試中,GPT-5出現(xiàn)事實(shí)錯(cuò)誤的可能性比GPT-4o低 45%;在“思考”時(shí),GPT-5出錯(cuò)的可能性比OpenAI o3低80%。但這仍未根除幻覺現(xiàn)象,正如Mashable網(wǎng)站所解釋的那樣,這意味著在處理常見任務(wù)時(shí),GPT-5每十次仍會(huì)出現(xiàn)一次幻覺。
更出色的寫手
據(jù)OpenAI稱,GPT-5的寫作能力遠(yuǎn)超前代模型,能創(chuàng)作出更具“吸引力、更能引起共鳴、具有文學(xué)深度和韻律”的文字。該公司并列對比了GPT-5與GPT-4o在婚禮祝酒詞和詩歌創(chuàng)作等領(lǐng)域的文筆表現(xiàn)。
更優(yōu)秀的編程工具
雖然之前的GPT版本已具備軟件編程能力,但OpenAI表示,GPT-5使其“氛圍編程”功能在易用性和成熟度上均有所提升,允許用戶通過單一提示“創(chuàng)建美觀且響應(yīng)迅速的網(wǎng)站、應(yīng)用程序和游戲”。
智能體能力
GPT-5與谷歌郵箱(Gmail)和谷歌日歷(Google Calendar)集成,可協(xié)助處理日程安排、提醒、郵件跟進(jìn)和其他效率管理任務(wù)。(此功能初期將僅限于該公司付費(fèi)“專業(yè)版”會(huì)員使用。)
健康領(lǐng)域
大語言模型已成為人們獲取醫(yī)療信息和健康建議的一種流行方式。OpenAI表示,在HealthBench測試中,GPT-5的得分高于其任何前代模型,并且它的表現(xiàn)更像“一個(gè)積極的思考伙伴,會(huì)主動(dòng)標(biāo)記潛在問題,并通過提問來生成更有幫助的答案”。當(dāng)然,OpenAI 也指出它并不能替代專業(yè)醫(yī)療人士。
效果因人而異
以上只是部分新特性和改進(jìn),它們將為消費(fèi)者和企業(yè)提供大量機(jī)會(huì)來試驗(yàn)最新模型,并將其與當(dāng)前常用的模型進(jìn)行比較。該模型究竟是代表了一次重大飛躍,還是一次迭代改進(jìn),在未來幾天和幾周內(nèi),隨著外部專家對該模型的測試以及真實(shí)用戶的使用體驗(yàn),情況會(huì)逐漸明朗。路透社采訪的早期測試者表示,從GPT-4到GPT-5的改進(jìn)“不如”從GPT-3到GPT-4的改進(jìn)幅度大。AI專家、常持懷疑態(tài)度的加里·馬庫斯表示:“粉絲們?nèi)詴?huì)找到值得欣喜之處,但GPT-5并非人們期待已久的巨大飛躍。” (財(cái)富中文網(wǎng))
譯者:劉進(jìn)龍
審校:汪皓
OpenAI has released its new LLM model GPT-5. The new generative AI model, which will be available to consumers for free and power the newest version of the popular ChatGPT bot, represents “our smartest, fastest, most useful model yet, with built-in thinking that puts expert-level intelligence in everyone’s hands,” OpenAI said on Thursday.
If you’re wondering what all the hoopla is about, and what makes GPT-5 better, or different, than the company’s previous GPT models (or from rival AI models like Claude, Gemini, or Llama), here’s a quick rundown of some of the most important new features and functions available in GPT-5:
Easier to use
Recent versions of OpenAI products have forced users to choose the type of model they wanted to use for different tasks – OpenAI’s o family of “reasoning” model for complicated research, or the standard GPT for speedy results. GPT-5 uses a “real time router” that automates the process, picking the right tool for the right job so you don’t have to.
Special personalities
ChatGPT will now let users choose from four different pre-set “personalities” when they interact with it: “cynic,” “robot,” “l(fā)istener,” and “nerd.” These personalities are intended to make using the chatbot feel more natural and context-appropriate. If you want a bit more sarcasm, choose cynic, whereas if you’re using it for work, the “efficient and blunt” robot persona might be better.
Fewer hallucinations
OpenAI claims that GPT-5 is less prone to inventing information, or hallucinating. According to OpenAI, GPT-5 was 45% less likely to contain a factual error than GPT-4o in tests in which it had web search enabled and used anonymized prompts; when “thinking”, GPT-5 was 80% less likely to contain an error than OpenAI o3. But that still doesn’t eradicate hallucinations, and as Mashable explains, it means that GPT-5 will still hallucinate one out of every ten times on common tasks.
A better writer
According to OpenAI, GPT-5 is a much better writer than its predecessors, producing more “compelling, resonant writing with literary depth and rhythm.” The company provided side-by-side comparisons of GPT-5’s penmanship versus GPT-4o for things like wedding toasts and poems.
A better coder
While previous versions of GPT had software coding capabilities, OpenAI says GPT-5 brings improved ease and sophistication to its “vibe coding” functionality, allowing users to “create beautiful and responsive websites, apps, and games” in a single prompt.
Agentic capabilities
GPT-5 integrates with Gmail and Google Calendar to assist with scheduling, reminders, email follow ups, and other productivity tasks. (This capability will be initially limited to users of the company’s paid “pro” membership.)
Health
LLMs have become a popular way for people to get medical information and health advice. OpenAI says GPT-5 scores higher than any of its previous models on the HealthBench test, and that it acts more like “an active thought partner, proactively flagging potential concerns and asking questions to give more helpful answers.” Of course, OpenAI also points out that it does not replace a medical professional.
Your mileage may vary
Those are just a few of the new features and improvements, which will provide plenty of opportunity for consumers and businesses to experiment with the latest model and compare it to their current go-to models. Whether it represents a major leap forward, or more of an iterative improvement will become clear in the days and weeks ahead as outside experts test the model and real world users play around with it. Early testers interviewed by Reuters said the improvement from GPT-4 to GPT-5 is “not as large” as the one from GPT-3 to GPT-4. AI expert and often-skeptic Gary Marcus says: “Fans will still find something to rejoice in, but GPT-5 is not the huge leap forward people long expected.”