人工智能聊天機(jī)器人領(lǐng)域烽煙再起,谷歌和 OpenAI 之間激烈的競爭態(tài)勢愈演愈烈。就在谷歌一年一度的 I / O 開發(fā)者大會召開前夕,這家科技巨頭發(fā)布了一段視頻,展示了疑似經(jīng)過升級的 Gemini 聊天機(jī)器人。視頻中,Gemini 可以同時實時處理來自視頻和語音的輸入。
這段視頻貌似是在 I / O 大會搭建現(xiàn)場拍攝的,視頻展示了 Gemini 在一臺 Pixel 手機(jī)上流暢地處理實時視頻和語音提問,并準(zhǔn)確地提供信息。當(dāng)被問到正在進(jìn)行的布置工作時,Gemini 正確識別出這是為一個重要活動做的準(zhǔn)備。
整個對話過程自然流暢,Gemini 還會詢問用戶注意到的細(xì)節(jié),成功識別出了該活動為谷歌 I / O 開發(fā)者大會,并進(jìn)行了簡要介紹。
谷歌發(fā)布該預(yù)告片的時機(jī)非常巧妙,恰好在 OpenAI 有關(guān) ChatGPT 的發(fā)布會前幾個小時,OpenAI 在此發(fā)布會上推出了全新的 ChatGPT-4o 大模型,其理解和對話的流暢性以及連貫性方面都達(dá)到了無與倫比的水平。
雖然過去的一些演示視頻讓外界對這類內(nèi)容持有一定的懷疑態(tài)度,但今天展示的案例無疑證實了人工智能聊天機(jī)器人可以無縫集成語音和視頻輸入。這種多模態(tài)能力,加上非常自然的對話流,讓我們仿佛看到了未來人工智能交互的一瞥。
(碼上科技)
微信小程序主體變更操作教程:詳細(xì)步驟與注意事項 09:14:05
服務(wù)預(yù)約小程序開發(fā)具備哪些優(yōu)勢? 09:11:39
AI 聊天機(jī)器人大戰(zhàn)升溫:谷歌 Gemini 預(yù)告片展示驚艷語音視頻交互能力 09:08:19
谷歌搜索引擎問世 25 年最大更新之一,“AI Overviews”體驗正式上線 09:05:51
蘋果聲稱 2024 款 iPad Pro 不易變彎,散熱金屬板可充當(dāng)平板電腦“中央肋骨” 09:02:27
蘋果 iOS / iPadOS 17.5 正式版發(fā)布,歐盟用戶可直接從網(wǎng)站下載應(yīng)用 09:18:01