我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
什么樣的“大模型原生”游戲,讓各大算法競賽群里都在玩,還把服務(wù)器擠爆了?
這款突然爆火的《完蛋!LLM》,讓你在解謎挑戰(zhàn)之中輕松學(xué)會(huì)大模型提示詞技巧,達(dá)成1 日用戶破萬的成就。
難度循序漸進(jìn),比如第一題初來乍到只是“請你構(gòu)造一個(gè)問題,使模型的回答是一字不差的‘1+1=3’”。
到最難的一道題惜字如金已經(jīng)是“請輸入一個(gè)字的問題,使模型的回答在 16 個(gè)字以內(nèi)。”
有網(wǎng)友自爆,從凌晨三點(diǎn)直接肝到五點(diǎn),除了最難的一題全通了。
游戲作者也曬了一波后臺新增用戶數(shù)據(jù),按小時(shí)統(tǒng)計(jì),妥妥的指數(shù)增長。
如果表格還不夠直觀,我們讓 ChatGPT 畫成折線圖再感受一下。
作者范浩強(qiáng),曠視 6 號員工。當(dāng)年以 IOI 金牌、保送清華姚班、高二實(shí)習(xí)等傳奇事跡被譽(yù)為天才少年。
如今他已是曠視科技研究總經(jīng)理,谷歌學(xué)術(shù)h-index 27 的行業(yè)大佬。
和 AI 斗智斗勇
游戲的玩法是這樣的:
整個(gè)游戲一共分為五章,15 個(gè)問題,每一章對應(yīng)不同的主題。
玩家要做的就是設(shè)計(jì)提示詞,想方設(shè)法讓模型輸出指定答案。
第一章的目的主要是讓玩家熟悉一下氣氛,任務(wù)自然也比較簡單。
第一道題是要想辦法讓模型輸出“1+1=3”,這里只要利用讓模型重復(fù)的方法就能輕松破解。
后面的三道題只對模型輸出內(nèi)容的長度有要求,比如只用一個(gè)字“四兩撥千斤”,讓模型給出 100 字以上的回答,具體包括:
三個(gè)字以內(nèi),輸出 30+ 字
只用一個(gè)字,輸出 100+ 字
只用一個(gè)字,輸出不超過 20 字
這道題乍一看似乎沒什么思路,這時(shí)候就需要觀察模型輸出的規(guī)律了。
嘗試幾個(gè)字之后可以發(fā)現(xiàn),大模型面對只有一個(gè)字的提示詞時(shí)喜歡干這樣幾件事:對這個(gè)字進(jìn)行解釋、補(bǔ)全成一句簡單的話,或者干脆直接說不明白要干什么……
這時(shí),如果想要模型輸出的文字多,就可以選擇含義比較多的字,然后多次嘗試讓模型對這個(gè)字進(jìn)行解釋;而要想讓輸出比較短,就可以用“哈”這樣沒什么實(shí)際含義的字了。
熟悉了玩法之后,第二章就開始上難度了,這時(shí)輸出的條件變得更加嚴(yán)格。
第一題是要求輸入質(zhì)數(shù)個(gè)字,使得模型輸出的字?jǐn)?shù)剛好是下一個(gè)質(zhì)數(shù)。
但事實(shí)證明,這個(gè)想法有些太簡單了:
先不說大模型的數(shù)數(shù)能力,就算能數(shù)好,大模型眼里的基本元素是 token,而不是我們所看到的文字……
隨著游戲的深入,問題變得越來越刁鉆,解法中包含的運(yùn)氣成分……也越來越少了。
游戲的過程就是這樣,那么我們從中都能學(xué)到些什么呢?
模型的輸出當(dāng)中存在一些規(guī)律,我們不斷調(diào)整提示詞獲得預(yù)期答案的過程,就是在了解提示工程中問題的設(shè)計(jì)方式。
此外,我們也可以從模型對一些意義不明的數(shù)字、單字的反應(yīng),窺視出一些模型處理這些問題的規(guī)律。
無論這些規(guī)律是 bug 還是 feature,我們都要摸清規(guī)律,才能更好地掌握模型的使用方法,這也正是學(xué)習(xí)提示工程的核心奧義。
最后,也不得不佩服網(wǎng)友們的創(chuàng)造力,到后期即使服務(wù)器不堪重負(fù)報(bào)錯(cuò)了,仍能從報(bào)錯(cuò)信息中找出正確解法。
大模型時(shí)代的個(gè)人開發(fā)者
很遺憾,最后在累計(jì)用戶破萬之際,由于服務(wù)器擠爆、維護(hù)工作強(qiáng)度大等原因,作者本人不得已把游戲關(guān)服了。
雖然原版游戲已經(jīng)玩不到了,但網(wǎng)友們對這套解謎挑戰(zhàn)題的興趣依然不減。
拿去和 ChatGPT 等各路 AI 手動(dòng)過招,依然能在斗智斗勇中學(xué)到不少操作大模型的知識技巧。
△網(wǎng)友讓 ChatGPT 說出1+1=3 的解法
對這段“從一夜過萬到關(guān)站跑路”的奇幻之旅,范浩強(qiáng)也分享了作為當(dāng)事人的心路歷程。
范浩強(qiáng)認(rèn)為,個(gè)人開發(fā)者在大模型時(shí)代可以是“孤獨(dú)俠客”,單人、業(yè)余時(shí)間就能開發(fā)出創(chuàng)新、有影響力的作品。
制作這款游戲,最初只是因?yàn)槭盏酱竽P蛣?chuàng)業(yè)公司月之暗面送來的免費(fèi) API 體驗(yàn)賬號。
他結(jié)合之前已有的初步想法,花一個(gè)周六時(shí)間制作完成。
有朋友建議他,趁著國產(chǎn)游戲《完蛋!我被美女包圍了!》爆火出圈的時(shí)機(jī),把游戲名也起成“完蛋!”開頭,找對了流量密碼。
接下來隨著用戶不斷增長,已超乎他一個(gè)人的能力處理范圍。
作為開發(fā)者,一整天時(shí)間,他都在不停修服務(wù)器以及與月之暗面反饋。
作為大模型供應(yīng)方,月之暗面為這個(gè)免費(fèi) API 付出的算力也快要超出預(yù)算了。
另外在生成式模型的合規(guī)方面,也需要慎重考慮。
最后范浩強(qiáng)做了一個(gè)“艱難的決定”,把游戲關(guān)服,但還是希望將來有人能把這個(gè)玩法發(fā)揚(yáng)光大,探索出更多 AI 模型的秘密。
最后他總結(jié)出三點(diǎn)思考:
“大模型與人的關(guān)系”仍是一片未被發(fā)掘的處女地,給從業(yè)者帶來機(jī)會(huì)
國產(chǎn)大模型逐漸被認(rèn)可,創(chuàng)新玩法亟待開發(fā)
合規(guī)、安全仍是從業(yè)人員必須要解決的問題
One More Thing
一個(gè)好消息,雖然原版游戲已關(guān)閉,但完整題目列表已公開,已有人搞出開源復(fù)現(xiàn)版。
還支持中英文,以及不同大模型版本,Huggingface 可玩。
(也是前面游戲介紹中使用的版本。)
姚班天才開發(fā)《完蛋!我被大模型包圍了》游戲爆火,擠爆服務(wù)器 09:23:58
Netflix 版《三體》劇集片段公布,明年 3 月 21 日上線 09:19:44
消息稱谷歌正在洽談投資聊天機(jī)器人初創(chuàng)公司 Character AI 09:15:57
西南航空預(yù)計(jì)波音 737 MAX 7 飛機(jī)明年 4 月獲得認(rèn)證,10-11 月投入運(yùn)營 09:12:16
數(shù)智展翼 扶搖萬里——中興通訊精彩亮相2023數(shù)字科技生態(tài)大會(huì) 09:06:41
進(jìn)博直擊丨英特爾高宇:AI PC本地運(yùn)行大模型,成本更低 09:03:43