咱中國人愛算命這事,是刻在骨子里的執(zhí)念。
出門前要看看黃歷、辦公室要講風(fēng)水、就連談戀愛換工作也要算算領(lǐng)導(dǎo)和對象的星座和八字合不合適。
算命姿勢也是無奇不有,用八字星座塔羅牌已屬過去式,寺廟求簽不夠潮。
這不,有位中國人就在ChatGPT上訓(xùn)練了一個(gè)“算命專用AI”——然后迅速成為GPTs中文榜排名第一的應(yīng)用。
它可以根據(jù)你的生日提供命理分析,預(yù)測你未來3到5年的人生趨勢,作者對它的定義是:“傳統(tǒng)與科技融合、趣味與理性結(jié)合的命理推測工具,準(zhǔn)確到可怕?!?/p>
實(shí)際上就是在GPTs里上傳了這些PDF,然后用prompt告訴應(yīng)用去深入學(xué)習(xí)這些文檔,融會貫通掌握中國古代命理八字算命技術(shù),然后根據(jù)用戶輸入的生日,按照固定的格式輸出結(jié)果。
然后就得到了當(dāng)今網(wǎng)絡(luò)三大邪術(shù)之一:賽博算命。
附上鏈接,感興趣的硅友們可以自己試試:https://chat.openai.com/g/g-cbNeVpiuC-aisuan-ming。
不過這還不算什么,丹麥一研究團(tuán)隊(duì)做了個(gè)大模型,名為“Life2vec”,字面意思是“人生變向量”,可以直接預(yù)測人的死亡率,準(zhǔn)確率高達(dá)78%,據(jù)稱是市面上準(zhǔn)確度最高的預(yù)測方式。
這誰敢試?
(圖源:微博)
之前團(tuán)隊(duì)就曾經(jīng)嘗試過用機(jī)器學(xué)習(xí)模型,結(jié)合健康、家庭、教育因素來預(yù)測一個(gè)孩子未來生活的走向,結(jié)果準(zhǔn)確率很低。
感謝transformer算法,現(xiàn)在他們能夠?qū)⑸鲜鲞@些因素形成一個(gè)完整的時(shí)間序列軸,從而大幅提升了預(yù)測的準(zhǔn)確度。
于是團(tuán)隊(duì)找來了600萬丹麥人12年里生活的點(diǎn)點(diǎn)滴滴,從住哪兒、在哪個(gè)學(xué)校上學(xué)、現(xiàn)在在哪里工作、一個(gè)月賺多少錢等等一應(yīng)俱全。
乍一看很像過年回家接受七大姑八大姨查戶口,這個(gè)還更費(fèi)勁,盤問一年只來一次,而他們是365天不間斷記錄。
數(shù)據(jù)要用在大語言模型上,那就要變成語言模型能讀懂的句子。
所以團(tuán)隊(duì)把這些雞毛蒜皮的事兒整理成了一條條人生軌跡,比如:在2010年8月,艾格尼斯女士的工作是助產(chǎn)護(hù)士,月入3萬丹麥克朗。再輔以這個(gè)人的出生日期和地址等信息,就形成了一個(gè)完整的鏈條。
從下圖來看,這個(gè)模型預(yù)測生死的主要指標(biāo)分為七個(gè):健康水平、出生年份、住址、行業(yè)、工作崗位、收入水平、勞動能力。
這些彩色的小點(diǎn)就是語料庫里的token,每種顏色代表一個(gè)種類。
那高達(dá)78%準(zhǔn)確率的死亡率預(yù)測又是怎么來呢?研究人員還是用了最傳統(tǒng)的方式,把數(shù)據(jù)庫分兩半,用前8年的數(shù)據(jù)訓(xùn)練模型,預(yù)測剩下4年里的死亡率,下圖圓點(diǎn)是預(yù)測出來的死亡率,從黃到綠代表死亡率從低到高。
簡單來說,綠色點(diǎn)代表模型預(yù)測中后面四年死亡率極高的人,而紅點(diǎn)則是真實(shí)世界中確認(rèn)死亡的人。
據(jù)此得出結(jié)論,模型說“你的死亡率極高”,那有78%的概率代表他說的沒錯(cuò)。
話又說回來,這模型發(fā)現(xiàn)的英年早逝的風(fēng)險(xiǎn)因素過于平平無奇了——比如收入低、比如身體不好、比如接受過心理治療。
有意思的是,在丹麥,男性、且具有高級職業(yè)技能的人群死亡風(fēng)險(xiǎn)更高一些,難道是因?yàn)檫^勞?
不過倒也不用擔(dān)心到自己頭上,模型是根據(jù)丹麥人真實(shí)的生活數(shù)據(jù)訓(xùn)練出來的,預(yù)測出來的結(jié)果也是僅丹麥適用。
按照團(tuán)隊(duì)的設(shè)想,這個(gè)模型可以在早期預(yù)測到還沒發(fā)生的健康或社會問題,幫助政府對癥下藥,盡早消滅不平等問題。不過要是保險(xiǎn)公司用上這套模型,那你就可以根據(jù)保費(fèi)的漲幅來推測自己剩余的年限了。
團(tuán)隊(duì)成員也早想到了這點(diǎn),強(qiáng)烈不建議這個(gè)大模型商業(yè)化,尤其提防保險(xiǎn)行業(yè)。
科技總是一把雙刃劍,具體看往哪個(gè)方向揮。其實(shí)類似的預(yù)測模型之前也出現(xiàn)過,澳大利亞一個(gè)團(tuán)隊(duì)可以通過數(shù)據(jù)預(yù)測青少年的自殘和自殺企圖,準(zhǔn)確率比專業(yè)心理醫(yī)生還高。
所以建模和預(yù)測這件事本身沒有問題,主要還看模型的用途是什么。
說到用途,Life2vec的用途還不止能預(yù)測死亡率這么簡單,它還能根據(jù)你的人生軌跡來反推你的性格。
團(tuán)隊(duì)從性格測試方面比較權(quán)威的模型里挑了一些題目,然后找了一些信息在他們數(shù)據(jù)庫中的人來做性格測試。
比如在“我更喜歡跟別人一起工作而不是一個(gè)人埋頭苦干”這道題上得分更高的人,更喜歡交際。
然后把人做的結(jié)果跟模型預(yù)測相比較,發(fā)現(xiàn)預(yù)測的準(zhǔn)確度比盲猜和神經(jīng)網(wǎng)絡(luò)算法高得多。
看起來還挺眼熟,這不就是MBTI性格測試嘛!
比如自己選擇當(dāng)理發(fā)師的人,大多不會是I人;身體不好需要長期臥床休養(yǎng)的人,性格上大致不會太活潑。
但比起現(xiàn)在性格測試界主流的做題,相對來說用大模型其實(shí)更能真實(shí)的反映一個(gè)人的性格。畢竟做題憑借的是測試者對自己的主觀評價(jià),而模型用的直接是生活中的行為。
不保證沒有一些人嘴上說著“一旦確定了目標(biāo),我會堅(jiān)持努力低實(shí)現(xiàn)它”,然后一年兩年三年過去了體重還是沒有變化。
相比較之前社會科學(xué)界常用出現(xiàn)的“我們發(fā)現(xiàn)收入越高的人群預(yù)期壽命越長”這種類似廢話的研究,Life2vec第一次真正站在個(gè)人的角度上,提供了一個(gè)可以從今天的選擇,窺探未來人生樣貌的可能。
不管怎么說,這種靠數(shù)據(jù)算命的方式總比互聯(lián)網(wǎng)玄學(xué)大師要強(qiáng)太多。
比如下面這位,先選幾個(gè)功成名就的大哥出來,然后找他們臉上有什么共同點(diǎn),這就叫面相大師了?
那我也來一個(gè):都說姓馬的人容易成大事,不少知名企業(yè)家都姓馬,比如……..。
論文原文pdf放在百度網(wǎng)盤里了,感興趣的讀者可以關(guān)注后回復(fù):“算命”。即可獲取全文。