金色財經
作者:Andy Hall,a16z研究顧問兼斯坦福大學政治經濟學教授;來源:a16z crypto;編譯:Shaw 金色財經
去年,有關委內瑞拉總統選舉結果的預測市場合約交易額超過 600 萬美元。但計票結束後,該市場陷入兩難境地:政府宣布尼古拉斯·馬杜羅獲勝;反對派和國際觀察員則稱選舉存在舞弊。預測市場合約的結算應依據「官方資訊」(馬杜羅獲勝)還是「可信報導的共識」(反對派獲勝)?
在委內瑞拉的選舉中,觀察員提出了各種各樣的指控:規則被忽視,參與者的「錢被偷了」;爭端解決機制在一場高風險的政治鬧劇中扮演了「法官、陪審團和劊子手」的角色;選舉過程本身被「嚴重操縱」。
這並非孤立的小插曲,而是預測市場規模化發展過程中面臨的最大瓶頸之一:合約結算的體現。
這裡風險很高。如果結果判定準確,人們就會信任你的市場,願意在其中交易,價格也會成為對社會有意義的信號。如果結果判定有誤,交易就會令人感到沮喪和難以預測。參與者可能會流失,流動性面臨枯竭的風險,價格不再反映穩定目標的準確預測。相反,價格會開始反映結果實際發生的機率與交易者對扭曲的結果判定機制如何裁決的信念之間的模糊混合。
委內瑞拉爭端雖然備受矚目,但各平台上的類似失誤也時有發生:
烏克蘭地圖操縱事件表明,對手可以直接操縱爭端解決機制。一份關於領土控制權的合約規定,其結果將依據特定的在線地圖來確定。據稱有人篡改了該地圖以影響合約的結果。當你的事實依據可以被篡改時,你的市場也就可以被操縱。
政府停擺交易合約表明,結算依據可能不準確,甚至導致無法預測的結果。結算規則規定,市場將根據人事管理辦公室(OPM)網站顯示政府停擺結束的時間進行結算。川普總統於11月12日簽署了撥款法案,但出於不明原因,OPM網站直到11月13日才更新。那些正確預測政府停擺將於12日結束的交易員,由於網站管理員的延遲更新而輸掉了他們的賭注。
澤連斯基穿西裝的市場引發了人們對利益衝突的擔憂。該合約詢問烏克蘭總統澤連斯基是否會在某個特定場合穿西裝——一個看似無關緊要的問題,卻吸引了超過2億美元的賭注。當澤連斯基身着BBC、《紐約郵報》和其他媒體所描述的西裝出現在北約峰會上時,市場最初給出的答案是「是」。但Universal Market Access(UMA協議)代幣持有者對結果提出異議,最終結果變為「否」。
在本文中,我探討了大型語言模型(LLM)與加密技術巧妙結合,如何幫助我們創建大規模預測市場解決方案,使其難以被操縱,同時具備準確性、完全透明性和可信的中立性。
類似的難題也困擾着金融市場。國際掉期與衍生品協會(ISDA)多年來一直在努力解決信用違約互換市場(一種在公司或國家債務違約時支付賠償金的合約)的清算難題,其2024年的評估報告也坦誠地指出了這些難題。ISDA的認定委員會由主要市場參與者組成,負責投票決定是否發生了信用事件。但與UMA的流程一樣,該流程也因缺乏透明度、潛在的利益衝突以及結果不一致而備受詬病。
根本問題是一樣的::當大量資金取決於對模稜兩可的情況作出判定時,每一種解決機制都會成為被鑽空子的目標,而每一種模稜兩可之處都可能成為潛在的導火索。
那麼,一個好的解決機制應該是什麼樣的呢?
任何可行的解決方案都需要同時實現多個關鍵特性。
抵禦操縱的能力。如果對手能夠通過編輯維基百科、散布虛假新聞、賄賂權威機構或利用程序漏洞來影響結果,那麼市場就變成了一場比拼誰操縱手段高明的遊戲,而非比拼誰預測能力更強的遊戲。
合理的準確性。該機制必須在大多數情況下都能做出正確的判斷。在一個充滿真正模糊性的世界裡,絕對的準確性是不可能的,但系統性誤差或明顯的錯誤會嚴重損害其可信度。
事前透明度至關重要。交易者在下注前需要完全了解結算機制的運作方式。交易過程中更改規則違反了平台與參與者之間的基本協議。
可信的中立性。參與者需要相信該機制不會偏袒任何特定的交易者或結果。這就是為什麼讓持有大量UMA合約的參與者來解決他們押注的合約如此成問題:即使他們行事公平,利益衝突的表象也會破壞信任。
人類委員會可以滿足其中一些特性,但在其他方面卻存在不足——尤其是在大規模情況下,難以有效抵禦操縱和保持可信的中立性。像UMA這樣的基於代幣的投票系統也存在著眾所周知的巨鯨主導和利益衝突問題。
這時人工智慧(AI)就派上用場了。
在預測市場領域,有一個提議正逐漸受到關註:使用大型語言模型(LLM)作為評判者,在創建合約時將特定模型和提示鎖定到區塊鏈中。
基本架構的工作原理如下:在合約創建時,做市商不僅要用自然語言指定解決標準,還要指定確切的LLM(通過帶時間戳的模型版本標識)以及用於確定結果的確切提示。
該規範將以加密方式寫入區塊鏈。交易開始時,參與者可以查看完整的結算機制——他們確切地知道哪個AI模型將判斷結果、它將收到什麼提示以及它可以訪問哪些資訊源。
如果他們不喜歡這種交易方式,他們就不會進行交易。
在結算時,已提交的LLM會按照已提交的提示運行,訪問所有指定的資訊源,並做出判斷。該判斷結果決定了誰將獲得報酬。
這種方法可以同時解決幾個關鍵的限制條件:
LLM具有很強的抗操縱性(儘管並非絕對)。與維基百科頁面或小型新聞網站不同,你無法輕易編輯LLM模型的輸出。模型的權重在生成時就已經確定。要操縱其結果,對手要麼需要破壞模型所依賴的資訊源,要麼需要提前很久就以某種方式污染模型的訓練數據——與賄賂預言機或篡改地圖相比,這兩種攻擊方式都代價高昂且風險極大。
準確性高。隨著推理模型的快速發展,它們能夠應對種類繁多的複雜任務,尤其是在能夠瀏覽網路並尋找新資訊的情況下,LLM 模型應該能夠準確地解決許多市場問題——目前,為了解其準確性而進行的實驗仍在進行中。
完全透明。在任何人下注之前,整個結算機制都公開透明,可審計。不會在比賽進行過程中更改規則,不會隨意做出判斷,也不會有任何幕後交易。您完全清楚自己參與的是什麼。
顯著提升可信中立性。LLM模型與結果沒有任何經濟利益關係,不會被收買,也不持有UMA代幣。其偏見,無論具體是什麼,都源於模型本身,而非利益相關方臨時決策的結果。
當然,LLM模型判斷也會有一些侷限性,我將在下面概述和討論這些侷限性:
模型也會犯錯。例如,LLM可能會誤讀新聞報導、臆造事實,或者不一致地應用判別標準。但只要交易者清楚自己使用的是哪個模型,就能將模型的缺陷考慮在內。如果某個模型在處理模糊案例時有特定的傾向,經驗豐富的交易者會對此進行調整。模型不必完美,但必須具有可預測性。
操縱並非不可能,只是難度更大。如果提示資訊指定了特定的新聞來源,攻擊者就可以嘗試在這些來源中植入報導。這種攻擊對大型媒體機構來說代價高昂,但對小型媒體機構來說卻可能有效——這相當於另一種形式的地圖篡改問題。提示資訊的設計至關重要:依賴於多樣化、冗餘資訊源的解析機制比依賴於單一故障點的機制更加穩健。
理論上,投毒攻擊是可能的。擁有足夠資源的對手可以試圖影響LLM模型的訓練數據,從而影響其未來的判斷。但這需要遠在創建合約之前採取行動,收益不確定且成本高昂——這比賄賂委員會成員的難度要高得多。
LLM模型數量的激增會造成協調問題。如果不同的市場參與者選擇不同的LLM和不同的交易提示,流動性就會分散。交易者難以比較合約或匯總跨市場的資訊。標準化固然重要,但讓市場自行探索哪些LLM和交易提示組合效果最佳也同樣重要。正確的做法或許是兩者兼顧:允許試驗,但同時也要建立機制,使市場能夠隨著時間的推移,逐漸趨於一致地採用經過充分驗證的默認設置。
總而言之:基於人工智慧的解決方案本質上是用另一組問題(模型侷限性、工程挑戰、資訊源漏洞)取代了之前的問題(人為偏見、利益衝突、資訊不透明),而後者可能更容易解決。那麼我們該如何推進?平台應該:
通過在低風險合約上測試LLM機制來建立過往業績記錄。哪些模型表現最佳?哪些提示結構最穩健?實踐中會出現哪些故障模式?
標準化。隨著最佳實踐的湧現,業界應致力於制定標準化的LLM-提示組合,作為默認選項。這並非阻礙創新,而是有助於流動性集中在易於理解的市場中。
構建透明化工具,例如便於交易者在交易前查看完整結算機制(包括模型、提示資訊和資訊來源)的界面。結算機制不應隱藏在不起眼的細則中。
持續進行治理。即使有了人工智慧判斷,人類仍然需要做出元層面的決策:信任哪些模型、如何處理模型給出明顯錯誤答案的情況、何時更新默認設置。目標並非完全將人類排除在外,而是引導他們從臨時性的個案判斷轉向系統性的規則制定。
***
預測市場擁有幫助我們理解紛繁複雜世界的巨大潛力。但這種潛力取決於信任,而信任又取決於公平的合約解決機制。我們已經目睹了解決機制失效的後果:混亂、憤怒,以及交易者的流失。我曾親眼目睹一些人在感覺被欺騙後徹底退出預測市場,因為他們的投注結果似乎違背了他們的初衷——他們發誓不再使用之前喜愛的平台。這無疑錯失了釋放預測市場優勢和拓展其更廣泛應用的良機。
LLM模型並非完美無缺。但當它們與加密技術相結合時,便能做到透明、中立,並能抵禦困擾基於人類系統的種種操縱行為。在預測市場規模擴張速度遠超治理機制的當下,這或許正是我們所需要的。
來源:金色財經
發佈者對本文章的內容承擔全部責任
在投資加密貨幣前,請務必深入研究,理解相關風險,並謹慎評估自己的風險承受能力。不要因為短期高回報的誘惑而忽視潛在的重大損失。
暢行幣圈交易全攻略,專家駐群實戰交流
▌立即加入鉅亨買幣實戰交流 LINE 社群(點此入群)
不管是新手發問,還是老手交流,只要你想參與加密貨幣現貨交易、合約跟單、合約網格、量化交易、理財產品的投資,都歡迎入群討論學習!
上一篇
下一篇