Kalshi是一家美国的金融交易所和预测市场平台2

期货市场 2025-10-15 09:58182未知admin

　　Kalshi是一家美国的金融交易所和预测市场平台2025年10月15日期货市场的含义【新智元导读】AI能像科幻影戏中的先知相通预测他日吗？一个名为「Prophet Arena」的全新基准测试，正通过预测切实寰宇事务来评估AI的「预言」才气。

　　以ChatGPT为代外的AI，则能够按照过去的语料来「预测下一个Token」。

　　那题目来了，AI能不行像先知相通，从全寰宇的交加音讯里寻得蛛丝马迹，凿凿地预测他日呢？

　　正在昨晚的男篮亚洲杯冠军篡夺战中，中邦男篮虽以1分之差惜败澳大利亚，但已是近十年来的最好结果！

　　信托绝大个别人都不会猜到这个比分，那么，AI能否按照中邦队此前的发挥，提前预测到呢？

　　更进一步的，AI能否像拉普拉斯妖相通，正在获取了当来世界的全体音讯后，切确预测他日的一概？

　　假如它能正在某一倏得真切宇宙中全体粒子的名望与速率，而且齐全通晓自然次序。

　　此日要先容的Prophet Arena便是一个通过及时更新的切实寰宇预测职分来评估AI体例预测智能的基准测试。

　　把市集共鸣、主动化预测、音讯整顿和社区洞察集合起来，造成更强的完全预测才气

　　为「人机配合」而生：你能够给AI供应线索，看看它的预测若何转移；AI也会把它的思量进程告诉你。

　　直面切实寰宇：AI的预测直接与切实的投注计划挂钩，发挥好的模子真的能正在虚拟市集里赚到钱。

　　Prophet Arena以及时预测市集事务为依托，初次创办了一个无法「刷题」的动态基准。

　　Prophet Arena从像Kalshi和Polymarket如此的预测市集平台挑选热门、众样且周期性的切实事务举动考题。

　　Kalshi是一家美邦的金融来往所和预测市集平台，是美邦第一个受美邦商品期货来往委员会（CFTC）羁系的、专一于来往「事务结果」的来往所

　　AI模子们运用寻求引擎，像侦探相通搜集合于某个事务的信息报道，整顿成一份精辟的「谍报简报」。同时，也会把当时的市集价钱（能够看作是集体的整体机灵）放进去。

　　拿到肖似的谍报后，每个AI模子都要提交一份精细的「预测陈说」：对全体不妨的结果给出一个概率散布，并附上长篇大论的来由，注脚己方为什么这么看。

　　事务竣事，结果揭晓。会用一套专业的目标来评估AI的预测究竟有众准，然后更新正在一个及时排行榜上。

　　排行榜厉重看两个目标：一个是权衡凿凿度和校准度的Brier分数（越高越好），另一个是模仿切实投注的均匀回报（看谁能获利）。

　　除了上述两个中枢目标外，Prophet Arena还采用了受统计学和情绪丈量筑模诱导的高级评估办法，如项目反映外面（Item Response Theory，IRT）和广义Bradley-Terry（BT）模子。

　　正在Brier分数不高（0.3-0.5分）的区间里，反而成立了很众回报率惊人的预测。

　　譬喻一场温布尔登网球赛，赛前市集广博以为选手保罗有84%的胜率，以至正在开赛前一度攀升至95%。

　　恰是这眇小的分别，让模子鄙人注时，以为押注敌手奥夫纳获胜的「性价比」更高。

　　你看，AI并没有凿凿预测到胜者，是以它的凿凿度分数（Brier分数）很平常。

　　这分析，成为一个凿凿的先觉和成为一个获利的投资者，是两种不齐全肖似的身手。

　　为了斟酌这一点，搜检了每个Brier得分区间的模子组成，每个模子用差异的颜色流露。

　　绝大无数LLM正在预测时方向于与主流音讯维持一律，因而大个别预测鸠集正在高Brier分数区间。

　　譬喻正在「AI羁系律例会正在2026年前成为联邦国法吗？」这个事务上，市集以为不妨性只要25%。

　　激进派代外Qwen3：它看到百般法案都正在促进，感觉势头很猛，直接给出了75%的超高概率。

　　守旧派代外Llama 4 Maverick：它也看到了同样的音讯，但以为立法进程杂乱又平缓，是以只给出了比市集略高一点的35%。

　　AI的预测并非随机，它们有着构造化的推理和特殊的危机偏好，就像人类专家也会有观念分别相通。

　　比方正在圣地亚哥与众伦众的美邦职业足球大同盟逐鹿中，o3-mini正在1美元的投注上得到了9美元的回报。

　　按照市集数据和信息起源，o3-mini预测众伦众获胜的概率为30%，而市集隐含的概率仅为11%（价钱=0.11）。

　　即使众伦众是不被看好的一方，但AI识别到了正的企望值，并因为其最大的上风比率30%/11%≈3。

　　它总能找到极少市集没留意到的轻细差异，然后下注正在那些「性价比」超高的选项上。

　　就像正在上面那场足球赛中，市集以为众伦众队只要11%的胜算，但o3-mini原委理解以为有30%。

　　是以，正在预测的寰宇里，告捷的症结不正在于每次都对，而正在于你对的岁月能带来众大的回报。

　　数值越低（颜色越深的单位格）流露概率推理更亲近一律；数值越高（颜色越浅的单位格）则注解分别越大。

　　此中一个越过的模子是DeepSeek R1，它的预测结果屡屡与其他模子天差地别。

　　与Kimi K2、o3和Llama 4 Maverick等模子比拟，它的L2隔断永远高于0.7，这注解其不妨采用了差异的校准体例或内部计划机制。

　　正在频谱的另一端，诸如Grok-4和GPT-5之类的模子时时作出高度一律的预测，L2隔断凡是低于0.3。

　　换句话说，这张图浮现了AI预测的众样性：有些模子造成「群体共鸣」、有些模子像「特立独行的反对者」。

　　设思，AI体例将成为预测市集的主动介入者，将人类的直觉洞察与AI强盛的数据理解才气相集合，最终擢升统统社会的整体远睹，为那些高危机的计划供应更牢靠的依照。

　　真相，假如说讲话模子的下一步是预测下一个词，那么它的终极样式，或者便是预测这个切实寰宇的下一个事务。

上一篇牛熊线期货市场占总成交额3.12% 下一篇在美国关税风暴搅动下-如何炒期货新手入门

Kalshi是一家美国的金融交易所和预测市场平台2

搜索

分类导航

最新文章

热门文章

随机文章

Kalshi是一家美国的金融交易所和预测市场平台2

相关阅读

搜索

分类导航

最新文章

热门文章

随机文章