网站地图官方微信:
网站首页 天成乡 燕子乡 更庆镇 大草乡 碗厂乡 楠杆乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | AI龙虾全民爆火,湾区上门一次收4.2万!养虾狂登热搜,华强北下场了_OpenClaw_mini_瞬间 |

    就在这种狂热氛围中,谷歌官方正式下场,在Google Workspace下发布了一款重量级命令行工具(CLI)。 在简历满天飞、噪音巨大的今天,如果只是让AI替写一份毫无亮点的求职信,然后坐等回复,那被拒绝…...

    查看详情>>
  • | 别被车企忽悠!搭载固态电池汽车到底什么时候能买:还需三到五年打磨期_技术_欧阳明_每公斤 |

  • | 拍下***、60秒“开盒”陌生人,被吹上天的AI眼镜秒变“流氓”?_Meta_数据_用户 |

  • | 王兴兴放狠话!今年机器人要跑赢博尔特,真不是吹牛?_速度_小雷_人形 |

  • | 字节领航、Kimi 爆发:红包大战落幕,AI行业变天_模型_智谱_MiniMax |

  • | 千亿不投了!英伟达突然“撤资”,黄仁勋嗅到了什么?_OpenAI_投资_公司 |

  • | 一场3D打印行业的版权危机_拓竹_模型_玛特 |

  • | 三人两会建议一览!雷军晒跟何小鹏、姚劲波合影照:妥妥的C位_科技_低空_汽车 |

  • | 三只羊没上市,但小杨哥确实急需一张“出海”的船票_公司_业务_显示 |

  • | “养龙虾”八面漏风,人类被坑惨了_OpenClaw_Skill_token |

  • | 刚封杀就反杀!Claude逆天1400亿暴击OpenAI,250万人抛弃ChatGPT_Amodei_五角大楼_收入 |

  • 德格拉夫认为,“断崖”暗示了一种全新的宇宙天体类型,她在一些论文中称这些天体为“黑洞恒星”(black hole stars)。我当然希望这是真的,因为这意味着我们发现了一种连接恒星和超大质量黑洞的新型天…...

    2026-03-18
  • 在最新的 macOS 26 系统,已经引入了 Mac 状态栏显示 iPhone 「实时活动」卡片的功能,想必未来也是在为「Mac 上岛」铺路;而「液态玻璃」界面图标留白增加、控制中心滑块变大等调整,均呈现出…...

    2026-02-26
  • 记者:广大用户非常关注工信部之前发布的“龙虾”安全风险提示,那么,在“龙虾”更新到最新版本后,是否就没有安全风险了?ClawHub是专为“龙虾”智能体用户提供技能包的社区平台,其中的技能包存在恶意***风险,…...

    2026-03-11
  • 春节红包让大家培养了用AI助手生成***、点外卖、买电影票的习惯,这波「养龙虾」热潮让人们看到了一个不仅能聊天,还能执行复杂任务的个人Agent的雏形,是在更新普通人对AI助手的认知和预期。在养龙虾的热潮影响下…...

    2026-03-16

关注我们

添加微信好友,关注最新动态