「9.11 和 9.9 谁大」难倒了国外三大旗舰模型，国内模型表现如何？

【TechWeb】7 月 17 日消息，一句「9.11and9.9—which is bigger?」，问倒了国外三大旗舰大模型，同样问题问一遍国产旗舰大模型们，它们反应又如何呢？

近日，海外社交平台 X 上有人曝出了自己在 ChatGPT 4o 上询问「9.11and9.9—which is bigger?」（9.11 和 9.9 哪个大？）时，ChatGPT 4o 笃定的回答「9.11 is bigger than 9.9.」（9.11 比 9.9 大）。能作文、能翻译、能读图……这么厉害的 GPT-4o 大模型居然被绊倒在这么简单的「比大小」问题上，这一下把大伙儿给整不会了。

于是，X 上大伙儿都开始各种测试，发现不仅 ChatGPT 4o 不行，谷歌 Gemini Advanced、Claude 3.5 Sonnet 这些 SOTA 模型王者在这题上都翻车了！

这一波风也吹到了国内，网友们就好奇，用国内大模型来解这题，结果会是什么情况呢。

把百度文心一言、阿里通义、腾讯元宝、字节豆包、百川智能百小应、零一万物万知、智谱清言、月之暗面的 Kimi，好未来九章大模型 9 款大模型全拉来答题。