模型照妖镜
Model Authenticity Probe
模型照妖镜
检测 Claude / GPT 模型功能完整性
基础检测
Benchmark
测试记录
反馈
API 配置
安全提示:
请使用临时 API Key 进行测试。
API Baseurl
可用
API Key
选择模型
全选
中止
检测
准备测试...
正在初始化...
0 / 0
0
可用
0
不可用
0
总计
保存检测快照
安全验证
输入图中的数字以继续
取消
验证
功能测试中
深度能力测试尚未开放
敬请期待
测试模型
请先配置 API 地址并填写密钥
中止
开始深度测试
准备深度测试...
正在初始化...
准备中...
0
输入
0
输出
0
t/s
—
平均 t/s
0
输入 tokens
0
输出 tokens
0s
已用时
重试日志
测试结果总览
—
用户评分
0
通过
0
失败
0
总题数
⚠
API 不稳定 · 测试不完整
部分题目未成功完成,评分结果不可靠
修复测试
BENCHMARK SCORE
—
满分
0
—
平均 t/s
—
输入 tokens
—
输出 tokens
—
总耗时
测试结果:
复制
保存深度测试快照
我的测试记录
基于浏览器 Cookie 记录,清除 Cookie 后记录将丢失
暂无测试记录
提交反馈
您的反馈将帮助我们改进服务,提交前需完成验证码验证
提交反馈
我的反馈记录
基于浏览器 Cookie 记录,清除 Cookie 后记录将丢失
暂无反馈记录
测试完成
部分题目已自动评分,需要手动评分的题目
请参照对照组逐题打分
★★★★★
开始评分