申请认证
格隆汇公众号矩阵
格隆汇App
下载格隆汇APP
诊股宝App
下载诊股宝App
汇路演App
下载汇路演APP
极调研
加入我们
首页
社区
快讯
事件
主题
专栏
行情
会员
数据
财富圈
文章
更多相关文章
快讯
更多相关快讯
查看全部股票/文章/快讯/事件/用户/财富圈搜索结果
热门股票
搜索历史
清空历史
切换
登录 / 注册
跟大家分享一下你的想法吧
首页
>
快讯
>
快讯详情
红杉中国正式开源AI基准测试xbench评测集
2025-06-18
格隆汇6月18日|6月18日,红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国表示,未来将基于大模型和AI Agent的发展情况不断动态更新评测集,并且采用“黑白盒”机制,既保证xbench的发展可以服务更多的大模型和Agent开发者,同时尽力避免静态评测集经常出现的过拟合问题,确保xbench的长期有效。
事件播报
查看更多
新莱福(301323.SZ):目前未有军工资质
公司信息
2分钟前
新莱福(301323.SZ):连体式防核辐射服可应用于核电、核工业及核辐射的应急防护
公司信息
3分钟前
奥克股份(300082.SZ):未涉及稳定币相关业务
公司信息
3分钟前