组讯 | 红杉中国正式开源AI基准测试xbench评测集

多人 ☉ 文 来源:多处
2025-06-18 @ 哈希力量文库

文库划重点:用户在电脑版选择DeepSeek模型并关闭深度思考后,输入“@AI编程”后,即可通过双栏界面,在左侧对话生成代码,右侧实时展示并支持预览运行,编程效率显著提升。目前,该功能现已在元宝电脑版2.25版本上线。


红杉中国正式开源AI基准测试xbench评测集a16哈希力量 | 通用人工智能文库

界面新闻 4小时前a16哈希力量 | 通用人工智能文库

6月18日,红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国表示,未来将基于大模型和AI Agent的发展情况不断动态更新评测集,并且采用“黑白盒”机制,既保证xbench的发展可以服务更多的大模型和Agent开发者,同时尽力避免静态评测集经常出现的过拟合问题,确保xbench的长期有效。a16哈希力量 | 通用人工智能文库

 a16哈希力量 | 通用人工智能文库

腾讯元宝更新:支持双栏AI编程,可直接预览运行a16哈希力量 | 通用人工智能文库

36氪 2025-06-17 16:29a16哈希力量 | 通用人工智能文库

6月17日,腾讯元宝发布更新,上线AI编程模式。用户在电脑版选择DeepSeek模型并关闭深度思考后,输入“@AI编程”后,即可通过双栏界面,在左侧对话生成代码,右侧实时展示并支持预览运行,编程效率显著提升。目前,该功能现已在元宝电脑版2.25版本上线。a16哈希力量 | 通用人工智能文库



哈希力量文库收录,手机端省略本文网址