AI大语言模型幻觉指数排名:Gemini 2.0 Flash幻觉程度最低

近日,Vectara 发布了一份名为 “幻觉排行榜” 的报告,比较了不同大型语言模型(LLM)在总结短文档时产生幻觉的表现。这份排行榜利用了 Vectara 的 Hughes 幻觉评估模型(HHEM-2.1),该模型定期更新,旨在评估这些模型在摘要中引入虚假信息的频率。根据最新数据,报告指出了一系列

Rabbit亮相全新AI代理功能:涵盖游戏下载至智能管理购物清单

日前,Rabbit 公司发布了一篇博文和一段视频,展示了其 “多面手 Android 代理” 的功能。该代理能够在 Android 平板电脑上控制应用程序,表现出其在一年前所承诺的 Rabbit R1设备所缺乏的能力。虽然 Humane AI Pin 已经遭遇了挫折,但 Rabbit 似乎仍在努力前

DeepSeek大模型助力多地政务服务系统 效率显著提升

随着人工智能技术的迅速发展,越来越多的地方政府开始将 AI 引入政务服务,试图通过智能化手段提升服务质量和效率。近期,北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手,标志着 AI 在政务领域的应用迈出了重要一步。 在北京经济技术开发区,新的智能政务小助手经过多家

全面革新!Crunchbase 利用 AI 预测创业成功率,精准度达 95%!

Crunchbase 宣布将放弃其历史数据提供者的角色,转型为一款人工智能(AI)驱动的预测引擎。这一新平台将能够以高达95% 的准确率预测创业公司的融资轮次、收购和成长轨迹,标志着 Crunchbase 的战略发生了重大转变。 Crunchbase 的首席执行官贾格・麦康奈尔在接受采访时表示,传统

DeepSeek澄清融资传言 知情人士指"消息失实"

2024年2月20日,针对市场流传的"AI公司DeepSeek正筹备首次公开融资"消息,《科创板日报》报道,相关传闻均为不实信息,"融资事宜纯属谣言"。 近期,随着生成式AI赛道持续升温,多家中国AI初创企业频传融资动态。月之暗面、Minimax等公司接连传出超10亿美元估值融资消息,引发市场对AI

微软发布多模态AI模型Magma:融合视觉、语言及动作决策能力

近日,微软研究团队联合多所高校的研究人员,发布了一款名为 “Magma” 的多模态 AI 模型。这款模型的设计旨在处理和整合图像、文本和视频等多种数据类型,以便在数字和物理环境中执行复杂任务。随着科技的不断进步,多模态 AI 代理正在被广泛应用于机器人技术、虚拟助手和用户界面自动化等领域。 以往的

Xbox推出全新AI模型Muse,助力游戏开发者高效打造游戏元素

正文:微软近日宣布推出其新的生成性人工智能模型 Muse,进一步加大在游戏领域的 AI 应用。“Muse” 是由微软研究院与 Xbox Game Studios 的 Ninja Theory 团队合作开发的,这一模型专门针对 Ninja Theory 的多人战斗竞技游戏《Bleeding Edge》

Codeium AI编程初创企业启动新一轮融资,估值达28.5亿美元

近期,AI 编程初创公司 Codeium 正在进行新一轮融资,估值接近28.5亿美元。据知情人士透露,此轮融资由投资机构 Kleiner Perkins 领投,时隔六个月,Codeium 又一次吸引了投资者的关注。 值得注意的是,在刚刚过去的六个月中,Codeium 完成了一轮1.5亿美元的 C 轮

紧急预警!马斯克AI力作Grok 3现重大安全缺陷,黑客轻易掌控风险!

AI 安全公司 Adversa AI 发布了一项令人震惊的报告,称埃隆・马斯克的创业公司 xAI 刚发布的 Grok3模型在网络安全方面存在重大漏洞。Adversa 的研究团队发现,这款最新的 AI 模型容易受到 “简单的越狱攻击”,这可能使不法分子能够获取诸如 “如何诱骗儿童、处理尸体、提取 DM

Mistral AI助手Le Chat两周下载量激增至百万

在人工智能领域,Mistral 最近发布的 AI 助手 Le Chat 引起了广泛关注。仅仅在上线两周后,该应用便达成了令人瞩目的成就 —— 下载量突破了100万次。这一成果不仅在其发源地法国引发热潮,更在 iOS 应用商店中迅速攀升至免费应用下载榜首。 法国总统埃马纽埃尔・马克龙在最近的电视采访中