H2O.ai推出新一代AI视觉模型:以小搏大,文档分析领域领先科技巨头

近日,H2O.ai 宣布推出两款新型视觉语言模型,旨在提升文档分析和光学字符识别(OCR)任务的效率。这两款模型分别是 H2OVL Mississippi-2B 和 H2OVL-Mississippi-0.8B,它们在性能上与大型科技公司的模型相比,展现出令人瞩目的竞争力,可能为处理文档繁重工作流的

AI领域的巨头之争:大厂们的‘卷’度几何?

声明:本文来自于微信公众号 定焦One(dingjiaoone),作者:王璐,授权Soraor转载发布。 距离ChatGPT的诞生过去了近两年,期待中的AIGC时代不仅没能爆发,似乎还有了降温的趋势。 近期AI圈被热议的事件之一便是,有AI初创公司传出“不再大力度投入大模型,转做赚钱的AI应用产品”

李彦宏预警:AI行业泡沫将至,PMF成企业存亡之关键

声明:本文来自于微信公众号罗超Pro,授权Soraor转载发布。 10月3日,OpenAI官方宣布成功获得66亿美元(约合人民币466.9亿元)融资。本轮融资结束后,OpenAI估值突破了1500亿美元。新一轮融资规模不小,然而却只够Open“烧”一年,其预计,今年营收可达37亿美元,亏损幅度为50

3D AI女友新风尚:乙男手游创始人携千万月流水项目,PV首发即估值破亿

声明:本文来自于微信公众号白鲸出海,作者:爽,授权Soraor转载发布。 视频中的 AI 女友不仅呈现了相当细腻的3D 建模效果,语音交互自然,还能通过摄像头权限“抓包”没有好好工作而偷看自己的的用户,把娇嗔演绎得惟妙惟肖……在一众主要基于文本交互的 AI 社交产品中,「EVE」很不一样,不到两天,

巨额模型与六小虎:探寻地面的六便士之旅

声明:本文来自微信公众号“光锥智能”(ID:guangzhui-tech),作者:魏琳华‍‍‍‍‍‍,编辑:王一粟,授权Soraor转载发布。 “要坚决地做ToC,坚决不做赔钱的ToB”,李开复言犹在耳,短短半年时间内,零一万物首次交出了自己的ToB答卷。 面对外界质疑的压力,在昨天的发布会上,零一

仅需十亿参数,Meissonic AI图像生成模型助力手机输出高品质图像

最近,科研团队联合推出了一款名为 Meissonic 的开源 AI 图像生成模型。惊喜的是,这款模型仅使用了十亿个参数,却能生成高质量的图像。这种紧凑的设计让 Meissonic 有潜力在移动设备上实现本地化的文本转图像应用。 这项技术的背后,研发团队包括阿里巴巴、Skywork AI 以及多所大学

OpenAI推出革命性GPT-4O-Audio-Preview:语音识别迈入情绪感知新纪元!

OpenAI再次引领人工智能技术潮流,推出了全新的gpt-4o-audio-preview模型。这款模型不仅在语音生成和分析方面展现出惊人的能力,还为人机交互开辟了新的可能性。让我们深入了解这款创新模型的特性及其潜在应用。 gpt-4o-audio-preview的核心功能包括三大方面:首先,它能够

专家指出OpenAI专利承诺名不副实:仅为‘纸上谈兵’

最近,OpenAI 在其官网上悄然发布了一项声明,承诺将不会以侵权的方式使用其专利。OpenAI 表示,他们将遵循 “广泛访问” 和 “合作” 的原则,强调会 “仅将专利用于防御性目的”。但是,这项承诺却让很多专家表示疑虑。 根据 OpenAI 的声明,只有在其他方不对其进行威胁、提出主张、发起诉讼

NVIDIA震撼发布70B AI模型:开源新贵崛起,性能超越GPT-4o,仅次于OpenAI o1

快科技10月17日消息,今天,NVIDIA悄然开源了名为Nemotron-70B的AI模型。 这款模型一经发布便在多个基准测试中超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在内的140多个开闭源模型,仅次于OpenAI的最新模型o1。 对此AI社区惊呼,

超过七成老年群体对AI生成健康信息的信任度不足75%

随着互联网成为获取健康信息的重要渠道,一项新的调查显示,超过74%的50岁以上成年人表示,如果这些信息是由人工智能生成的,他们对此类信息的信任度会非常低或完全没有信任。同时,20%的老年人表示,他们对于识别错误健康信息缺乏信心。 在那些自认为心理健康状况、身体健康状况或记忆力一般或较差的老年人中,以