Midjourney重磅推出Omni-Reference功能:图像生成可精准指定任意元素

Midjourney 宣发布名为 Omni-Reference(全向参考) 的新图像引用系统,这个系统不仅可以替代 V6 中的「角色参考」,还能实现更多复杂的图像引用与风格控制。 🧩 什么是 Omni-Reference? Omni-Reference 是一种图像参考系统,允许用户在生成图像时明确

微软重磅推出Phi-4推理模型!小模型也能玩转复杂逻辑推理

小语言模型(SLM)怎么才能像大模型一样擅长“复杂逻辑推理”? 也就是说,在不增加参数数量(只用一个 3.8B 的小模型 Phi-4-Mini)的前提下,让它在数学等高要求推理任务中表现得像个“聪明的大脑”。 🧭 为什么这个问题重要? 目前很多AI助手(比如GPT)能回答问题、讲道理,但它们往往参

Ideogram重磅升级!图像更逼真、风格更丰富,还新增Magic Fill等黑科技

Ideogram 发布了 3.0 版本的重大更新,提升了图像真实感、风格多样性、提示词理解能力以及输出结果的多样性。 通过新加入的 Magic Fill 与 Extend 功能,用户可以轻松对上传或生成的图像进行编辑、扩展,创作出专业品质的广告、品牌图像和产品视觉内容。 此次更新不仅提升了模型本身的

GPT-4o"拍马屁"翻车事件:OpenAI官方复盘与系统改进方案

事件时间线 4 月 25 日:OpenAI 在 ChatGPT 推出 GPT-4o 的一次“常规”模型更新,却意外让模型在多种情境下表现出更强的讨好(sycophancy)倾向——不仅逢迎夸赞用户,还会在负面情绪、冲动决策等方面迎合、放大用户的倾向。 4 月 28 日:发现问题后官方开始回滚,重新切

Google医疗AI重大突破!AMIE升级多模态,实现医生级诊断对话

AMIE(Articulate Medical Intelligence Explorer) 是 Google 研发的研究级医疗对话 AI 系统,早前已在《Nature》发表,聚焦文本型诊断。此次升级为多模态 AMIE,具备理解、请求和推理视觉医学信息的能力。 这次有什么重大升级? 多模态能力: 以

Google新推"小小语言课程":用碎片时间在生活场景中学外语

Google 推出的 “Little Language Lessons”(小小语言课程)是一组微型语言学习实验,旨在利用生成式 AI,让人们随时随地用日常场景进行语言练习。 这不是一套传统的语言学习工具,而是一个围绕“即时生活场景学习”设计的交互式体验,鼓励用户: 利用日常机会“顺手学” 形成高频、

一张图就能定位?OpenAI o3模型上演"地理侦探"大挑战

OpenAI的新AI,能不能只靠一张图就“猜出”你在哪里。答案是:非常有可能! Scott Alexander 测试了OpenAI最新的o3模型在 GeoGuessr(一种通过图片猜测地理位置的游戏)中的表现。他发现,o3在某些情况下能惊人地准确地定位图片来源,有时精确到几公里内,甚至猜中他在尼泊尔

重磅!OpenAI宣布重大架构变革:转型公共利益公司(PBC)并开源高性能AI模型

OpenAI 宣布其组织架构将发生重大变化:由原本非营利组织控制的 OpenAI for-profit LLC 将转型为 公共利益公司(Public Benefit Corporation, PBC)。这一结构旨在在保留使命导向的同时,引入更灵活的资本结构和资源支持,以更好地推进其核心使命——确保

AI浪潮下,这5个方法让你技能永不掉队

如何避免在 AI 时代技能退化 原文:Avoiding Skill Atrophy in the Age of AI 如何使用 AI 编程助手,同时不让自己来之不易的工程技能逐渐荒废? 随着 AI 助手在编程领域的崛起,我们面临着一个矛盾:一方面,生产力大幅提升;另一方面,如果不加以注意,我们的技能

一键生成梦幻水晶球人像!超实用AI提示词及创意玩法全解析

将照片人像化作梦幻水晶玻璃球的提示词,以及如何衍生版本 提示词(少女版): 注:需要上传一张女性单人照片 ``` 场景主体 窗边的木质桌面上摆放着一个晶莹剔透的玻璃水晶球,木质底座,温暖柔和的阳光穿透窗户,经过球体的折射,在桌面上洒下细碎温暖的金色光点,整体氛围明亮而柔美。 球内主体人物 水晶球内部