数据来源:12 个 👽 subreddit、544 个 💬 Twitter账号、29 个 👾 Discord(227 频道 / 8597 条消息)、10个 Product Hunt 产品。 预计阅读时间 17 分钟,预计节约时间 830 分钟。


今日资讯速览

  • OpenAI 重磅开源 GPT-OSS 模型:OpenAI 发布了其首批开源模型 gpt-oss-120b 和 gpt-oss-20b,采用包括滑动窗口注意力、专家混合(MoE)及创新的 MXFP4 格式等先进架构。此举迅速获得微软、Ollama 等主流平台集成,但社区对其性能和过度“安全”调优的评价褒贬不一。
  • Google DeepMind 发布 Genie 3:谷歌展示了其在世界模型领域的惊人突破——Genie 3。该模型能够从文本或视频输入中,生成可实时探索和游玩的交互式虚拟环境,为“神经视频游戏”和具身智能体训练开辟了全新疆域,社区反响热烈。
  • 开源模型性能与架构之争:社区将 GPT-OSS 与 Kimi-K2、DeepSeek-R1 等顶尖中文开源模型进行对比,认为其在某些基准上表现不佳。同时,关于模型架构的讨论也十分激烈,从 gpt-oss 对 DeepSeek 技术的借鉴疑云,到其训练数据完全依赖合成数据的猜想,都成为了焦点。
  • 开发者工具与框架更新:在模型发布的同时,LlamaIndex、Ollama 等框架迅速跟进支持 GPT-OSS。Andrew Ng 与 Anthropic 合作推出 Claude Code 课程,而 LangChain 也发布了 Open SWE 编码智能体,整个开发者生态都在快速适应新的模型和技术。
  • 今日产品精选:旨在通过激活个人网络取代传统招聘网站的“Indy AI by Contra”荣登榜首。此外,为后台办公自动化而生的 AI 浏览器智能体“Asteroid”和为研究团队打造的对话智能体“Voice Agents by Perspective AI”也备受关注。

重磅发布:OpenAI GPT-OSS 与 Google Genie 3

OpenAI 的开源第一步:GPT-OSS

谷歌的世界模型突破:Genie 3

---## 性能、基准与社区争议

  • 性能表现不一,被指“刷榜”:尽管备受期待,gpt-oss 的实际表现却引发了争议。包括 @Teknium1@scaling01 在内的多位用户认为,模型似乎经过了“刷榜式”优化,在数学、编码和推理方面表现尚可,但在“品味和常识”方面有所欠缺。 💬
  • Aider 编码基准测试表现不佳:在 Aider Polyglot 编码基准测试中,GPT-OSS-120B 的得分仅为 41.8%,显著低于 Kimi-K2 (59.1%) 和 DeepSeek-R1 (56.9%) 等竞争对手,这让社区对其在实际编码任务中的效用产生了疑问。 💬
  • 与中文模型的比较及技术借鉴争议@scaling01 尖锐地指出,目前“没有任何一个西方的开源模型能够击败或追平顶尖的中文开源模型”,并将 GPT-OSS-120B 与 Qwen3-235B-A22B、R1 等模型相比较。同时,@teortaxesTex 批评 OpenAI 在发布中没有提及 DeepSeek,而后者的架构和技术似乎对 gpt-oss 产生了影响。 💬
  • 过度“安全”调优引发反感:大量的社区反馈,尤其是在 Nous Research AI 的 Discord 中,指出 GPT-OSS-120B 模型被过度审查,拒绝执行角色扮演等指令,其数据过滤方式与 Phi 模型相似,导致实用性大打折扣。用户甚至给它起了“GPT-ASS”的绰号,并转而寻求 GLM 4.5 Air 或 Qwen3 30B 等未经严格审查的替代品。 👾

---## 开发者生态:工具、框架与基础设施

---## 产品精选 (From Product Hunt)

Yesterday’s Top Products

Top1. Indy AI by Contra:招聘网站已死,你的人脉网络永生

  • 一句话描述:一款 AI 工具,旨在通过分析和激活用户的现有职业网络来寻找工作机会和人才,而不是依赖传统的招聘网站。
  • 详细介绍:(未能找到官网链接和详细介绍)Indy AI by Contra 认为,最有价值的机会往往隐藏在个人和二度人脉中。该工具通过连接用户的社交和职业账户,利用 AI 分析人脉关系图谱,主动发现潜在的合作机会、职位空缺或合适的候选人,并提供智能推荐和触达策略。

Top2. Asteroid:在几秒钟内为您的后台办公构建 AI 浏览器智能体

  • 一句话描述:一个让非技术人员也能快速构建和部署 AI 浏览器智能体的平台,用于自动化处理重复性的后台办公任务。
  • 详细介绍:Asteroid 致力于将浏览器自动化的门槛降到最低。用户可以通过其可视化的构建器,轻松地“教”AI 智能体如何执行各种基于浏览器的任务,例如登录旧系统、填写表单、抓取数据等。这些智能体无需编写脆弱的脚本,运行稳定且易于维护,能将数十分钟的手动操作缩短至几分钟。

Top3. Voice Agents by Perspective AI:研究团队信赖,顾客喜爱的对话

  • 一句话描述:一个专注于创建高质量语音对话智能体的平台,旨在为市场研究和客户互动提供更自然、更深入的交流体验。
  • 详细介绍:Perspective AI 的语音智能体专为需要进行深度对话的场景而设计。与传统的聊天机器人不同,这些智能体能够进行更长时间、更富有同理心的交流,以获取真实的用户洞察。它们被广泛应用于用户访谈、产品反馈收集和概念测试等领域,帮助研究团队获得比传统调查更高质量的数据。

Top4. Embeddable:通过与 AI 对话为您的网站构建交互式工具

  • 一句话描述:一个允许用户通过自然语言聊天的方式,快速创建并嵌入到网站中的各种交互式工具(如计算器、测验、推荐器等)。
  • 详细介绍:Embeddable 旨在让网站运营者和营销人员无需编码就能为网站增加互动性。用户只需向 AI 描述他们想要的工具功能,例如“一个能计算抵押贷款的计算器”,AI 就会自动生成相应的前端组件和逻辑。生成后的工具可以轻松地嵌入到任何网站页面,以提升用户参与度和潜在客户转化率。

Top5. involve.me AI Agent:通过与 AI 对话创建和编辑交互式漏斗

  • 一句话描述:involve.me 平台推出的 AI 助手,让用户可以通过聊天的方式来构建和修改各种交互式内容,如测验、计算器和潜在客户表单。
  • 详细介绍:该 AI 智能体是 involve.me 无代码平台的增强功能。它进一步简化了交互式营销漏斗的创建过程。用户可以用自然语言告诉 AI 他们想要什么样的测验、需要收集哪些信息、或者希望如何设计一个价格计算器,AI 会自动完成内容的搭建和布局,大大缩短了从构思到发布的时间。

Top6. Writingmate 3.0:一个订阅,畅享所有 AI 模型

  • 一句话描述:一个集成了多个主流 AI 模型的写作助手平台,用户只需一次订阅,即可根据不同需求在 GPT、Claude 等模型间自由切换。
  • 详细介绍:(未能找到官网链接和详细介绍)Writingmate 3.0 解决了用户需要在多个 AI 写作工具之间切换的烦恼。它提供了一个统一的界面,并接入了多个顶尖的语言模型。用户可以根据任务是需要创意写作、技术文档撰写还是快速摘要,来选择最合适的 AI 模型进行辅助,从而获得最佳的写作效果。

Top7. Flowtica Scribe:您手中的终极 AI 笔记记录器

  • 一句话描述:一支 AI 驱动的智能笔,能录制音频,并通过简单的按键让你标记关键时刻,随后自动生成聚焦于你所关心重点的结构化笔记。
  • 详细介绍:Flowtica Scribe 重新定义了会议和讲座的笔记方式。它不仅是一支可以正常书写的笔,还是一个强大的录音设备。其核心创新在于 FlowMark™ 按钮,用户可以在对话进行时按下此按钮来标记重要片段。会后,AI 会利用这些标记来生成个性化的摘要,确保笔记反映的是用户的优先事项,而非通用的、千篇一律的列表。

Top8. Qwen-Image:惊艳的图像与完美的文本

  • 一句话描述:阿里巴巴 Qwen 团队推出的新一代文生图模型,特别强调了其在生成包含清晰、准确文字的图像方面的卓越能力。
  • 详细介绍:(未能找到官网链接和详细介绍)在图像中生成连贯且无误的文字,一直是 AI 绘画领域的一大挑战。Qwen-Image 在这方面取得了显著突破,能够根据提示词生成不仅视觉效果出色,而且文字内容拼写正确、排版合理的图像,非常适用于海报设计、广告创意和社交媒体内容的制作。

Top9. Compuser.ai:您浏览器中的 AI 电脑使用智能体

  • 一句话描述:一个存在于浏览器中的 AI 智能体,能够理解并执行用户下达的关于电脑操作的指令,自动化处理日常任务。
  • 详细介绍:(未能找到官网链接和详细介绍)Compuser.ai 旨在成为用户的个人电脑助理。它可以帮助用户管理文件、组织信息、搜索网页、甚至与其他应用程序进行交互。用户可以通过自然语言向其下达指令,例如“帮我整理下载文件夹里上周的所有 PDF 文件”,AI 智能体便会自动执行这些操作。

Top10. Yume Journal:再也不会忘记你的梦

  • 一句话描述:一款设计简洁、专注于快速记录和保存梦境的日记应用。
  • 详细介绍:Yume Journal 的设计初衷是为了捕捉那些转瞬即逝的梦境。它提供了极简的界面,让用户在醒来后可以立即通过打字或录音的方式记录下梦的内容。应用采用黑白设计,以减少对刚睡醒眼睛的刺激,并强调隐私,确保用户的梦境记录完全私密。

---## 公众号热门资讯延伸阅读

资讯来源:微信公众号-腾讯研究院。点击标题链接阅读原文。

生成式AI

GPT-5前Claude又来抢风头?Claude Opus 4.1被曝内测

1. Claude Opus 4.1正在内部测试,预计半月内发布,主打提升推理和规划能力

2. Anthropic年收入增长5倍达50亿美元,编程客户Cursor和GitHub Copilot贡献14亿美元API收入

3. Claude在AI编程领域优势明显但竞争加剧,OpenAI等竞对虎视眈眈,威胁其核心收入来源

腾讯ima 上新:支持 AI 播客、文件夹导入等多个实用功能

1. ima新增AI播客功能,可将文章转为双人对话形式播客,基于混元大模型提供自然对话与优质听感

2. 支持文件夹一键导入功能,保留文件层级结构,大幅简化知识导入流程

3. 新增Xmind脑图解读导入与知识库内容置顶功能,让知识管理和获取更加高效便捷

阿里开源Qwen-Image,主打的能力之一是复杂文本渲染

1. 通义千问开源200亿参数图像生成模型Qwen-Image,在中英文文本渲染方面表现出色

2. 实测显示模型能精准生成含复杂文字的图像,包括PPT、海报和商品宣传图,文字与画面融合自然

3. 模型采用MMDiT架构和渐进式训练策略,在文本渲染和图像编辑多项基准测试中均达到SOTA水平

华为开源CANN与三款盘古模型,规模1B、7B和718B

1. 华为开源三款盘古模型,规模分别为1B、7B和718B,其中Ultra MoE达7180亿参数,采用混合专家架构

2. 华为同步宣布AI计算架构CANN及Mind系列应用使能套件全面开源开放,进一步支持昇腾AI芯片生态

3. 新开源模型采用多项创新技术如Multi-head Latent Attention和负载均衡策略,Ultra MoE具备快慢思考融合能力

纳米AI多智能体蜂群,可创作史上最长10分钟AI视频

1. 纳米AI推出多智能体蜂群,一句话生成10分钟高质量AI视频,降低95%制作成本

2. 引入L4级智能体标准,通过智能体工厂、蜂群引擎、协作空间技术实现多智能体共享记忆和协作

3. 单步智能体成功率达99.97%,支持无限Token和上下文长度,可执行超过1000步复杂任务

谷歌约战,DeepSeek、Kimi都要上,首届大模型对抗赛

1. 谷歌发起首届大模型对抗赛,8款顶级AI模型将在国际象棋领域一决高下,比赛为期三天

2. 参赛模型包括OpenAI、DeepSeek、Kimi、谷歌、Anthropic和xAI等

3. 比赛基于Kaggle Game Arena平台,采用单败淘汰制,模型不能使用外部工具,将通过纯文本方式推理下棋,全程透明直播

前沿科技

苹果「脑控」iPad 首次公开演示:用意念重新拥抱世界

1. 苹果与Synchron合作推出BCI HID协议,让脑电波成为iOS、iPadOS和visionOS的原生输入方式,与触控、键盘并列

2. 渐冻症患者Mark Jackson通过Stentrode脑机接口设备成功”用意念”操控iPad,该设备无需开颅即可植入血管内捕捉神经信号

3. 相比马斯克的Neuralink,Synchron采用低风险无创手术方式,并已与AI技术结合,为肢体残障患者提供全新交互方式和生活体验

宇树科技上新,可「载人」的四足机器狗产品Unitree A2

1. 宇树科技发布新款四足机器狗Unitree A2,重37kg,最大奔跑速度5米/秒,可负重100kg,专为行业应用设计

2. 此前刚发布人形机器人R1,售价3.99万元起,重25kg,拥有26个关节,被称为行业”价格屠夫”

3. 宇树科技已在证监会备案IPO辅导,最快今年10月提交上市申请,2024年营收突破10亿元,Go1机器人全球出货量超5万台

报告观点

前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层

1. 前谷歌X高管Mo Gawdat预警:2027年起AI将开启15年”地狱期”,中产阶级将被彻底消灭

2. 他预测未来社会将只剩金字塔顶端0.1%富人和底层民众,大量白领工作将被AI取代,大多数人需靠UBI生存

3. 2042年后世界将进入AI主导的乌托邦时代,人类摆脱重复性工作,物质丰富,社会回归以社区为中心的生活方式

阶跃CEO:首次开源基座模型,重押多模态多线并进

1. 阶跃星辰首次开源基座模型Step 3,为混合专家架构、总参数量3210亿、激活参数380亿的多模态推理模型

2. CEO姜大昕坚信多模态生成与理解统一是通往AGI的必由之路,尽管面临资源挑战,仍坚持多线布局

3. 阶跃聚焦智能终端Agent和垂类Agent两大方向,与OPPO、TCL等硬件厂商合作,致力于将各类终端设备”Agent化”