xAI Grok-2: 现已在 𝕏 上发布并集成了 FLUX.1
xAI 发布了 Grok-2 Beta^[1]^,还包含了一个 mini 型号,在推理、编程和对话能力上比 1.5 有显著提升,在 LMSYS^[2]^ 竞技场上目前排名第三。
Grok-2 具备实时信息处理能力, Grok-2 mini 则速度更快。Premium 和 Premium+ 用户可以在 𝕏 上使用这两个模型。
此外 Black Forest Labs^[3]^ 发文表示 FLUX.1 现在已经集成到 Grok-2 中了!
Anthropic Claude:现已发布 Prompt 缓存功能
就像 DeepSeek^[4]^ 之前的缓存功能,Anthropic 推出了"Prompt Caching^[5]^"(提示缓存)功能,目前还在测试阶段,需要手动开启,写入缓存比普通输入要贵 25%,但是命中缓存则价格便宜 90%,在长上下文或重复任务还是比较值的。
官方还搞了一个 Artifact^[6]^(即使用 claude 生成的应用),可以直接用来计算使用 Prompt Caching 能给你省多少钱。
这么看 DeepSeek 真的良心!写缓存都不要钱!
OpenAI 教你使用提示词威胁 ChatGPT
网友 @testingcatalog^[7]^ 扒出了 ChatGPT Mac 客户端的一个测试提示词,主要用于让 ChatGPT 在需要查看屏幕的时候,强制输出 SHARE_YOUR_SCREEN_PLEASE
关键词,以便程序调用弹窗。
重点是怎么让 GPT 需要时别忘了输出 SHARE_YOUR_SCREEN_PLEASE
, OpenAI 官方的做法就是威胁它:
You will be fired if you ask to see the user's screen without including \"SHARE_YOUR_SCREEN_PLEASE\"
如果你要求查看用户的屏幕而没有包含"SHARE_YOUR_SCREEN_PLEASE",那你就要被开除了!
公众号放不了那么长的提示词,完整提示词点阅读原文看。
谷歌 MadeByGoogle 省流总结
Made by Google^[8]^ 活动省流总结:
-
Gemini Live:类似 GPT-4o,支持语音聊天。准确的讲应该是类似 Apple Intelligence
-
Pixel 系列设备:Pixel 9、Pixel 9 Pro Fold(折叠设备)、Pixel Watch 3(手表) 和 Pixel Buds Pro 2(耳机),手机集成了 AI 摄影能力(ps:google camera 本来就挺强的)
-
Pixel Studio:基于 Imagen 3^[9]^ 模型,本地 AI 文生图应用,预装在 Pixel9 系列手机上
LongWriter:LLM 万字生成
LongWriter^[10]^ 是一个专门用于解决现有大模型很难一次输出超过 2000 字的一个项目。
项目提出了名为 AgentWrite^[11]^ 的框架,能讲超长的生成任务分解为子任务,使现有的 LLMs 能连贯生成并输出超过 20000 个单词。
此外,项目还提供了 LongWriter-6k^[12]^ 数据集和用于评估长文本生成性能的 LongBench-Write^[13]^ 和 LongWrite-Ruler 基准测试。
适用于 ComfyUI 的 ControlNeXt-SVD 节点
开源社区太顶了,昨天介绍的 ControlNeXt^[14]^ 已经有人开源了 SVD 的 Pose 节点,可以在这里下载:kijai/ComfyUI-ControlNeXt-SVD^[15]^
OpenAI 新模型 chatgpt-4o-latest 重回榜一
上周 OpenAI 打哑谜宣布了一个新模型,但是一直没说到底是啥也没解释更新了啥,今天 OpenAI 开发者官号宣布了名为 chatgpt-4o-latest
的模型,可以通过 API 调用了,并且在 LMSYS 竞技场中重回第一(此前是 Gemini 1.5 Pro Exp 0001)
文档^[16]^中的介绍说这是一个动态模型,会随着时间变化而更新改进,并且反复强调生产环境不要用这个模型。
FLUX ControlNet 合集
由 XLabs-AI 整理的 flux-controlnet-collections^[17]^,现在包括 canny、depth、hed 三个模型了,并且都提供了示例工作流,记得收藏。
都需要用到 x-flux-comfyui^[18]^ 这个节点