gpt-image-2 又打动我了
4 月 25 日,我又拿 gpt-image-2 玩了一轮。
这次没有继续做简历海报,也没有正儿八经去测什么复杂信息图。我只是做了一件很私人的小事,把自己喜欢的几位 F1 车手,生成成一组海报。
然后我又被打到了。
4 月 25 日,我又拿 gpt-image-2 玩了一轮。
这次没有继续做简历海报,也没有正儿八经去测什么复杂信息图。我只是做了一件很私人的小事,把自己喜欢的几位 F1 车手,生成成一组海报。
然后我又被打到了。
事情是这样的。
2026-04-21,OpenAI 发了 Introducing ChatGPT Images 2.0。
我一开始其实没太当回事。
不是说不期待,而是这两年 AI 生图的惊艳时刻太多了,大家已经被训练得有点麻木。你给它一句话,它给你一张漂亮图。光影很好,氛围很好,细节也挺满。然后呢。
然后很多时候就没有然后了。
尤其是一到真正要干活的场景,问题就来了。你想让它做一张能用的海报,它开始胡写字。你想让它组织一堆信息,它开始把版面塞成一个五颜六色 的 PPT 封面。你想让它兼顾人物、履历、技术方向和视觉风格,它经常会非常努力,然后非常露馅。
所以刚发布那两天,我先在网上看了一圈别人用 ChatGPT Images 2.0 做出来的图,确实有点被打到,但还属于那种隔着屏幕看热闹的被打到。
直到今天我自己上手试了一下。
我把自己的信息丢进去,让它做一张个人简历海报。
成图弹出来那一下,我真的愣了几秒。
事情是这样的。
4 月 7 日,我花了一点时间读 LangChain 的这篇文章,The Anatomy of an Agent Harness。
一开始我是冲着 harness 这个词去的。
因为这个词最近在 Agent 圈子里出现得越来越频繁,但它又有点尴尬。你要是直接翻译成「马具」或者「束具」,听着很奇怪。翻译成「框架」又太轻了,好像只是写几层代码封装一下。翻译成「外骨骼」可能更接近一点,但也不完全准确。
反正就是这么一个词。
它说的是,模型外面那一整套让 Agent 真正能做事的系统。