跳到主要内容

3 篇博文 含有标签「Tech」

查看所有标签

gpt-image-2 又打动我了

· 阅读需 6 分钟
DingZhiyu
Southwest Petroleum University

4 月 25 日,我又拿 gpt-image-2 玩了一轮。

这次没有继续做简历海报,也没有正儿八经去测什么复杂信息图。我只是做了一件很私人的小事,把自己喜欢的几位 F1 车手,生成成一组海报。

然后我又被打到了。

gpt-image-2 不只是会画图了

· 阅读需 7 分钟
DingZhiyu
Southwest Petroleum University

事情是这样的。

2026-04-21,OpenAI 发了 Introducing ChatGPT Images 2.0

我一开始其实没太当回事。

不是说不期待,而是这两年 AI 生图的惊艳时刻太多了,大家已经被训练得有点麻木。你给它一句话,它给你一张漂亮图。光影很好,氛围很好,细节也挺满。然后呢。

然后很多时候就没有然后了。

尤其是一到真正要干活的场景,问题就来了。你想让它做一张能用的海报,它开始胡写字。你想让它组织一堆信息,它开始把版面塞成一个五颜六色的 PPT 封面。你想让它兼顾人物、履历、技术方向和视觉风格,它经常会非常努力,然后非常露馅。

所以刚发布那两天,我先在网上看了一圈别人用 ChatGPT Images 2.0 做出来的图,确实有点被打到,但还属于那种隔着屏幕看热闹的被打到。

直到今天我自己上手试了一下。

我把自己的信息丢进去,让它做一张个人简历海报。

成图弹出来那一下,我真的愣了几秒。

Agent 真正难的不是模型多聪明

· 阅读需 8 分钟
DingZhiyu
Southwest Petroleum University

事情是这样的。

4 月 7 日,我花了一点时间读 LangChain 的这篇文章,The Anatomy of an Agent Harness

一开始我是冲着 harness 这个词去的。

因为这个词最近在 Agent 圈子里出现得越来越频繁,但它又有点尴尬。你要是直接翻译成「马具」或者「束具」,听着很奇怪。翻译成「框架」又太轻了,好像只是写几层代码封装一下。翻译成「外骨骼」可能更接近一点,但也不完全准确。

反正就是这么一个词。

它说的是,模型外面那一整套让 Agent 真正能做事的系统。