每一个平替商品的搜索技巧背后,都隐藏着一种对生活的折叠。
起因是我看到了一条帖子,讲如何通过替换搜索词,实现以更低的价格购买相同功能的商品,例如:
瑜伽垫 -> 瑜伽垫男
照片墙 -> 渔网
野餐布 -> 防水桌布
...
我试了一下,有些技巧已经失效了,有些的确便宜许多。于是我在小红书搜索「替换词」,发现许多收藏过万的帖子,它们通常是一组图片,每张图都是新/旧商品名的对照列表,如下所示:
这些对照表很好,但不好用。当我真的想搜某个商品时,我需要先对着密密麻麻的图表查找,不仅如此,当我想搜的商品不在列表里时,它就失效了。我想,能否用 AI 来实现这个任务呢?训练一个模型,用户输入想搜索的商品,模型给出便宜的平替商品名。
我很快整理了一些数据并开始训练模型,OpenAI 已经支持finetune 模型了,你只需要把数据导出并上传就可以自动开始训练,我选择的模型是gpt-3.5-1106
,训练花费了大概 10 分钟。最后,我搭建了一个网页用于模型调用,得益于开发工具的完善,我只用了一下午就完成了这个 demo 产品。
消费折叠
网页开发最快乐的部分是注册域名。很快我就选好了网址: pingti.xyz,便宜、好记。并让所有朋友都试了试,很多人都觉得好玩,虽然有些结果比较离谱(牙膏->足浴店小样, iPhone->二手 iPhone, 唇膏->蜡烛
),但有些还是蛮有用的,至少模型可以记住截图里的平替词,不必一个个找了。
仍然有一些比较差的结果,我开始思考怎么优化,这使我不得不仔细分析原始训练数据,看看模式上有什么规律。总结如下:
- 性别套利: 例如
瑜伽垫->瑜伽垫男
,或遮阳伞->雨伞男
,这背后反应的其实是男人比女人更在乎实用性和性价比,更少为了颜值、设计而买单,而设计产生了成本。
- 场景套利: 例如
马甲->老头马甲
,因为老年人更在乎价格, 女包->包包尾货
,这个不用解释, 地毯->办公室地毯, 书桌->培训桌, 椅子->婚礼用椅
,是因为在办公室、培训、举办婚礼时,通常会使用更便宜的材质吗?
- 地域套利: 例如
袜子->诸暨袜子, 耳饰->义乌耳饰
,因为中国的袜子主要来自诸暨,所以通过指定原产地可以获得更低的价格。
- 无法归类: 这一类最有意思,它们的特点是,两个商品几乎八竿子打不着,但是它们在「功能」上可以实现接近平替的效果,例如
照片墙->渔网, 相框->营业执照框, 面膜收纳->食品保鲜盒, iPad支架->菜谱架, 美甲灯->验钞灯, 乐高防尘罩->超市陈列盒
,这其中每个平替商品的搜索技巧背后,都隐藏着一种对生活的折叠,不信你可以仔细品味。
我意识到,靠简单的 finetune 模型,也许可以学会前两种套利模式,叠加规则(给商品分配相应产业的城市),也许可以学会第三种模式,但学会最后一类平替方式几乎不可能,即使是人类也需要大量的实践积累才能摸索出其中的奥妙。
郝景芳在北京折叠中讲述了不同社会阶层在空间和时间上的折叠,我觉得「商品平替」似乎是这种折叠所露出的缝隙,我回想起自己第一次购买维生素 C 的场景:在知乎上搜汤臣倍健的维生素 C 和医院有什么差别,结论是:前者比较甜。后来每次我都买东北制药维生素 C,二者价格差了 100 倍。
经济下行,每个人都在缩减开支。想象一下:未来的某一天,我坐在婚礼专用椅上、墙上挂着一张渔网,上面是我的照片,我面前的培训桌上摆着菜谱架,iPad 正在播放视频。 这个场景还蛮好笑的,但人生还要继续,无论商品怎样平替,人生是无法平替的:重要的不是渔网,而是渔网上的照片。